英特爾推出自然語言處理開源庫,代號“NLP Architect”
成立一年的英特爾AI Lab最近又有新動(dòng)作。
幾天前,英特爾宣布推出開源庫NLP Architect——這是一個(gè)用于自然語言處理(NLP)的庫,幫助開發(fā)人員為聊天機(jī)器人和虛擬助手等會(huì)話應(yīng)用提供所必需的功能,比如名稱實(shí)體識別,意圖提取和語義分析等,幫助智能體從對話中理解人類的行動(dòng)。
推特網(wǎng)紅(((λ()(λ() ‘yoav))))評論說,“這個(gè)開源庫提醒了我們,對于NLP中的許多用例(特別是當(dāng)輸出空間很小的時(shí)候),用基于CPU的DyNet網(wǎng)絡(luò)比在GPU上更有效”。
這到底是個(gè)怎樣畫風(fēng)的開源庫?
NLP Architect概覽
在當(dāng)前版本的NLP Architect中,研究人員從研究角度和實(shí)際應(yīng)用兩個(gè)方向,賦予了它一些有趣的特性。包括:
-
NLP核心模型,它能對NLP工作流的語言特性進(jìn)行魯棒性語音特征的提取,例如依存句法分析器(BIST)和NP chunker。
-
性能最佳的NLU模塊,例如,意圖提取(IE)和命名實(shí)體識別(NER)
-
處理語義理解的模塊:例如colocations,NP嵌入表示(例如NP2V)等
-
用于會(huì)話人工智能的組件:聊天機(jī)器人應(yīng)用程序就是恰當(dāng)?shù)睦樱▽υ捒蛳到y(tǒng)、序列組塊和IE
-
使用新拓?fù)浣Y(jié)構(gòu)的的端到端DL應(yīng)用程序:比如Q&A和機(jī)器閱讀理解等
NLP Architect提供了上述所有模型的訓(xùn)練和推理的端到端示例,還包括在部署這些模型時(shí)經(jīng)常用到的功能,比如數(shù)據(jù)pipeline、公共功能的調(diào)用和與NLP相關(guān)的實(shí)用工具。
研究人員還介紹說,NLP Architect是模塊化的結(jié)構(gòu),易于集成。
△ 模塊化的NLP Architect
這個(gè)開放而靈活的NLP組件庫為英特爾提供了與合作伙伴啟用NLP解決方案的基礎(chǔ),此外,NLP Architect還提供了針對NLP工作負(fù)載的英特爾軟件和硬件的分析和優(yōu)化的平臺。其中一些組件,還提供了預(yù)訓(xùn)練模型。
對了,這個(gè)存儲(chǔ)庫中使用了以下幾個(gè)開源的深度學(xué)習(xí)框架:
-
Intel neon
-
Intel Nervana graph
-
Tensorflow
-
Intel-Optimized TensorFlow
-
Keras
-
Dynet
可抱走的資料
開發(fā)人員可以從NLP Architect GitHub存儲(chǔ)庫中下載代碼,并按照指示安裝。在項(xiàng)目主頁中可以找到所有核心模塊和端到端示例的文檔。
英特爾官方博客:
https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/
NLP Architect項(xiàng)目首頁:
http://nlp_architect.nervanasys.com/
代碼地址:
https://github.com/NervanaSystems/nlp-architect