牽起認知智能走向產(chǎn)業(yè)深處 WAIC百度披露語言與知識技術全布局
語言是機器與人類連接的重要路徑,知識是機器深入了解現(xiàn)實世界的必需品。8月31日,2019世界人工智能大會·開發(fā)者日在上海舉辦,會上,百度AI技術平臺體系執(zhí)行總監(jiān)吳甜受邀出席并揭秘了百度語言與知識技術在AI產(chǎn)業(yè)化方面的全新進展及突破。
吳甜表示,“自然語言理解是人工智能領域頗具挑戰(zhàn)性的問題之一。在面對產(chǎn)業(yè)開發(fā)者的技術攻克中,我們應重視實際場景中問題的沉淀與總結,并在需求中不斷精進技術,以創(chuàng)新遇見未來。”
搭建語言與知識技術平臺全景 精準擊中產(chǎn)業(yè)需求
在演講開頭,吳甜就為到場來賓展示了百度AI同傳和百度地圖語音互動的實際案例,并表示1964年《機器翻譯淺說》中暢想的未來已實現(xiàn),不管臺上是什么國家的演講者,臺下的人都可以從耳機里聽到自己的母語。百度在語言與知識技術領域帶來的驚喜遠不止這些,目前百度語言與知識技術以布局智能搜索、深度問答、對話系統(tǒng)、智能寫作、機器翻譯等多場景,讓用戶在日常使用中就可以感受到語言與知識技術帶來的便利。
如今,產(chǎn)業(yè)開發(fā)者需要的不再是單點技術,他們需要優(yōu)異的應用效果、高效的研發(fā)效能、靈活的服務部署,能將AI技術切實落地于相應的場景的有效路徑,這與百度大腦語言與知識技術平臺開放的初衷不謀而合。為此,百度大腦語言與知識技術開放平臺不斷降低技術使用門檻,搭建起以飛槳為底層技術支持,包括語言與知識基礎技術層、應用級平臺層、服務方式、場景方案等,讓一線產(chǎn)業(yè)開發(fā)者都用得上“趁手”的AI工具,迅速將相關技術布局于應用場景中。
百度化身技術“先行者” 語言與知識技術貫通落地全流程
作為機器理解人類意圖的最重要技術之一,語言與知識技術是國內外科技巨頭的必爭之地。百度深耕語言與知識技術多年,可謂是站在了巴別塔的更高層。
2019年,百度發(fā)布可持續(xù)學習語義理解框架ERNIE 2.0發(fā)布,在持續(xù)學習方面實現(xiàn)新突破,每當引入新任務時,該框架可在學習該任務的同時,不遺忘之前學到過的信息。目前,ERNIE已在共計16個中英文任務上超越了BERT和XLNet,取得了SOTA效果。除了在學術領域的價值,ERNIE 2.0背后蘊藏著不容忽視的產(chǎn)業(yè)價值,尤其是在目前國際貿易與科技背景下,ERNIE 2.0代表的無監(jiān)督預訓練語言模型正處在非常關鍵的產(chǎn)業(yè)位置。
此外,ERNIE也得到了深度學習平臺飛槳(PaddlePaddle)的底層加持。在GPU多級多卡訓練中,基于飛槳訓練ERNIE模型多機加速比達到77%,遠高于其他主流實現(xiàn)。在加載預訓練模型方面,飛槳預訓練模型管理和遷移學習組件PaddleHub,可一鍵加載工業(yè)級預訓練模型。使用PaddleHub組件,可以讓ERNIE 語義表示模型實現(xiàn)1行代碼完成預訓練模型的預測、10行代碼完成大規(guī)模預訓練模型的遷移學習。
飛槳自然語言處理模型庫PaddleNLP是基于飛槳打造的工業(yè)級中文NLP開源工具集,擁有當前業(yè)內效果非常好的中文語義表示模型和基于百億級大數(shù)據(jù)訓練的預訓練模型,可大大減少用戶在開發(fā)過程中的重復工作,獲得更好的基于工業(yè)實踐的應用效果。
在應用級平臺方面,吳甜以UNIT(理解與交互技術)平臺為例,解析了此類平臺的智能便捷。智能客服、智能駕駛等場景都對人機對話的流暢度與準確性提出嚴苛考驗,UNIT平臺致力于打造為對話系統(tǒng)定制的專業(yè)、低成本、全鏈路的技術與服務平臺,并已經(jīng)為金融、教育等行業(yè)提供解決方案和服務。
UNIT平臺核心技術包括語義理解、閱讀理解和對話管理三大部分,其中ERNIE SLU可達到在同樣理解精度下標注量降低37%~72%,DataKit可使數(shù)據(jù)生產(chǎn)效率提升8倍,使用語義理解SLU定制可使對話技能綜合研發(fā)成本降低60%。目前,UNIT平臺已實現(xiàn)6.8萬定制技能,累計交互次數(shù)達570億次,全面覆蓋智能客服、智能出行、智能辦公及其他智能交互場景,為一線開發(fā)者實現(xiàn)AI產(chǎn)業(yè)化提供有力工具。
堅持創(chuàng)新 遇見語言與知識技術的“下一個50年”
“50多年前的預言已經(jīng)實現(xiàn),它依賴于技術的突破和創(chuàng)新”,吳甜認為,作為擁有30余項技術工具、服務方式多樣靈活可定制、技術全面領先并且效能更高的語言與知識技術開放平臺,百度應該將創(chuàng)新的AI能力源源不斷的輸送到應用一線,實現(xiàn)真正的突破創(chuàng)新、開源開放、智見未來。
堅持創(chuàng)新、開放是百度在語言與知識技術領域的長期發(fā)展目標。近年來,百度也在該領域不斷實現(xiàn)技術突破,持續(xù)為開發(fā)者和相關領域提供更好的技術支持,并加深技術與應用的結合,推動AI技術落地更多場景,加速產(chǎn)業(yè)智能化進程。