【W(wǎng)OT2018】人機智能如何賦能業(yè)務創(chuàng)新?聽聽這三位大咖怎么說
原創(chuàng)【51CTO.com原創(chuàng)稿件】2018年11月30日-12月1日,WOT2018全球人工智能技術峰會在北京·粵財JW萬豪酒店盛大召開。60+國內(nèi)外人工智能一線精英大咖與千余名業(yè)界專業(yè)技術人員齊聚現(xiàn)場,分享人工智能的平臺工具、算法模型、語音視覺等技術內(nèi)容,探討人工智能如何賦予行業(yè)新的活力。兩天會議涵蓋通用技術、應用領域、行業(yè)賦能三大章節(jié),開設13大技術專場,如機器學習、數(shù)據(jù)處理、AI平臺與工具、推薦搜索、業(yè)務實踐、優(yōu)化硬件等,堪稱人工智能技術盛會。
人工智能熱潮由深度學習技術推動,如今智能客服、語音識別等領域已經(jīng)與商業(yè)場景應用相結合,賦能各個行業(yè)。針對這個話題,本屆WOT2018峰會特別設置了《人機智能》分論壇。來自京東、扇貝、蘇寧的三位大咖圍繞“人機智能如何賦能行業(yè)發(fā)展”進行了主題分享。
智能對話助力京東客服體驗升級
京東智能對話研發(fā)部技術總監(jiān)劉丹,在主題為《智能對話助力京東客服體驗升級》的演講中,分享了京東智能對話是如何通過整體解決方案助力客服咨詢體驗升級的。
京東智能對話研發(fā)部技術總監(jiān) 劉丹
劉丹表示,人工智能能夠解放機械性工作,更好地為人服務。過去,整個客戶流程包括排班調(diào)控、一線接待、運營管理,需要耗費大量的人力和精力。而現(xiàn)在AI正在助力客服體驗全面升級,通過全面的端對端的智能對話解決方案,從智能調(diào)度、智能對話、智能坐席、再到智能分析,形成一個完整的閉環(huán)。
京東堅持以技術驅動消費者體驗升級,致力于將人工智能技術與商業(yè)場景應用相結合,實現(xiàn)體驗升級和創(chuàng)新。京東發(fā)展智能對話具有三大獨特優(yōu)勢:
- 優(yōu)秀的團隊:多位海內(nèi)外人工智能科學家,國內(nèi)最龐大的自營客服團隊做業(yè)務支撐;
- 優(yōu)質的數(shù)據(jù):圍繞零售、金融、物流等領域的核心業(yè)務,擁有海量精準豐富的大數(shù)據(jù)基礎;
- 豐富的場景:擁有智能消費、智能供應、智能物流、金融科技、實體零售科技在內(nèi)的多元場景布局。
智能對話作為京東布局已久的技術領域,目前已經(jīng)在京東客服業(yè)務上進行了成熟應用。從整體上,京東智能對話產(chǎn)品面向京東用戶、京東客服、京東商家、外部企業(yè)四方向進行布局。面向京東用戶,我們推出智能客服、智能語音導航,能給京東用戶帶來智能化咨詢體驗,高效且富有人情溫度地解決用戶問題。面向京東客服,我們打造智能調(diào)度(天樞)、客服智能輔助(天弓)、大數(shù)據(jù)智能分析平臺(天象),能幫助他們提高工作效率,讓客服感知更全面、響應更迅速,提供給用戶更好的服務體驗。面對京東商家和外部企業(yè),我們有商家服務機器人(小智)和智能對話解決方案,助力這些企業(yè)伙伴實現(xiàn)一站式智能化。
據(jù)介紹,京東正在探索下一代對話式電商體驗,基于自然語言處理、深度神經(jīng)網(wǎng)絡和機器學習等AI前沿科技打造的智能客服是業(yè)內(nèi)大規(guī)模商用的情感智能AI客服機器人,通過多維技術靈活應用,如首創(chuàng)Action/Business/Scene的方法構建業(yè)務知識圖譜、通過遷移學習、反向翻譯、噪聲處理的方法打造情感分析模型等,實現(xiàn)意圖識別能力和共情能力的突破與提升。
目前京東智能客服已經(jīng)承接京東90%以上的消費者咨詢,擁有4000+京東客服售后標準化技能。提供給京東客服、京東商家和外部企業(yè)伙伴的一系列產(chǎn)品服務也在實踐過程中日漸強烈地迸發(fā)AI賦能的力量,相信隨著AI技術的不斷發(fā)展,未來智能客服對話系統(tǒng)還將有持續(xù)提升,我們也將和業(yè)界一道推動這一領域的創(chuàng)新實踐。
深度學習在語言學習場景下的技術實踐
扇貝算法團隊負責人張志博帶來了《深度學習在語言學習場景下的技術實踐》的主題分享。他以扇貝在谷歌開發(fā)者大會中的一個案例項目為例,分享了在語言學習場景下對深度學習的應用,探討在中小團隊中如何實現(xiàn)從基礎設施建設到數(shù)據(jù)收集清洗,再到模型的選擇和評估,逐步搭建深度學習落地的開發(fā)框架和迭代流程。
扇貝算法團隊負責人 張志博
扇貝是一家以全面、有效提升英語學習能力為目標的移動學習平臺,產(chǎn)品矩陣涵蓋聽說讀寫,擁有包括扇貝單詞、扇貝聽力、扇貝口語、扇貝閱讀。截止2018年12月,用戶已突破8000萬。對英語學習者詞匯水平的深度追蹤入選 2018 谷歌開發(fā)者大會案例展示。扇貝也與各種優(yōu)質的內(nèi)容提供平臺有深入的合作。
張志博詳細介紹了扇貝在語言學習方面的兩個案例:口語評測引擎和智能中英對照文本。
- 口語評測引擎:具有移動端離線實時打分、音頻多軌Mix&音量Normalize、音素級別的打分功能、高準確性(人機間皮爾森相關系數(shù)超過資深口語老師間均值)等特點;
- 智能中英對照文本:基于深度學習實現(xiàn)句子級雙語文本自動對齊,自動對齊準確率可高達93.2%。單本書籍平均人工審校時間可從2周減少到1天。
扇貝通過應用 TensorFlow,在深度知識追蹤系統(tǒng)上可以實時地預測用戶對詞表上每個詞回答正確的概率?;谙惹按罅烤€上詞匯量測試記錄,扇貝的總序列數(shù)量已經(jīng)累積到千萬級別,這為使用深度學習模型提供了堅實的基礎。
模型方面,扇貝選用了斯坦福大學 Piech Chris 等人在 NIPS 2015 發(fā)表的 Deep Knowledge Tracing (DKT) 模型,該模型在 Khan Academy Data 上進行了驗證,有著比傳統(tǒng) BKT 模型更好的效果。相比 Khan Academy Data,扇貝詞匯量測試數(shù)據(jù)的題目數(shù)量和所涉及用戶量都要更大,序列長度也更長,這些不同也是扇貝在模型調(diào)優(yōu)過程中面臨的挑戰(zhàn)。
Baseline 模型結構為單層 LSTM ,輸入 xt 是用戶當前 action(所答單詞和正確與否)的 embedding,可以用 one-hot encodings 或者是 compressed representations。輸出 yt 代表模型預測用戶對詞表中每個詞回答正確的概率。
在模型改進方面,按照原論文思路實現(xiàn)的 baseline ,在 Khan Academy Data 上能較好地復現(xiàn)論文結果。針對實際應用場景,扇貝使用 TensorFlow 實現(xiàn)了相應模型,在數(shù)據(jù)預處理、引入外部特征、長序列依賴、超參數(shù)調(diào)優(yōu)等方面做出改進,嘗試提升模型性能。
在模型部署方面,扇貝使用 TensorFlow Serving 作為模型部署上線的方案。在上線前我們有利用一些模型壓縮技術來減少模型大小,并根據(jù) TensorFlow Serving Batching Guide來找到 batching config 參數(shù)。
最終,扇貝通過對一系列論文結果的復現(xiàn)、改進以及調(diào)優(yōu),成功將 DKT 模型上線,為數(shù)千萬用戶提供了更科學的詞匯測試方案。
蘇寧智能購物助理機器人平臺
蘇寧易購搜索算法團隊負責人孫鵬飛在《蘇寧智能購物助理機器人平臺》的分享中,介紹了蘇寧智能購物助理機器人平臺、智能人機交互構建技術實踐、挑戰(zhàn)與未來等內(nèi)容。
蘇寧易購搜索算法團隊負責人 孫鵬飛
蘇寧一直把智慧零售的理念落到產(chǎn)品體驗上,作為國內(nèi)O2O戰(zhàn)略的實踐者,蘇寧積攢了20多年的行業(yè)領域知識,通過大數(shù)據(jù)、機器學習、深度學習等新技術提升產(chǎn)品體驗,一直是蘇寧努力實踐的方向。
蘇寧在分析用戶搜索行為的時候發(fā)現(xiàn),越來越多的問題是傳統(tǒng)搜索引擎無法解決的。圍繞著電子商務領域中的導購、服務以及任務助理等幾個方面,蘇寧搜索團隊進行了深入調(diào)研,在2015年開始研發(fā)智能購物助理機器人平臺。
隨著第一版的推出,得到了公司以及越來越多用戶的廣泛認可。但單純的售前智能導購已經(jīng)無法滿足用戶的需求,在公司的支持下,研發(fā)了整個智能購物助理機器人平臺,加入和豐富了越來越多的場景,為業(yè)務線提供良好支持。
整個平臺的產(chǎn)品服務體系分為四層,最上層是用戶服務前臺體系,包括易購自助服務、云信用戶端、智能IVR、公眾號、小程序等產(chǎn)品和服務。中間是整個平臺的大腦部分,即智能調(diào)度系統(tǒng),包括調(diào)度路由機器人以及QA機器人、商品推薦機器人、業(yè)務搜索機器人等。同時,在中間還有一個大中臺,包括場景化服務中臺和知識中臺兩部分。場景化服務中臺主要是根據(jù)不同業(yè)務需要,提供不同的API服務,而知識中臺主要是提供相應的數(shù)據(jù)支撐,構建知識庫,為不同的業(yè)務提供相應的數(shù)據(jù)。最后是后臺支撐體系,為不同的業(yè)務系統(tǒng)提供相應的API服務,以便能夠更好的為前臺進行相應的服務。
在技術實踐上,孫鵬飛介紹說,整個系統(tǒng)的構成可以分為三大模塊、四大類機器人。三大模塊分別是自然語言處理模塊、對話管理模塊、自然語言生成模塊。四大類機器人包括QA-Bot問答機器人、Task-Bot任務對話機器人、Chitchat-Bot閑聊機器人、Rec-Bot推薦機器人。
不同模塊在不同機器人上的應用是不同的。例如,在聊天型機器人中,自然語言理解主要負責一些情感及意圖的識別。而到任務型機器人,則主要是負責一些意圖分類以及語義槽填充。對話管理模塊,在問答型機器人上主要是做文本的檢索以及知識庫的匹配。而到了推薦型機器人,主要是做用戶興趣的匹配以及推薦內(nèi)容的排序。自然語言生成模塊,在聊天型機器人上主要是進行開放領域的聊天回復,而到了任務型機器人,主要是確認、澄清、完成一些相應的動作。
最后,孫鵬飛認為,未來主要有意圖邊界劃分、數(shù)據(jù)標注、語料質量優(yōu)化、對話質量評估、探索端到端任務型對話系統(tǒng)等五大挑戰(zhàn),并且挑戰(zhàn)只多不少。
以上內(nèi)容是51CTO記者根據(jù)WOT2018全球人工智能技術峰會的《人機智能》分論壇演講內(nèi)容整理,更多關于WOT的內(nèi)容請關注51cto.com。
【51CTO原創(chuàng)稿件,合作站點轉載請注明原文作者和出處為51CTO.com】