專訪三桐:阿里人工智能搜索應(yīng)用的交互式未來
12月13-14日19:30,阿里巴巴技術(shù)協(xié)會、云棲社區(qū)聯(lián)合主辦并獨(dú)家直播的《2017阿里雙11技術(shù)十二講》將強(qiáng)勢來襲。本次雙11在線技術(shù)論壇將專注更深的科技層面,全方面展現(xiàn)時(shí)代更迭下的全新黑科技,帶你詳細(xì)了解2017阿里雙11背后的技術(shù),并為你提供與一線專家面對面溝通學(xué)習(xí)的機(jī)會。在本次峰會中,阿里巴巴資深算法專家三桐將帶來《人工智能在商品搜索中的應(yīng)用》主題分享,云棲社區(qū)直播報(bào)名傳送門。
搜索一直在用人工智能的前沿技術(shù)理解用戶和商品,提供智能的搜索購物體驗(yàn),過去幾年在搜索意圖理解、語義匹配、用戶興趣感知、搜索排序策略、多場景協(xié)同優(yōu)化、智能交互等領(lǐng)域取得了重要的進(jìn)展。搜索的深度用戶感知網(wǎng)絡(luò)能夠根據(jù)用戶行為足跡和上下文實(shí)時(shí)感知用戶意圖、預(yù)測用戶興趣偏好和生成個(gè)性化的排序策略,感知網(wǎng)絡(luò)超過10B個(gè)參數(shù),已經(jīng)學(xué)習(xí)了幾千億次的用戶行為,并且會保持不間斷的增量學(xué)習(xí),讓模型越來越聰明;搜索利用多智能體協(xié)同學(xué)習(xí)技術(shù),實(shí)現(xiàn)了搜索多個(gè)異構(gòu)場景間的環(huán)境感知、通信和協(xié)同決策,實(shí)現(xiàn)聯(lián)合收益***化,而不是此消彼長;搜索的在線深度學(xué)習(xí),能夠在秒級完成從日志收集、模型訓(xùn)練再到模型實(shí)時(shí)部署,日均處理數(shù)千億次的樣本。本文對三桐進(jìn)行了專訪,深入探討了人工智能在搜索的應(yīng)用。
阿里巴巴資深算法專家 三桐
三桐,2008年加入阿里巴巴,目前負(fù)責(zé)淘寶個(gè)性化和排序團(tuán)隊(duì)。他曾先后負(fù)責(zé)過相關(guān)性、query分析、個(gè)性化、排序、智能交互等方向,目前專注淘寶商品搜索算法方向。此外三桐還主持過多個(gè)搜索重大技術(shù)項(xiàng)目,致力于推動大規(guī)模機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、在線學(xué)習(xí)、多智能體、遷移學(xué)習(xí)、知識圖譜等在商品搜索的應(yīng)用。
人工智能搜索
人工智能在搜索的應(yīng)用范圍是非常廣的,具體包括這么幾個(gè)方面:首先是語義搜索,通過深度學(xué)習(xí)和知識圖譜技術(shù),解決用戶搜索查詢意圖和商品內(nèi)容的語義匹配問題;其次是智能交互,通過感知用戶搜索狀態(tài),幫助用戶完成查詢意圖細(xì)化或切換,或通過智能問答技術(shù)解決售前售后導(dǎo)購問題;再次是個(gè)性化匹配,主要是根據(jù)用戶行為足跡和上下文實(shí)時(shí)感知用戶意圖、用戶興趣偏好和生成個(gè)性化的排序策略;***是智能決策,主要是指通過強(qiáng)化學(xué)習(xí)和多智能體等技術(shù)解決搜索排序中的策略探索和優(yōu)化問題。
三桐表示,阿里的搜索智能化之路經(jīng)歷了幾年的發(fā)展和應(yīng)用,結(jié)合淘寶商品搜索業(yè)務(wù)特點(diǎn),我們構(gòu)建了一套有特色的人工智能技術(shù)體系,包括電商知識圖譜,實(shí)時(shí)計(jì)算平臺,離線深度學(xué)習(xí)平臺,在線深度學(xué)習(xí)平臺,智能決策平臺和在線深度預(yù)測平臺。
阿里的搜索智能化發(fā)展之路
雙11的商品搜索及技術(shù)解讀
“商品搜索是電商業(yè)務(wù)的核心技術(shù)”,雙11期間更是對搜索技術(shù)提出了更高的需求:首先是彈性計(jì)算,雙11高峰期搜索PV比平時(shí)大得多,系統(tǒng)需要根據(jù)流量情況實(shí)時(shí)調(diào)整機(jī)器資源;其次是實(shí)時(shí)計(jì)算、在線學(xué)習(xí)和在線預(yù)測能力,雙11用戶行為和平時(shí)大為不同,需要實(shí)時(shí)捕獲用戶興趣偏好,在線更新個(gè)性化模型和實(shí)時(shí)預(yù)估;***是排序策略,根據(jù)雙11的需求特點(diǎn)要求系統(tǒng)能夠?qū)崟r(shí)調(diào)整排序策略。
對于雙11海量的搜索請求,搜索技術(shù)也經(jīng)歷了相應(yīng)的演進(jìn)歷程。一方面,系統(tǒng)和算法性能持續(xù)優(yōu)化,致力提升系統(tǒng)性能;另一方面,通過彈性技術(shù)的應(yīng)用來提高機(jī)器使用效率;此外也有通過異構(gòu)計(jì)算等,解決深度模型稠密計(jì)算等問題。今年的雙11,還采用了很多新的技術(shù)和算法,包括在線深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、多智能體、多任務(wù)學(xué)習(xí)、離在線混布等。新技術(shù)和新算法的應(yīng)用下,基于強(qiáng)化學(xué)習(xí)的智能交互極大提高了交互和搜索的整體收益,基于深度學(xué)習(xí)的語義搜索大大提高了搜索相關(guān)性,多任務(wù)學(xué)習(xí)下的個(gè)性化服務(wù)更是顯著提高了搜索的個(gè)性化體驗(yàn),還有多智能體技術(shù)實(shí)現(xiàn)的多個(gè)搜索場景聯(lián)合優(yōu)化等等。
阿里的智能搜索系統(tǒng)之個(gè)性化搜索
在搜索效率的提升上,今年更是取得了極為亮眼的成績。三桐提到,雙11當(dāng)天數(shù)據(jù)無線搜索通過智能搜索技術(shù)A/B-test GMV提升了12.1%,GMV同比提升高達(dá)56%。
挑戰(zhàn)及未來
人工智能愈演愈熱的大背景下,“搜索未來肯定會朝越來越智能的方向發(fā)展”。為了應(yīng)對復(fù)雜的個(gè)性化需求,阿里的智能搜索體系也一直致力于性能的不斷優(yōu)化,如引入Inference加速算法,實(shí)現(xiàn)降維、量化、剪枝、二值網(wǎng)絡(luò)等功能。
面對冷啟動、超參數(shù)學(xué)習(xí)、多模交互、智能導(dǎo)購、長期收益和量化、線上線下結(jié)合、AI業(yè)務(wù)創(chuàng)新等新挑戰(zhàn),三桐表示會注重多場景聯(lián)合優(yōu)化來提高整體效率,比如搜索、推薦和廣告;life long learning,提高模型的用戶和商品理解能力;多目標(biāo)聯(lián)合優(yōu)化,實(shí)現(xiàn)搜索中用戶體驗(yàn)、賣家流量和平臺訴求多目標(biāo)的聯(lián)合優(yōu)化。除了當(dāng)搜索工具外,相信未來的搜索也會支持更優(yōu)化的智能交互方式,比如語音、自然語言對話等。
在12月13-14日19:30的雙11在線技術(shù)峰會上,屆時(shí)三桐將詳細(xì)介紹人工智能在搜索的應(yīng)用。預(yù)約直播敬請點(diǎn)擊:https://yq.aliyun.com/promotion/428。