原來(lái)O2O搜索有這么多門(mén)道!美團(tuán)仙云森揭秘如何讓服務(wù)更智能
原創(chuàng)【51CTO.com原創(chuàng)稿件】2018年5月18-19日,由51CTO主辦的全球軟件與運(yùn)維技術(shù)峰會(huì)在北京召開(kāi)。此次峰會(huì)圍繞人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈等12大核心熱點(diǎn),匯聚海內(nèi)外60位一線專家,是一場(chǎng)高端的技術(shù)盛宴,也是頂級(jí)IT技術(shù)人才學(xué)習(xí)和人脈拓展不容錯(cuò)過(guò)的平臺(tái)。
在5月18日上午“人工智能技術(shù)探索”B會(huì)場(chǎng)論壇中,美團(tuán)搜索算法負(fù)責(zé)人仙云森帶來(lái)了《O2O服務(wù)搜索的智能化》的主題分享,并展示了美團(tuán)平臺(tái)搜索技術(shù)中心基礎(chǔ)算法的一些研究成果和心得。
O2O搜索的價(jià)值:連接人與服務(wù)
仙云森首先介紹了O2O(即Online To Offline/線上到線下)搜索的整體特點(diǎn),以及它與網(wǎng)頁(yè)搜索或者購(gòu)物搜索的一些差異。他介紹到,美團(tuán)是一個(gè)生活服務(wù)電商平臺(tái),有幾十條業(yè)務(wù)線,每個(gè)業(yè)務(wù)之間存在非常大的差異。他列舉了三個(gè)業(yè)務(wù)做對(duì)比,首先是足療按摩,足療按摩是一個(gè)非常輕決策的業(yè)務(wù),用戶更多的關(guān)注地點(diǎn),一公里內(nèi)的消費(fèi)比例非常高,對(duì)體驗(yàn)感受并不重要。與之相比,家裝就不同了,因?yàn)檠b修一次會(huì)使用多年,用戶對(duì)距離、優(yōu)惠的敏感度降低,更多的關(guān)注品質(zhì),結(jié)婚就更側(cè)重品質(zhì)和用戶體驗(yàn)了。這些不同的搜索需求給搜索業(yè)務(wù)帶來(lái)非常大的挑戰(zhàn)。
搜索的使命是什么?仙云森認(rèn)為搜索就是要連接人與服務(wù),把用戶和商家連接起來(lái)。如果只用兩個(gè)字來(lái)形容,那就是“效率”。“這里面有兩層含義,一層就是交易效率,另外一層就是決策效率。”他認(rèn)為搜索對(duì)于商家端的價(jià)值也有兩點(diǎn):一個(gè)就是用戶觸達(dá),通過(guò)搜索讓更多的用戶到店里來(lái),二是轉(zhuǎn)化效率,讓用戶在店里消費(fèi),在成單的同時(shí)優(yōu)化。
仙云森還從四個(gè)層面將O2O與網(wǎng)頁(yè)搜索、購(gòu)物電商做一個(gè)對(duì)比。
第一個(gè)區(qū)別是移動(dòng)化。美團(tuán)移動(dòng)端的占比在94%以上,淘寶移動(dòng)化比例也達(dá)到了90%,而百度的移動(dòng)占比就稍弱一些。第二個(gè)區(qū)別是個(gè)性化。這項(xiàng)對(duì)比中百度較低,因?yàn)榘俣鹊睦砟钍?ldquo;信息是平等的,不需要個(gè)性化”。而美團(tuán)和淘寶的個(gè)性化選擇則非常高。第三個(gè)區(qū)別是場(chǎng)景化,例如訂酒店,定景點(diǎn)門(mén)票往往都是異地達(dá)成的,地域空間的影響非常小。第四點(diǎn)是實(shí)時(shí)化,仙云森認(rèn)為淘寶的實(shí)時(shí)化與場(chǎng)景關(guān)聯(lián)較少,但在雙十一、反作弊這些具體的場(chǎng)景上實(shí)時(shí)性是有加強(qiáng)的。
如何讓O2O搜索智能化?
在了解O2O搜索的特點(diǎn)和基本特征后,那么如何去實(shí)現(xiàn)O2O搜索的智能化呢?仙云森認(rèn)為智能化目標(biāo)有兩個(gè),一是精準(zhǔn)需求一鍵觸達(dá),二是通過(guò)優(yōu)化體驗(yàn)提升決策效率。關(guān)鍵路徑也有兩點(diǎn):精準(zhǔn)的理解用戶意圖和智能化的排序算法。
在仙云森列出的搜索技術(shù)全景圖中,從基礎(chǔ)層、策略層到業(yè)務(wù)層,他分別梳理了通用業(yè)務(wù)和垂直業(yè)務(wù)對(duì)應(yīng)的搜索策略和技術(shù)。
在現(xiàn)場(chǎng)仙云森還強(qiáng)調(diào)了意圖理解的作用,即如何理解用戶的意圖。他介紹到,美團(tuán)上的用戶意圖可以被分解成幾個(gè)關(guān)鍵要素,如地點(diǎn)、時(shí)間,地點(diǎn)可以通過(guò)查找周邊來(lái)解決,不同的時(shí)間用戶的需求也不一樣,如工作日的中午,用戶可能只對(duì)快餐外賣有需求,而到了節(jié)假日,可以就會(huì)搜索大餐美食。此外像天氣,雨雪天氣、霧霾天氣,都會(huì)影響用戶的消費(fèi)行為。
當(dāng)談到意圖與召回時(shí),仙云森表示,美團(tuán)是一個(gè)結(jié)構(gòu)化的搜索,與網(wǎng)頁(yè)不同,美團(tuán)頁(yè)面上每一個(gè)商鋪有固定的幾個(gè)字段,而且都是規(guī)范化的異地人工上單。當(dāng)美團(tuán)在意圖上構(gòu)建意圖體系時(shí),有四點(diǎn)非常重要,一是業(yè)務(wù)識(shí)別要使用多意圖識(shí)別,二是消費(fèi)位置需要識(shí)別出是本地還是異地,三是消費(fèi)時(shí)間要判斷出是即時(shí)消費(fèi)還是延遲消費(fèi),看用戶是有排隊(duì)需求還是預(yù)訂需求。還有一點(diǎn)是成份分析,如果搜索系統(tǒng)能夠把它的成份識(shí)別清楚,就能夠召回得更精準(zhǔn),更有機(jī)會(huì)準(zhǔn)確地滿足用戶的需求。
例如當(dāng)用戶輸?shù)膖erms是北京南站,那么他的消費(fèi)品類在酒店上的需求基本是壓倒性的優(yōu)勢(shì),而假如用戶的terms是三里屯時(shí),對(duì)于酒吧搜索的需求量會(huì)非常大,搜索望京、五道口時(shí),韓國(guó)菜就會(huì)有一定的需求比例。“這就是我們根據(jù)用戶一些真實(shí)行為,能夠有機(jī)會(huì)判斷出來(lái)每一個(gè)差別的意圖分布。”
深度學(xué)習(xí)帶來(lái)效果提升
演講最后,仙云森還分享了美團(tuán)在實(shí)時(shí)化方面的實(shí)踐。他們首先做特征的實(shí)時(shí)化,在用戶的實(shí)時(shí)行為、實(shí)時(shí)庫(kù)存、實(shí)時(shí)意圖和實(shí)時(shí)轉(zhuǎn)化上做一些特殊工程,他們的模型其實(shí)是基于歷史的數(shù)據(jù)發(fā)現(xiàn)規(guī)律,從而預(yù)測(cè)未來(lái)。如果僅僅是數(shù)據(jù)有變化而規(guī)律沒(méi)變,那用特征預(yù)測(cè)就夠了。后來(lái)他們開(kāi)始嘗試模型的實(shí)時(shí)化,并經(jīng)過(guò)了三輪的迭代,首先是基礎(chǔ)模型GBDT+LR(Gradient boosting decision/regression tree,LTR中應(yīng)用較多的非線性模型),這也是Facebook比較經(jīng)典的結(jié)構(gòu),在這個(gè)基礎(chǔ)上他們做了一些改進(jìn),把sbas的特征直接加入到LR這一端,效果又得到了提升。
當(dāng)談到時(shí)下很熱門(mén)的深度學(xué)習(xí)時(shí),仙云森表示,深度學(xué)習(xí)對(duì)美團(tuán)有很大幫助。過(guò)去從業(yè)務(wù)特色看,有很多交叉的搜索因素如用戶場(chǎng)景、用戶狀態(tài),用戶查詢等等,僅僅依靠人工的力量,擰合力是不夠的。后來(lái)他們嘗試通過(guò)深度學(xué)習(xí),參考DeepFM模型,部分特征組合加入wide,并將FM部分改為分組product,在基礎(chǔ)網(wǎng)絡(luò)中取得了一個(gè)非常正向的效果。此外由于美團(tuán)是一個(gè)關(guān)注交易的服務(wù)商,因此相關(guān)性也非常重要。深度學(xué)習(xí)是比較適合做多任務(wù)學(xué)習(xí)的,所以他們嘗試了兩種結(jié)構(gòu),一個(gè)是共享wide,一個(gè)是共享deep,最終選擇了共享wide,因?yàn)椴还蚕韜ide的成本會(huì)更大。
以上內(nèi)容是51CTO記者根據(jù)仙云森在WOT2018全球軟件與運(yùn)維技術(shù)峰會(huì)的演講內(nèi)容整理,更多關(guān)于WOT的內(nèi)容請(qǐng)關(guān)注51cto.com。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】