【W(wǎng)OT2018】孫林:技術(shù)改變行業(yè) AI在貝殼找房業(yè)務(wù)中的應(yīng)用實(shí)踐
原創(chuàng)【51CTO.com原創(chuàng)稿件】2018年5月18-19日,由51CTO主辦的全球軟件與運(yùn)維技術(shù)峰會(huì)在北京召開。此次峰會(huì)圍繞人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)、區(qū)塊鏈等12大核心熱點(diǎn),匯聚海內(nèi)外60位一線專家,是一場(chǎng)高端的技術(shù)盛宴,也是頂級(jí)IT技術(shù)人才學(xué)習(xí)和人脈拓展不容錯(cuò)過的平臺(tái)。
在“人工智能技術(shù)探索”分會(huì)場(chǎng),貝殼找房高級(jí)經(jīng)理孫林以《人工智能技術(shù)在貝殼找房業(yè)務(wù)中的應(yīng)用》為主題展開精彩分享。孫林提到,鏈家在十余年里已經(jīng)形成了一套標(biāo)準(zhǔn)化的服務(wù)能力,并希望將這些能力開放給整個(gè)行業(yè),這就是鏈家網(wǎng)的升級(jí)版——貝殼找房。
貝殼找房高級(jí)經(jīng)理 孫林
一、為什么貝殼找房能落地人工智能技術(shù)?
人工智能技術(shù)的落地離不開ABCD四要素:Algorithm(算法)+ Bigdata(大數(shù)據(jù))+ Computing(算力)+ Domain(領(lǐng)域/場(chǎng)景)。孫林認(rèn)為,ABC是人工智能在某一場(chǎng)景落地的必要條件。從當(dāng)前的技術(shù)發(fā)展情況來看,得益于硬件尤其是GPU的發(fā)展,算力方面不存在太大的問題。而在算法方面,目前國(guó)內(nèi)外各家公司的差距并不大?,F(xiàn)階段,人工智能技術(shù)是基于大數(shù)據(jù)的智能,再好的模型也需要大數(shù)據(jù)去訓(xùn)練,因此數(shù)據(jù)更加重要。而人工智能技術(shù)落地的充分條件就是D,也就是我們所說的業(yè)務(wù)和場(chǎng)景。孫林認(rèn)為,人工智能能否落地取決于技術(shù)能否為你所在的行業(yè)帶來社會(huì)價(jià)值以及商業(yè)價(jià)值。
孫林提到,鏈家能夠?qū)⑷斯ぶ悄芗夹g(shù)落地取決于以下兩項(xiàng)因素:
首先,鏈家有豐富的數(shù)據(jù)。鏈家在十余年的業(yè)務(wù)發(fā)展過程中,積累了大量的結(jié)構(gòu)化以及非結(jié)構(gòu)化的數(shù)據(jù),包括語音、文本、圖片、視頻等不同的數(shù)據(jù)類型。同時(shí)鏈家有完整的產(chǎn)品閉環(huán),有自己的產(chǎn)品和流量,可以持續(xù)不斷地生產(chǎn)出更多的數(shù)據(jù),而這些數(shù)據(jù)又可以幫助去迭代算法,從而推動(dòng)貝殼找房產(chǎn)品的不斷優(yōu)化。
其次,鏈家有非常合適的落地場(chǎng)景。舉個(gè)例子,用戶在找房的過程中會(huì)有房屋搜索和房屋推薦兩個(gè)方面的需求;在找到房源后還要了解戶型、房?jī)r(jià)、首付及貸款政策等等,這是知識(shí)問答的需求;定了房子之后還要有很長(zhǎng)的線下簽約的流程,在這個(gè)過程中如何控制風(fēng)險(xiǎn)也要考慮全面。搜索、推薦、問答、風(fēng)控,都是人工智能技術(shù)典型的應(yīng)用場(chǎng)景。
二、貝殼落地AI的三項(xiàng)成果
1、提升效率
貝殼找房的智能助手應(yīng)用,滿足了用戶在找房過程中的搜索、問答、推薦的需求,同時(shí)也提升了經(jīng)紀(jì)人的工作效率。孫林提到,由于房源過多,經(jīng)紀(jì)人的能力也不盡相同,不太可能了解所有房源的具體情況,而經(jīng)紀(jì)人在不同系統(tǒng)中查找和切換耗費(fèi)時(shí)間,用戶等待的時(shí)間越長(zhǎng),體驗(yàn)也就越差。通過人工智能技術(shù),智能助手應(yīng)用已經(jīng)覆蓋了70%的用戶需求,智能助手首先將用戶問題的答案推薦給經(jīng)紀(jì)人,而經(jīng)紀(jì)人只需進(jìn)行簡(jiǎn)單的編輯即可發(fā)送給客戶,極大地縮短了問題反饋的時(shí)間。智能助手將經(jīng)紀(jì)人的服務(wù)效率及服務(wù)品質(zhì)實(shí)現(xiàn)標(biāo)準(zhǔn)化,極大地改善了用戶體驗(yàn)。
2、節(jié)約成本
孫林表示,人工智能技術(shù)的另一個(gè)目標(biāo)便是幫助公司節(jié)省成本。目前貝殼找房的智能客服產(chǎn)品的轉(zhuǎn)人工率已低于10%,這意味著經(jīng)紀(jì)人的每10個(gè)問題中,就有9個(gè)是可以被智能客服產(chǎn)品自動(dòng)化解決的。未來,鏈家會(huì)將貝殼找房的能力開放給全行業(yè),服務(wù)全國(guó)100萬經(jīng)紀(jì)人,降低行業(yè)中坐席團(tuán)隊(duì)的人數(shù),為行業(yè)降低人工客服的成本。
3、控制風(fēng)險(xiǎn)
貝殼找房還能幫助行業(yè)控制風(fēng)險(xiǎn)。在鏈家的業(yè)務(wù)場(chǎng)景中有很多線下的場(chǎng)景,經(jīng)紀(jì)人和客戶之間要進(jìn)行電話溝通,涉及到語音質(zhì)檢和商機(jī)發(fā)現(xiàn)兩個(gè)問題,通過語音質(zhì)檢,貝殼找房每天對(duì)4000余小時(shí)的語音數(shù)據(jù)進(jìn)行分析、質(zhì)檢和風(fēng)險(xiǎn)控制,檢測(cè)經(jīng)紀(jì)人的服務(wù)品質(zhì),并從中篩選出潛在商機(jī)。
三、貝殼找房落地AI技術(shù)的應(yīng)用場(chǎng)景
用戶在買房或租房的過程中涉及到搜房源、問房源信息、安排看房、購買流程等環(huán)節(jié),中間涉及了搜索系統(tǒng)、問答系統(tǒng)、推薦系統(tǒng)、對(duì)話系統(tǒng)等多種技術(shù),智能系統(tǒng)既要降低知識(shí)和信息的獲取門檻,又要提升服務(wù)的效率和品質(zhì)。這就意味著底層的知識(shí)庫及知識(shí)圖譜要足夠全面和準(zhǔn)確,技術(shù)體系也要足夠健全。
貝殼找房的系統(tǒng)架構(gòu)
業(yè)務(wù)流程:用戶(左),經(jīng)紀(jì)人(右)
如何構(gòu)建知識(shí)體系?
貝殼找房從知識(shí)怎么來、誰來管、怎么管三方面構(gòu)建知識(shí)體系。知識(shí)的來源可分為內(nèi)部知識(shí)和外部知識(shí),包括財(cái)務(wù)要求、經(jīng)紀(jì)人品質(zhì)規(guī)范、UGC知識(shí)、互聯(lián)網(wǎng)知識(shí)等等。內(nèi)部知識(shí)由生產(chǎn)部門管理,確保知識(shí)的準(zhǔn)確性,外部抓取的知識(shí)則采取眾包校驗(yàn)機(jī)制。在知識(shí)的管理方面,對(duì)于語音、圖片等非結(jié)構(gòu)化數(shù)據(jù),通過分類加標(biāo)簽的方式進(jìn)行組織。知識(shí)組織好以后,貝殼找房通過眾包系統(tǒng)進(jìn)行知識(shí)的運(yùn)營(yíng),同時(shí)設(shè)計(jì)了一套知識(shí)管理系統(tǒng)來確保知識(shí)的準(zhǔn)確性,系統(tǒng)的功能包括知識(shí)的錄入、搜索、眾包、分發(fā)和抽檢機(jī)制等,另外,還通過數(shù)據(jù)挖掘的方式彌補(bǔ)知識(shí)的缺失,通過這兩種方式來確保知識(shí)的準(zhǔn)和全的問題。孫林介紹,目前貝殼找房對(duì)已有的上億個(gè)樓盤字典,通過知識(shí)圖譜的方式進(jìn)行組織,每個(gè)知識(shí)都有相應(yīng)的維護(hù)人員對(duì)其進(jìn)行維護(hù)。
如何構(gòu)建應(yīng)用系統(tǒng)?
有了知識(shí),就要通過構(gòu)建應(yīng)用系統(tǒng)讓知識(shí)為用戶服務(wù)所用。經(jīng)過幾年的積累,鏈家已經(jīng)擁有超過億級(jí)的多輪對(duì)話信息,這些信息能夠幫助貝殼找房構(gòu)建對(duì)話系統(tǒng)。一個(gè)完整的對(duì)話系統(tǒng)包括ASR、SLU、DST、Dialog Policy、NLG、TTS六個(gè)模塊。
認(rèn)證系統(tǒng)的架構(gòu)設(shè)計(jì)
貝殼找房的對(duì)話系統(tǒng)的架構(gòu)包括Web接入層、中控、語義理解、對(duì)話管理、Session存儲(chǔ)服務(wù)、搜索、問答、推薦等模塊。其中,中控從web接入層接收到用戶的請(qǐng)求,將從Session存儲(chǔ)服務(wù)中獲取的用戶的多輪對(duì)話的對(duì)話歷史發(fā)送給語義理解和對(duì)話模塊來理解用戶的需求,進(jìn)而調(diào)用搜索、問答、推薦等服務(wù)來滿足用戶的需求。同時(shí),構(gòu)建了一套完整的體系來保證對(duì)系統(tǒng)的效果進(jìn)行持續(xù)的優(yōu)化:通過流量實(shí)驗(yàn)平臺(tái)對(duì)流量進(jìn)行切分,可以對(duì)各個(gè)算法模塊進(jìn)行A/B test實(shí)驗(yàn),并通過在指標(biāo)平臺(tái)上建立的指標(biāo)進(jìn)行效果回收,從而驗(yàn)證算法的好壞。同時(shí),貝殼找房每天有上億次搜索,為了保障服務(wù)的穩(wěn)定性,還需要有完善的服務(wù)監(jiān)控體系,此外,貝殼找房還有人工干預(yù)系統(tǒng),能夠?qū)ο到y(tǒng)進(jìn)行干預(yù)。
隨后,孫林在演講中介紹了房屋搜索系統(tǒng)和知識(shí)問答系統(tǒng)的主要架構(gòu),以及其中的核心模塊的算法。
房屋搜索系統(tǒng)
房屋搜索系統(tǒng)的主要架構(gòu)
貝殼找房的房屋搜索系統(tǒng)通過統(tǒng)一網(wǎng)關(guān)將鏈家所有的業(yè)務(wù)數(shù)據(jù)接入、存儲(chǔ)在分布式的存儲(chǔ)引擎中,用戶的query進(jìn)來之后,經(jīng)過query的糾錯(cuò)、改寫、分類、理解等模塊,分析出用戶的意圖后,到引擎里做數(shù)據(jù)的召回。通過使用learning to rank模型和深度強(qiáng)化學(xué)習(xí)等技術(shù),對(duì)召回?cái)?shù)據(jù)進(jìn)行二次排序。同時(shí),系統(tǒng)有一套靈活的策略干預(yù)機(jī)制,可以滿足各種強(qiáng)運(yùn)營(yíng)規(guī)則的排序需求。
意圖理解及召回策略
意圖理解
房屋搜索系統(tǒng)主要涉及到意圖理解和召回策略兩個(gè)方面。首先,在意圖理解方面,使用規(guī)則系統(tǒng)和機(jī)器學(xué)習(xí)模型等多種手段進(jìn)行意圖理解。規(guī)則系統(tǒng)解決系統(tǒng)的冷啟動(dòng)問題,經(jīng)過冷啟動(dòng)階段積累了大量數(shù)據(jù)之后,可以通過CNN 、LSTM-CRF等方法做意圖分類和實(shí)體識(shí)別,同時(shí)通過半監(jiān)督學(xué)習(xí)機(jī)制保證來系統(tǒng)模型的持續(xù)迭代。
房屋質(zhì)量打分
其次,是召回模塊,召回前先要對(duì)物料進(jìn)行質(zhì)量打分。物料的得分包括兩類:一類是對(duì)房屋的物理屬性的靜態(tài)打分,例如房屋各房間的朝向、是否南北通透等,這些靜態(tài)屬性會(huì)歸類到房屋的DNA中;另一類是房屋的行為得分,如房屋的帶看量,推薦量等,對(duì)這類特征可以通過時(shí)序模型如LSTM等技術(shù),對(duì)成交屬性和GMV轉(zhuǎn)化等實(shí)際屬性進(jìn)行刻畫,最終得到一個(gè)房屋的質(zhì)量分。
知識(shí)問答系統(tǒng)
知識(shí)問答系統(tǒng)架構(gòu)
知識(shí)問答與房屋搜索的架構(gòu)大部分相同,圖中綠色部分是不同之處。房屋搜索更多的是結(jié)構(gòu)化的查詢?nèi)蝿?wù),而問答則是非結(jié)構(gòu)化的查詢?nèi)蝿?wù)。傳統(tǒng)的基于關(guān)鍵詞搜索的問答系統(tǒng)需要對(duì)query進(jìn)行分詞、同義詞、簡(jiǎn)略詞的挖掘和改寫,如校區(qū)的各種縮寫等。為了解決這個(gè)問題,貝殼找房嘗試用向量化的方式做召回:首先使用embedding的技術(shù),將物料知識(shí)以向量化的方式進(jìn)行存儲(chǔ),并建立向量化的索引。當(dāng)新用戶的query進(jìn)來之后,對(duì)query做向量化處理,使用近似近鄰算法做召回,通過Deep Semantic Matching等深度學(xué)習(xí)技術(shù)做query和知識(shí)的語義匹配,從而保證召回的多樣性。
四、展望AI在貝殼的未來
AI技術(shù)在貝殼找房和鏈家成功落地,在提升效率和服務(wù)品質(zhì)的同時(shí),也為公司節(jié)約了成本,控制了風(fēng)險(xiǎn)。孫林強(qiáng)調(diào)AI的最佳實(shí)踐必須是產(chǎn)品、技術(shù)和運(yùn)營(yíng)三位一體的,除技術(shù)外,還要有一整套完整的知識(shí)產(chǎn)品以及完善的運(yùn)營(yíng)體系去支撐。在過去的一年里,從鏈家升級(jí)到貝殼找房,AI賦能改變了鏈家的產(chǎn)品鏈條,未來貝殼找房和鏈家期望成為人們“住”的入口,為人們提供買房、租房、裝修、物業(yè)等多種體驗(yàn)。最后,孫林引用“荒林春雨足,新筍迸龍雛”作為結(jié)尾,他認(rèn)為鏈家有著豐富的數(shù)據(jù)和合適的場(chǎng)景,期望AI技術(shù)能夠在鏈家的平臺(tái)上繼續(xù)成長(zhǎng),從而取得長(zhǎng)足的發(fā)展。
以上內(nèi)容是51CTO記者根據(jù)貝殼找房高級(jí)經(jīng)理孫林在WOT2018全球軟件與運(yùn)維技術(shù)峰會(huì)的演講內(nèi)容整理,更多關(guān)于WOT的內(nèi)容請(qǐng)關(guān)注51cto.com。
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文作者和出處為51CTO.com】