自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

京東推薦搜索部技術(shù)總監(jiān)劉尚堃:數(shù)據(jù)驅(qū)動下的個性化推薦

原創(chuàng)
開發(fā) 前端
當(dāng)消費者在電商網(wǎng)站搜索喜好商品時,會看到在頁面周邊的一些推薦。這些推薦商品中可能是消費者現(xiàn)在需要的,也可能是曾經(jīng)搜索過的。這一現(xiàn)象背后如果沒有強大技術(shù)支持,就不會在精準推送的同時還能夠保證消費者的體驗度。在51CTO舉辦的WOT2015互聯(lián)網(wǎng)開發(fā)者大會上京東推薦搜索部技術(shù)總監(jiān)劉尚堃給分享了《京東數(shù)據(jù)驅(qū)動下的個性化推薦系統(tǒng)》,51CTO記者也在大會現(xiàn)場對其進行了專訪。

當(dāng)消費者在電商網(wǎng)站搜索喜好商品時,會看到在頁面周邊的一些推薦。這些推薦商品中可能是消費者現(xiàn)在需要的,也可能是曾經(jīng)搜索過的。這一現(xiàn)象背后如果沒有強大技術(shù)支持,就不會在精準推送的同時還能夠保證消費者的體驗度。在51CTO舉辦的WOT2015互聯(lián)網(wǎng)開發(fā)者大會上京東推薦搜索部技術(shù)總監(jiān)劉尚堃給分享了《京東數(shù)據(jù)驅(qū)動下的個性化推薦系統(tǒng)》,51CTO記者也在大會現(xiàn)場對其進行了專訪。接下來就來領(lǐng)略身為國內(nèi)最大自營B2C平臺京東是通過哪些技術(shù)對消費者進行精準的個性化推薦的?

【受訪者簡介】

[[143955]]

劉尚堃·京東推薦搜索部技術(shù)總監(jiān)

劉尚堃,京東推薦搜索部技術(shù)總監(jiān),有七年B2C行業(yè)搜索經(jīng)驗。目前負責(zé)搜索引擎、推薦方面的產(chǎn)品研發(fā)和團隊管理工作。他領(lǐng)導(dǎo)團隊將推薦搜索技術(shù)應(yīng)用于京東各個品牌的支持當(dāng)中,包括移動端的平臺、以及PC端平臺、以及微信平臺全部的推薦業(yè)務(wù)和場景。

個性化推薦簡述

個性化推薦就是通過全方位的數(shù)據(jù)精準刻畫用戶的購買意圖,然后有針對性給用戶推薦用戶購買意愿高的商品,為用戶提供極致的產(chǎn)品體驗,提升下單轉(zhuǎn)化率,增強用戶粘性。個性化推薦模型分為召回和排序兩大類,劉尚堃在采訪中,通過舉例詳細的講解了這兩大類模型。

召回模型

召回模型就是選舉推薦的侯選,京東主要用到基于行為的召回模型,其分為近期和長期兩種,其他還有基于偏好、基于地域等。

基于行為

基于近期行為的召回模型:例如一個用戶喜歡最近瀏覽一些炒股類的書籍,那么就會給這個用戶推薦一些他可能感興趣的其他炒股書籍。像這樣就尤其是最近發(fā)生的行為,這樣的情況就叫做近期行為的相似商品推薦。例如一個用戶買了一本《秘密花園》,這時候就會馬上給用戶推薦彩色筆。像這樣的情況就叫做近期行為的商品購買搭配推薦。劉尚堃表示:“基于近期行為的在線算法是最基礎(chǔ)最好用同時也是轉(zhuǎn)化率最高的”。

長尾商品的搭配

基于中長期行為的召回模型:中長期的行為通常在半年左右,可以用瀏覽相似、離線購買搭配和離線的SVD。當(dāng)在做搭配的時會有一些小Trick。因為京東的商品比較豐富,其中有些新商品沒有用戶行為。針對這樣的情況,利用購物籃分析,建立產(chǎn)品和產(chǎn)品之間的關(guān)系。把這些關(guān)系應(yīng)用到個性化推薦中去,提升長尾商品的搭配覆蓋率。

基于偏好

基于偏好也就是用戶畫像:比如女孩又比較喜歡化妝品買衣服,那么就會根據(jù)她在京東過去的一些行為,針對興趣愛好進行推薦。當(dāng)然在推薦的時候,還要考慮到用戶的購買力,敏感度等問題。如果用戶特別鐘愛戶外用品,這就是用戶的偏好。喜歡韓版衣服,這是用戶的修飾的偏好。當(dāng)不知道用戶喜歡什么產(chǎn)品,也不知道什么興趣愛好甚至偏好時,就會通過一些算法來預(yù)測你感興趣的產(chǎn)品?;诖髷?shù)據(jù)從海量的其他用戶中挖掘最接近的一個用戶,看看他喜歡什么樣的東西,他的興趣是什么,他的品牌是什么,然后再傳遞給用戶。

基于地域:京東有很多配送地,可以把一些區(qū)域做一些建模,比如說三里屯地區(qū)撲克牌、色子買的人比較多,因為有人需要它們給女孩變魔術(shù)。還有一些別的地區(qū),也可能有類似這樣的偏向于某一種消費品。通過區(qū)域劃分可以獲得很多的信息,比如購買力,就拿萬國城和史個莊相比,萬國城的消費程度比較高,就推薦一些高價位的商品。地域模型主要還可以用在沒有任何消費行為的新用戶上,就拿一名從來沒有在京東上購買過商品的學(xué)來說,如果他是清華大學(xué)這個區(qū)域,就推薦一些比較有難度的考研題目,或四六級書籍。如果是北京聯(lián)合大學(xué)的學(xué)生,就相對應(yīng)簡單一些。

排序模型

當(dāng)積累一定的用戶和流量,有一定點擊和購買之后,就需用到排序算法。

排序?qū)W習(xí)

標記:Point、pair、wise。第一步是做模型選取,因為模型有不同的特征和特性需要選取模型。第二是根據(jù)選取的模型進行標注,如果是Point標注,是選取正例和負例,如果是pair wise標注方法是,比如用ABCD四個商品,A沒有任何操作,B點擊了,C購買了,D沒有任何操作,那么就是點擊了BA,那么BA就是一個正例。CA因為是實際購買的,是正例,還有CB由于C是購買,B是點擊,購買比點擊更重要一些,CB也是正例,CD也是一個正例。后面的Tao是比較重要的程度。

特征計算:召回模型標記特征,在線相似、在線相關(guān)、離線相似、離線相關(guān),基于用戶畫像的召回和基于地域的召回,從哪個模型召回,這是我們重要的內(nèi)容。商業(yè)模型,比如某一個商品是大品牌還是小品牌等。用戶特征,實際上是對用戶畫像的維度,用戶的性別和購買力,還有用戶之前點擊的商品以及之前購買的商品是什么等。商品特征,,商品的銷量數(shù),價格區(qū)間等。、上下文特征,指的是用戶之前和之后一系列的操作等。時間特征,什么時間點對這個商品進行了點擊和購買等。地域特征、季節(jié)特征等。

離線計算和在線計算

離線計算,數(shù)據(jù)存在Data Mart,通過Hadoop上面運行Map Reduce,另外大量通過Mahout和Spark,通過分布式任務(wù)調(diào)度系統(tǒng)將輸送的結(jié)果存入HBase當(dāng)中。

在線計算計算流程,通過Kafka接收消息存入HBase當(dāng)中,在線計算主要基于Storm,實時消息基于Kafka是150億+消息的處理。

未來突破點

當(dāng)問及未來針對個性化推薦系統(tǒng)從哪個角度去突破時候,劉尚堃這樣說:“個性化推薦會達到一定瓶頸是肯定的,不敢說在機器學(xué)習(xí)、推薦搜索算法上,已經(jīng)達到了一個什么樣的高度。因為在前面有很多巨頭,包括國外也有不斷地出現(xiàn)一些新的技術(shù)。京東推薦部門經(jīng)過了幾年的發(fā)展不斷的趨向完美,在資深團隊成長的同時還有來自新浪谷歌的科學(xué)家加入。在過去,京東關(guān)更多關(guān)注的是推薦系統(tǒng)怎么去帶動京東的銷售,怎么幫助網(wǎng)站提高轉(zhuǎn)化率。在未來,需要更多考慮的是體驗類的指標,就是怎么去提升用戶體驗度。”

個性化推薦助力618大促

當(dāng)提及今年的618大促,劉尚堃說:“在過去,618是對京東系統(tǒng)的一次考驗或者壓力測試。但現(xiàn)在隨著京東系統(tǒng)的技術(shù)成熟,從2014年開始,618更像是一次Party??梢詮闹薪Y(jié)識新朋友、新人可從中學(xué)到知識。在個性化推薦方面,今年針對618設(shè)立了特別的場景并進行優(yōu)化和提升,達到千人千面“。 

寫在最后:   

一路走來京東個性化推薦有著突飛猛進的發(fā)展,后續(xù)還會從用戶體驗度出發(fā),研發(fā)一些有驚喜度或者吸引人的產(chǎn)品。采訪最后,劉尚堃表示“京東下半年準備直接在用戶沒有下單情況下,利用大數(shù)據(jù)技術(shù)直接將商品給到用戶,當(dāng)然用戶也可以拒收,這開始會在小范圍實施”??梢栽O(shè)想一下,你需要的商品不用通過下單,就會送上門來。那時候是怎樣一番情景?

責(zé)任編輯:王雪燕 來源: 51CTO
相關(guān)推薦

2020-06-28 07:00:00

推薦系統(tǒng)智能商務(wù)服務(wù)平臺

2022-11-01 07:19:45

推薦系統(tǒng)非個性化

2015-11-09 10:12:08

大數(shù)據(jù)個性化推薦

2022-09-06 17:43:02

??AISummit數(shù)據(jù)運營

2023-07-26 07:51:30

游戲中心個性化

2023-08-22 15:37:45

深度學(xué)習(xí)人工智能

2015-07-17 07:39:44

搜索下拉框產(chǎn)

2018-04-26 11:30:29

OracleBronto產(chǎn)品推薦

2016-01-07 13:23:35

構(gòu)建實時推薦系統(tǒng)

2018-04-27 16:23:27

Oracle Bron個性化產(chǎn)品

2019-05-20 08:11:02

淘寶個性化推薦

2016-09-29 12:09:47

大數(shù)據(jù)搜索個性化服務(wù)

2016-04-08 11:39:49

用戶畫像個性化推薦標簽

2021-07-18 22:47:08

大數(shù)據(jù)電商算法

2016-02-19 10:16:48

母嬰個推電商

2019-09-06 08:29:33

Netflix架構(gòu)推薦系統(tǒng)

2013-03-22 14:47:14

大數(shù)據(jù)云計算

2017-09-29 14:56:28

深度學(xué)習(xí)CTR預(yù)估

2024-07-02 09:41:11

2015-12-21 09:39:31

點贊
收藏

51CTO技術(shù)棧公眾號