自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

ADC現(xiàn)場報道:個性化搜索 挖掘用戶群體特性和購物傾向

原創(chuàng)
開發(fā)
這次是來自于一淘的技術(shù)專家陳曦(公達)給我們帶來的課題:個性化搜索和應用,主要是挖掘用戶的群體特性和購物傾向。建立一整套以數(shù)據(jù)驅(qū)動,合理的個性化特征體系和優(yōu)化目標的個性化模型。解決個性化搜索中面臨的一些重要問題:搜索結(jié)果的多樣性,防止過度個性化。介紹個性化模型的算法、系統(tǒng)和可視化數(shù)據(jù)分析工具。

【51CTO特約報道】2013年7月13-14日, 由阿里巴巴集團主辦的ADC•阿里技術(shù)嘉年華將在杭州海外海國際會展中心舉行,2011年舉辦首屆,今年是第三屆,已發(fā)展為互聯(lián)網(wǎng)行業(yè)最開放、最實戰(zhàn)派的技術(shù)交流盛會之一。被大家視為碼農(nóng)典范的技術(shù)大神MySQl的創(chuàng)始人Michael Widenius,將作為嘉賓現(xiàn)場分享。

本屆嘉年華設置了大數(shù)據(jù)技術(shù)與應用、無線技術(shù)、業(yè)務架構(gòu)&后端技術(shù)、前端技術(shù)、搜索、廣告、體驗設計、互聯(lián)網(wǎng)測試、系統(tǒng)開發(fā)和運維等九大分場,共有80多個主題,其中包括了阿里巴巴、騰訊、百度及更多知名的互聯(lián)網(wǎng)公司的在實踐中積累起來的技術(shù)經(jīng)驗。比如阿里巴巴的去IOE、新浪微博的系統(tǒng)穩(wěn)定性等主題都反映了業(yè)界的主流的工程技術(shù)方向。

 

這次是來自于一淘的技術(shù)專家陳曦(公達)給我們帶來的課題:個性化搜索和應用,主要是挖掘用戶的群體特性和購物傾向。建立一整套以數(shù)據(jù)驅(qū)動,合理的個性化特征體系和優(yōu)化目標的個性化模型。解決個性化搜索中面臨的一些重要問題:搜索結(jié)果的多樣性,防止過度個性化。介紹個性化模型的算法、系統(tǒng)和可視化數(shù)據(jù)分析工具。

[[77311]] 

在演講過程中,公達給大家介紹了為什么要做個性化搜索。首先是解決長尾需求,實現(xiàn)搜索結(jié)果多樣性,再者就是滿足用戶隱含購物需求,縮短購物路徑。所以,在我們購買T恤通過——T恤 女——T恤 女 甜美——T恤 女 甜美[50~100]這樣的一個過程。

那么在什么時候我們才需要個性化呢?公達給我們一個用戶意圖分析模型來說明這個問題。

 

個性化搜索會針對用戶的行為推薦,比如對于高檔購買力的人和低檔購買力的人推薦展示結(jié)構(gòu)是不一樣的。

個性化搜索系統(tǒng)主要是通過搜索基礎數(shù)據(jù),比如商品,用戶以及Query來通過離線計算,這里又包括了全量數(shù)據(jù)處理,實時數(shù)據(jù)處理通過用戶數(shù)據(jù)引擎和Query處理引擎發(fā)送到前端,當然也可以通過商品搜索引擎直接推送到前端。

 

公達還給出了一個購買力模型,主要是包括:類目價格分檔、根據(jù)用戶(購買,收藏,點擊)寶貝的架構(gòu)來計算用戶+類目的購買力;利用;還有一個是利用協(xié)同過濾的思想,補充沒行為的用戶+類目的購買力。下面給出一個小編看不懂的模型:

[[77312]] 

個性化搜索還有個關(guān)鍵詞偏好,一淘通過用戶點擊,購買,成交,收藏的商品標題挖掘用戶所關(guān)注的語意單元的信息。這里公達給大家提供了官方思路:基于歷史商品標題分詞粒度的TF-IDF統(tǒng)計模式。那么這樣問題在哪里呢?第一,粒度太細,用戶在單個詞上難有長期偏好,第二,詞太多,存儲空間大;第三,頁面展示效果較凌亂。還有一個思路就是建立基于<user-商品>原始統(tǒng)計為基礎的topic model的解決方案。

下面淘寶還分析了用戶數(shù)據(jù),主要是購買力和年齡的分布情況。

 

責任編輯:林師授 來源: 51CTO
相關(guān)推薦

2013-07-14 13:21:46

去IOE數(shù)據(jù)庫ADC

2013-07-14 13:59:25

計算密集應用性能天花板性能優(yōu)化

2013-07-14 17:05:49

2012-12-06 10:32:41

TechEd2013

2011-12-12 19:45:19

IBM

2011-11-15 18:12:37

CA

2009-11-03 12:00:56

IOD信息隨需應變db2

2017-02-13 20:36:14

群體畫像用戶數(shù)據(jù)

2014-06-03 17:11:39

FM數(shù)據(jù)挖掘數(shù)據(jù)處理

2011-03-17 11:02:24

日本地震

2013-04-11 15:18:18

IBM軟件集團

2009-11-19 09:30:14

IBMPower動態(tài)架構(gòu)

2014-01-08 14:42:47

CES

2010-05-11 23:38:38

BPMIMPACT2010SmartWork

2010-09-01 08:57:06

VMwareIT即服務

2022-11-01 07:19:45

推薦系統(tǒng)非個性化

2009-07-13 15:33:24

桌面虛擬化虛擬化IT

2011-10-25 15:06:30

CitrixSynergy2011Barcelona

2011-11-07 12:34:48

Windows 8特性

2020-06-28 07:00:00

推薦系統(tǒng)智能商務服務平臺
點贊
收藏

51CTO技術(shù)棧公眾號