eBay利用大數(shù)據(jù)促進在線交易
eBay網(wǎng)站有 1.8 億個活躍用戶。在任何一個給定的時刻,都會有 3.5 億左右的商品被銷售。eBay 的拍賣搜索引擎上,每天會產(chǎn)生 2.5 億次搜索。Hugh Williams 說,公司在 Hadoop 集群和 Teradata 服務(wù)器上擁有的原始數(shù)據(jù)是 10 PB。通過對這些數(shù)據(jù)的利用,公司可以提高在線的交易量,引導用戶購買更多商品。
Hugh Williams主要談到了搜索引擎的優(yōu)化。通過對數(shù)據(jù)的分析,公司可以把握用戶的行為模式,從而優(yōu)化搜索結(jié)果。“如果將時間倒退幾年,你使用 eBay 的搜索引擎時,會發(fā)現(xiàn)它只理解字面意思”,Williams說,“你可以在搜索引擎輸入文字,它將按照字面含義尋找,但是并不能真正理解你想法的深層含義”。
現(xiàn)在,eBay要使搜索引擎更加“直覺化”。例入,eBay 發(fā)現(xiàn),那些想要購買 Pilzlampe 的用戶,如果他們輸入了“Pilz lampe“的話,更有可能購買商品,因為搜索引擎會給出更多結(jié)果,因此,搜索引擎通過在單詞中增加一個空格,就可以增加在線交易量。
eBay會根據(jù)自己掌握的信息,改變或重寫用戶的搜索請求,增加同義詞或者替換語句,從而給出更具相關(guān)性的結(jié)果。另外,eBay還通過大數(shù)據(jù)來預測商品是否銷售出去,銷量會是多少,然后調(diào)整商品在搜索引擎上的排名。
Williams說,增加因素來改變搜索結(jié)果是有風險的。公司通常需要幾個月來增加一項因素,而且他們不知道是否真的對用戶有用。為此,eBay會在一小部分用戶那里進行測試,然后觀察他們的反應。
改善搜索引擎的過程中,對用戶搜索請求的情景判斷是一個挑戰(zhàn)。比如用戶在搜索“吉朗貓球隊(Geelong Cats)”的時候,搜索引擎可能會把“貓”做為關(guān)鍵詞,然后搜索寵物這一類別,這對于用戶來說是無用信息。“在我們這樣的大規(guī)模下,會發(fā)生很多微小的問題,因此需要數(shù)據(jù)專家之類的人員來調(diào)查這些事情。”Williams 說。
【編輯推薦】