數(shù)據(jù)科學+造型師,顛覆傳統(tǒng)服裝零售業(yè)購物方式
原創(chuàng)在購物時,你是否有這樣的煩惱:要么不想去逛街,沒那么多時間;要么商場中的衣服雖然很多,但是中意的沒有幾件;又或者干脆選擇在線購物,可以盯著屏幕眼都花了,合心意合身的衣服沒有幾件,而且效果不知如何……
這可怎么辦呢?有沒有一種可以快速購買到合適的衣服的方法呢?
我們生活在互聯(lián)網(wǎng)越來越發(fā)達的今天,很多問題都能夠從計算機,從網(wǎng)絡中,從大量的數(shù)據(jù)信息中找到答案。一家美國的公司Stitch Fix,實現(xiàn)通過數(shù)據(jù)科學和造型師結合來為用戶挑選商品,并送貨到家免費試用。那么,Stitch Fix是如何做到為用戶精準快速的推薦商品的呢?
在WOT2016移動互聯(lián)網(wǎng)技術峰會上,Stitch Fix數(shù)據(jù)科學總監(jiān)/前Twitter美國總部技術主管王建強的精彩演講中,介紹了美國下一代購物方式的領頭羊stitch fix的商業(yè)模式,Stitch fix顛覆傳統(tǒng)服裝零售業(yè)固有的實體店經營的模式,剔除購物中用戶往往最頭疼的”選擇難”的環(huán)節(jié)。
【講師簡介】
Stitch Fix數(shù)據(jù)科學總監(jiān)/前Twitter美國總部技術主管 王建強
王建強,中科大管理科學學士,2008年獲 Iowa State University統(tǒng)計學博士。曾任科羅拉多州立大學(Colorado State University)統(tǒng)計系客座教授,美國國家統(tǒng)計院(National Institute of Statistical Sciences)和美國農業(yè)部的聯(lián)合培養(yǎng)的博士后,惠普研究院(Hewlett-Packard Labs)擔任高級科學家,推特廣告組數(shù)據(jù)科學家。現(xiàn)任stitch fix數(shù)據(jù)科學總監(jiān)。有多年數(shù)據(jù)分析及建模經驗,涉及領域有需求預測,供應鏈管理,廣告點擊率預測,廣告排序,推薦算法,統(tǒng)計預測模型。對數(shù)據(jù)科學教育,互聯(lián)網(wǎng)廣告和新興的零售業(yè)模式有興趣。
通過Stitch Fix的商業(yè)模式看下一代購物方式
2010年10月,Katrina Lake創(chuàng)辦了Stitch Fix。Stitch Fix是一個在線個性化服裝推薦公司,目前擁有上千位業(yè)余造型師,他們一般都有比較豐富的時尚界工作經驗,為用戶量身打造衣服。目前,Stitch Fix的產品主要是服裝類的,除了衣服還有飾品,最近又新增了女鞋和孕婦裝以及超小號。未來,Stitch Fix還將增加男裝。
Stitch Fix的工作模式是怎樣的呢?作為一名新客戶,注冊時要填寫個人資料,主要包括:身材、買衣服的顏色偏好、喜歡衣服的種類、以及所能承受的衣服的價位。Stitch Fix根據(jù)這些資料,通過推薦算法與造型師結合的方式,幫用戶挑選五件衣服,并將衣服寄往用戶家里,用戶可以試穿后決定買哪些衣服,免費退回哪些衣服。Stitch Fix主要面對的客戶群主要為沒有時間購物的用戶,喜歡新樣式的衣服的用戶,以及追求時尚的人群。
這里有兩大創(chuàng)新:一是,通過基于推薦的電子商務,購物時無需自己瀏覽挑選衣服。而僅需填寫一份資料,Stitch Fix就能自動為您挑選衣服。二是,Stitch Fix在提供服務的時候是通過數(shù)據(jù)科學或者推薦算法跟造型師結合的方式。
Stitch Fix的四大服務方式
Stitch Fix目前提供的服務方式主要有四大類:訂閱式服務、及時請求服務、基于造型師與用戶關系的服務以及延遲性服務。最普通的服務模式是訂閱式服務和及時請求服務兩種方式。用戶選擇訂閱式服務后,用戶可以每個月或者每個季度收到一盒衣服;選擇及時請求服務,需要先注冊個人資料,有需求時發(fā)送請求即可。
此外,Stitch Fix對于基于關系的和有延遲的兩種服務。Stitch Fix主要是想致力于做基于造型師與用戶關系的服務,通過用戶跟造型師建立依賴關系,可以更新對用戶的了解,以此增強用戶的粘度。而延遲性服務是指接收到用戶請求后,經過造型師推薦、倉庫管理,訂單配送等環(huán)節(jié)后,約7-10天后將衣服送至 用戶手中。用戶在service的時候需要交20塊錢styling fee,如果不買任何衣服就要支付20塊錢styling fee,如果是買一件以上衣服這20塊錢styling fee可以付到衣服里面,另外如果五件衣服全買有七五折。
如何通過數(shù)據(jù)科學和造型師結合來為用戶挑選衣服?
第一步:根據(jù)用戶提供的信息進行首輪篩選,剔除用戶不喜歡的顏色,不喜歡的樣式,最終符合每個用戶需求的衣服大概5000-7000件。
第二步:根據(jù)算法進行篩選推薦,挑選一批匹配度較高的衣服,約為50-100件。
第三步:將第二步中篩選出的衣服交給造型師,由造型師進行精細的篩選。
我們這里首先著重說說算法推薦,算法推薦的本質是一個計算用戶和衣服匹配的過程。通過用戶數(shù)據(jù)以及商品數(shù)據(jù),對每個用戶和每件商品計算匹配度。
用戶數(shù)據(jù):主要包含結構化數(shù)據(jù)和非結構化數(shù)據(jù)。結構化數(shù)據(jù)是指靜態(tài)的用戶數(shù)據(jù)和用戶行為數(shù)據(jù),非結構化數(shù)據(jù)是指用戶填寫請求,填寫的商品評價等信息。
商品數(shù)據(jù):對于衣服來說,主要對其進行特征分類。常見的特征主要包含三類,分別是:衣服的顏色,衣服的圖案,衣服的材質。其他的特征包含:是否有口袋,口袋的位置,真口袋/假口袋等等。
有了用戶數(shù)據(jù)和商品數(shù)據(jù),通過推薦系統(tǒng)來實現(xiàn)推薦商品的功能。這里常見的算法有:邏輯回歸、Elastic net、協(xié)同濾波、Factorization machine、LDA(Latent Dirichlet Allocation),NLP和computer vision等。
那么,如何計算用戶和衣服的匹配度呢?
因為用戶數(shù)據(jù)中包含用戶請求等非結構化數(shù)據(jù),對于這些數(shù)據(jù)的處理離不開人,因為在這方面人遠強于機器。所以,Stitch Fix設計了人機交互系統(tǒng)。在這個系統(tǒng)里是靠推薦算法跟造型師結合起來進行推薦的,算法有比較強的計算能力。有一個用戶Style rainbow,有一個商品Style rainbow,比如要算這兩個rainbow之間的預先距離,普通人是很難在短時間內算出這兩個rainbow之間的預先距離,但是計算機可以很容易做到。另外,造型師在推薦的時候一般會看之前給用戶推薦過哪些衣服,盡量避開跟以前衣服比較類似的。所以,這時可以用計算機來實現(xiàn),篩選掉一些跟過去推薦的非常類似的衣服。
另外,算法還可以從大規(guī)模數(shù)據(jù)中尋找規(guī)律。比如針對某個年齡層,某個收入階層的用戶,他們一般喜歡什么樣的風格,而這個造型師雖然可能會有一些直覺,但是他的直覺不一定是有數(shù)據(jù)支撐的。所以,在有了數(shù)據(jù)跟算法后,可以糾正他一些直覺上的錯誤。這些有經驗的造型師會根據(jù)直覺進行推薦,例如他看到30歲的用戶住在MN,身材尺寸是多少,他腦袋里面就會浮現(xiàn)出一幅圖,可以立馬想到庫存里面的一些衣服,可能會跟這個用戶比較匹配,這方面其實是個人的一些直覺,這個很難用一些簡單的model來model。另外,造型師也可以與用戶建立個人關系,增加用戶的黏性。
注:本文由王建強于2016年8月,在WOT2016移動互聯(lián)網(wǎng)技術峰會主會場《Stitch Fix -- 數(shù)據(jù)科學+造型師顛覆傳統(tǒng)服裝零售業(yè)購物方式》主題演講整理而成。WOT2016大數(shù)據(jù)峰會將于2016年11月25-26日在北京粵財JW萬豪酒店召開,屆時,數(shù)十位大數(shù)據(jù)領域一線專家、數(shù)據(jù)技術先行者將齊聚現(xiàn)場,在圍繞機器學習、實時計算、系統(tǒng)架構、NoSQL技術實踐等前沿技術話題展開深度交流和溝通探討的同時,分享大數(shù)據(jù)領域最新實踐和最熱門的行業(yè)應用。了解WOT2016大數(shù)據(jù)技術峰會更多信息,請登陸大會官網(wǎng):http://wot.51cto.com/2016bigdata/