阿里的野心:大數(shù)據(jù)搬家記
高空任務(wù)
自曝其短、奮起補(bǔ)課的事兒還是靜悄悄地進(jìn)行。
當(dāng)攝像師不斷變換機(jī)位尋找最佳視角拍攝時(shí),潘寶坤有點(diǎn)憤怒了。“你們出去!別拍了!等我們做好再回來(lái)!”他吼道。
這一幕發(fā)生在1月13日晚,在阿里巴巴杭州西溪園區(qū),一個(gè)被稱為“DNA項(xiàng)目”的秘密計(jì)劃正進(jìn)入最關(guān)鍵的時(shí)刻。為了記錄關(guān)鍵的場(chǎng)景,阿里專門安排了攝像師跟拍了整個(gè)項(xiàng)目的關(guān)鍵環(huán)節(jié)。偏偏在這個(gè)時(shí)候,技術(shù)后臺(tái)的代碼出了點(diǎn)狀況,人人都急出一身冷汗。潘寶坤是當(dāng)晚技術(shù)團(tuán)隊(duì)的一員。
DNA項(xiàng)目的核心是阿里C2C和B2C兩大電商交易平臺(tái)淘寶、天貓對(duì)商品SKU(商品統(tǒng)一編號(hào))的底層技術(shù)架構(gòu)更新。它在天貓對(duì)商品類目信息重新梳理的“達(dá)爾文計(jì)劃”的基礎(chǔ)上延展而來(lái)。如果說(shuō)達(dá)爾文計(jì)劃是一顆蘋果,DNA項(xiàng)目則是一棵蘋果樹(shù),是阿里電商生態(tài)系統(tǒng)的生命之樹(shù)。阿里集團(tuán)IPO代號(hào)不是叫“阿凡達(dá)”(Avatar)嗎?如果不做達(dá)爾文計(jì)劃和DNA項(xiàng)目,它是不可能成為智慧星球的,馬云的外號(hào)“外星人”也將名不符實(shí)。
大數(shù)據(jù)(Big Data)革命在美國(guó)有幾種典型表現(xiàn):亞馬遜有個(gè)性化搜索A9,A即算法(Algorithms)的縮寫。Netflix有76897種電影分類,內(nèi)部叫“量子論”、“微標(biāo)簽”。Facebook有新聞收集系統(tǒng)。潘多拉電臺(tái)有音樂(lè)基因工程。算法是一種神奇的掌握人類消費(fèi)行為和內(nèi)心活動(dòng)的系統(tǒng),如何將人工分類與機(jī)器智能推薦相結(jié)合,一直是互聯(lián)網(wǎng)頂級(jí)之戰(zhàn)。
簡(jiǎn)單理解,每個(gè)超市都有很多貨架,商品分門別類擺放,如果標(biāo)簽混亂、指向不清,會(huì)影響銷售效率和購(gòu)物體驗(yàn)。而作為中國(guó)最大的網(wǎng)上商店,淘寶從2004年5月誕生起,平臺(tái)上的每一款商品都有一個(gè)特定數(shù)字代碼,2008年在淘寶內(nèi)部培育的天貓延續(xù)了這種技術(shù)架構(gòu),十年積累,阿里電商體系里的商品已經(jīng)超過(guò)了20億。與此同時(shí),商品信息的混亂、冗余、不規(guī)范越來(lái)越明顯。
一個(gè)典型的例子:在蘋果公司尚未推出iPhone 5c之前,淘寶上居然有人賣綠色版iPhone,“這讓人哭笑不得,傷害了淘寶系多年建立起來(lái)的信任度。”阿里巴巴共享事業(yè)群副總裁王曦若對(duì)記者說(shuō)。
與美國(guó)的eBay、亞馬遜相比,淘寶的商品類目基礎(chǔ)架構(gòu)和分類管理不是一開(kāi)始就標(biāo)準(zhǔn)化的,部分SKU的屬性值(如規(guī)格、型號(hào)、顏色、尺碼等)可以由賣家自定義編輯,難免會(huì)亂七八糟、混淆用戶、甚至發(fā)生SKU作弊行為(比如將常規(guī)商品和配件輔料、瑕疵品等放在一個(gè)寶貝鏈接里出售)。
對(duì)于淘寶、天貓來(lái)說(shuō),商品信息數(shù)據(jù)系統(tǒng)就像基因之于細(xì)胞那么重要,它決定著所有線上交易的進(jìn)化程度:如果類目規(guī)范整齊,交易就簡(jiǎn)單快捷高效,進(jìn)而推動(dòng)自我革新;如果系統(tǒng)雜亂無(wú)章,玩不了算法和個(gè)性化,影響用戶體驗(yàn),甚至給阿里自身拖后腿。今年3月,馬云內(nèi)部郵件稱:云和端(Cloud +App)將是未來(lái)移動(dòng)互聯(lián)網(wǎng)的關(guān)鍵,阿里十年的目標(biāo)是建立DT(Data Technology),數(shù)據(jù)時(shí)代中國(guó)商業(yè)發(fā)展的基礎(chǔ)設(shè)施。
王曦若將阿里從達(dá)爾文計(jì)劃到DNA項(xiàng)目的最后一步操作稱為“在飛行著的飛機(jī)上換引擎”,來(lái)形容重整商品類目的風(fēng)險(xiǎn)之高和壓力之大。她是DNA項(xiàng)目的總負(fù)責(zé)人,帶領(lǐng)一個(gè)近百人的團(tuán)隊(duì)。
整個(gè)項(xiàng)目的關(guān)鍵是底層后臺(tái)的數(shù)據(jù)遷移,他們需要將阿里商品信息開(kāi)發(fā)團(tuán)隊(duì)做好的全新模型,鏈接到無(wú)時(shí)無(wú)刻不在使用的淘寶、天貓平臺(tái)上。而所有這一切,得穩(wěn)定平滑過(guò)渡,不能驚擾賣家和用戶。
商品信息“進(jìn)化”
瘦死的駱駝比馬大。阿里后臺(tái)“病了”,商品類目信息出現(xiàn)了“病菌”,但它仍然是中國(guó)最大的電商平臺(tái),以沃爾瑪+亞馬遜的模式,以電商、金融和數(shù)據(jù)平臺(tái)在中國(guó)經(jīng)濟(jì)扮演著重要的角色。
阿里用來(lái)整理和存儲(chǔ)商品信息的系統(tǒng)是一個(gè)樹(shù)狀結(jié)構(gòu),在內(nèi)部叫“類目”。作為第三方交易平臺(tái),阿里把商品分成70多個(gè)大類,在每一個(gè)大類下分出很多子類目,子類目下又有一層層的分類。就像一顆枝繁葉茂的大樹(shù),在樹(shù)干分出很多枝椏后,葉子已經(jīng)難以計(jì)數(shù)。
沒(méi)人否認(rèn)這套系統(tǒng)的重要性,但即便在阿里內(nèi)部,對(duì)它有了解的人也不多,因?yàn)樗诩夹g(shù)底層,不直接影響前端交易,不像阿里每年雙11的創(chuàng)紀(jì)錄銷售額那樣吸引普通人的目光。
每年雙11交易額都刷新紀(jì)錄的天貓,是阿里集團(tuán)最先推行“達(dá)爾文進(jìn)化論”的部門。2012年5月,天貓更名剛剛4個(gè)多月,就被發(fā)現(xiàn)有了“病癥”。技術(shù)人員通過(guò)后臺(tái)看到,越來(lái)越多的買家留言說(shuō)很難在天貓上找到自己最初想要的商品,無(wú)論通過(guò)類目(比如服飾、電器、化妝品)還是搜索——這是天貓商品的兩大流量入口。要么指向不精準(zhǔn),要么信息過(guò)于龐雜,你需要手動(dòng)翻閱好幾頁(yè)信息頁(yè)面。
對(duì)于剛剛打響名號(hào)的天貓來(lái)說(shuō),這并不是件可以忽略不計(jì)的小事。馬云對(duì)天貓的期許是,專注做B2C業(yè)務(wù)的天貓就像挺進(jìn)大別山的劉鄧大軍,是整個(gè)阿里集團(tuán)在B2C領(lǐng)域的正面作戰(zhàn)部隊(duì)。“B2C是比C2C更高級(jí)的一種零售業(yè)態(tài)。”原淘寶商城總經(jīng)理、獨(dú)立電商分析師黃若告訴記者,B2C平臺(tái)應(yīng)該是一個(gè)Shopping Mall,商品豐富而正規(guī),信息透明而規(guī)范。
電商發(fā)展早期,商品與信息組合的重要性被忽視。億歐網(wǎng)聯(lián)合創(chuàng)始人、電商分析師黃淵普對(duì)記者說(shuō),隨著商品數(shù)量增加,其組合方式是電商精細(xì)化運(yùn)營(yíng)最重要的體現(xiàn)之一。同樣的商品有多種信息描述,既浪費(fèi)各方資源,很多時(shí)候也助長(zhǎng)了商品的不實(shí)宣傳。電商平臺(tái)方有必要把類目規(guī)范化,這是電商購(gòu)物回歸產(chǎn)品本身,促進(jìn)公平競(jìng)爭(zhēng)的必然措施。
王曦若著手讓團(tuán)隊(duì)一點(diǎn)點(diǎn)去核查,試圖厘清到底是哪個(gè)環(huán)節(jié)出了問(wèn)題,最終商品信息的不確定性被定性為核心問(wèn)題。他們發(fā)現(xiàn),即便是在天貓上,同一款商品的信息也未必相同,比如一款綠色的保溫杯,有的賣家描述為“淡綠色塑料保溫杯”,有的則是“淺綠色塑膠保溫杯”。
“某種程度上,天貓已經(jīng)不像個(gè)Shopping Mall了。”王曦若說(shuō)。天貓的商品信息延續(xù)了淘寶的風(fēng)格,由賣家填寫,天貓只負(fù)責(zé)簡(jiǎn)單審核(商品基本屬性準(zhǔn)確以及符合法律法規(guī)),這就造成了商品描述五花八門,在后臺(tái)的“倉(cāng)庫(kù)”不便管理,前端“柜臺(tái)”信息混亂,買家找不到想要的商品,賣家銷售庫(kù)存管理日益繁雜。
王曦若把問(wèn)題報(bào)告給時(shí)任天貓總裁張勇。張勇在高層會(huì)上說(shuō),一定要把問(wèn)題盡快解決掉。他們花了幾個(gè)月調(diào)研討論,張勇拍板決定啟動(dòng)信息重整項(xiàng)目,但當(dāng)時(shí)還沒(méi)起名字。“要不就叫達(dá)爾文計(jì)劃,代表著我們商品信息的一種進(jìn)化?”王曦若的提議得到贊同。
阿里共享事業(yè)部派出了兩個(gè)團(tuán)隊(duì)負(fù)責(zé)達(dá)爾文計(jì)劃的運(yùn)作。天貓產(chǎn)品部的何家瓊被抽離出來(lái),組織了一個(gè)10人團(tuán)隊(duì),叫“達(dá)爾文基礎(chǔ)運(yùn)營(yíng)團(tuán)隊(duì)”。2012年8月,他們從手機(jī)和化妝品兩種相對(duì)簡(jiǎn)單的商品開(kāi)始,正式啟動(dòng)達(dá)爾文計(jì)劃。
從天貓開(kāi)始
習(xí)慣一旦養(yǎng)成很難改變,更何況你動(dòng)的是利益。阿里先在天貓而不是在淘寶做商品類目重整,就考慮到它平臺(tái)上大多是知名品牌入駐,調(diào)整和規(guī)范的成本相對(duì)低,不至于擾亂淘寶的賣家信息海洋。
2012年8月,在天貓的后臺(tái)系統(tǒng),手機(jī)和化妝品賣家都看到了一則關(guān)于達(dá)爾文計(jì)劃的公告,詳情及需要賣家怎樣配合。如同總裁張勇謹(jǐn)慎的行事風(fēng)格,天貓?jiān)擁?xiàng)目運(yùn)作也小心翼翼。運(yùn)營(yíng)團(tuán)隊(duì)先進(jìn)行調(diào)研,一是對(duì)淘寶天貓賣家和買家數(shù)據(jù)收集,內(nèi)部也與阿里負(fù)責(zé)類目的管理者(俗稱“小二”)溝通,二是向國(guó)外同行亞馬遜和eBay學(xué)習(xí),三是對(duì)淘寶十年來(lái)經(jīng)驗(yàn)總結(jié)。
聞思圖書專營(yíng)店店主溫興歌曾經(jīng)為這樣的問(wèn)題糾結(jié):某一本書的內(nèi)容既涉及商業(yè)故事,也屬于旅行見(jiàn)聞,到底放在商業(yè)子類目下好賣,還是放在旅游子類目下更好賣?達(dá)爾文團(tuán)隊(duì)圍繞一個(gè)基礎(chǔ)的問(wèn)題開(kāi)展:某個(gè)商品的類目理想中應(yīng)該是什么樣子的。他們討論這些差別,一步步涉及到最基礎(chǔ)最瑣碎的問(wèn)題:為什么商家會(huì)放錯(cuò)類目?商家什么情況下會(huì)設(shè)置錯(cuò)的關(guān)鍵字?每個(gè)商品的顏色、尺碼、款式都用一串獨(dú)立的數(shù)字來(lái)表示,為什么還信息混亂?……
天貓的運(yùn)營(yíng)團(tuán)隊(duì)給平臺(tái)上手機(jī)和化妝品類目的前10名賣家打電話,介紹正在進(jìn)行中的達(dá)爾文計(jì)劃,征得對(duì)方同意后,拋出一系列問(wèn)題:商品的材質(zhì)是什么?一共有幾個(gè)型號(hào)?多少種顏色?一般每個(gè)月生產(chǎn)多少銷售多少?放在天貓倉(cāng)庫(kù)又有多少?……“這些看似不太相關(guān)的問(wèn)題,命中的才是商品最核心的信息。”何家瓊說(shuō),商品信息最終是為交易服務(wù)。
第一輪商家調(diào)研完成后,天貓團(tuán)隊(duì)坐在一起總結(jié),得出一個(gè)令他們震撼的結(jié)論:天貓的類目結(jié)構(gòu)已經(jīng)遠(yuǎn)遠(yuǎn)不能滿足行業(yè)的發(fā)展?fàn)顩r了,很多商品早就更新?lián)Q代,或者豐富了款式型號(hào),類目卻還是2008年最初建成的樣子。
他們一鼓作氣開(kāi)了賣家溝通會(huì)。2013年初,溫興歌從浙江金華趕到杭州,在位于西湖國(guó)際大廈的天貓辦公室參加了圖書類目的賣家溝通會(huì)。會(huì)場(chǎng)有20多個(gè)圖書經(jīng)銷同行,一個(gè)天貓圖書小二,一個(gè)達(dá)爾文基礎(chǔ)運(yùn)營(yíng)團(tuán)隊(duì)成員,一個(gè)記錄員。“討論的話題是以后我們?cè)趺刺顚憟D書信息。”溫興歌說(shuō)。以前都是賣家自由填寫,天貓簡(jiǎn)單審核即可。現(xiàn)在天貓?zhí)岢鏊麄儠?huì)為每一類商品設(shè)置多種屬性,讓賣家進(jìn)行選擇而不是自由填寫,比如給名人傳記設(shè)置框架,中國(guó)的還是外國(guó)的,男人還是女人,政治的還是商業(yè)等,賣家在選項(xiàng)里勾一下就行。
因?yàn)檫@涉及到未來(lái)自家店鋪的生意,賣家們都暢所欲言,提出種種可能的困難或建議方案。他們也反駁天貓的某些做法。“套裝書”就曾陷入討論僵局。天貓認(rèn)為有統(tǒng)一條形碼、版權(quán)頁(yè)上印著叢書名的系列書才算套裝書,賣家們則堅(jiān)持可以自由搭配,把兩三本好看的書組合在一起就行,無(wú)需考慮是否同一出版社、條形碼或系列叢書。溫興歌把不同出版社出的《育兒圣經(jīng)》和《睡前胎教故事》組成套裝賣后,兩本書銷量都比以往增加近30%。
溝通會(huì)效果明顯。天貓圖書的子類目調(diào)整成既有天貓定義的套裝書,也有賣家自由搭配的“自由組套”。畢竟天貓是個(gè)交易平臺(tái),達(dá)爾文計(jì)劃在規(guī)范商品信息的同時(shí)是為了提升交易效率和品質(zhì)。這種既要規(guī)范有序、又不影響交易銷量的做法,在其他類目后來(lái)的操作中也不時(shí)出現(xiàn)。
王強(qiáng)在天貓經(jīng)營(yíng)一家海爾授權(quán)網(wǎng)絡(luò)店,是最早參加達(dá)爾文計(jì)劃試點(diǎn)的商家之一。比起以前上架新商品需要自己費(fèi)盡心思去填寫商品描述信息,現(xiàn)在從天貓的庫(kù)中直接調(diào)用,“我只要填價(jià)格、庫(kù)存數(shù)量等信息就可以了,對(duì)天貓店的維護(hù)更簡(jiǎn)易了。”
但由于品牌賣家的定位營(yíng)銷策略不同,他們對(duì)達(dá)爾文計(jì)劃反應(yīng)也不一致。何家瓊就遇到一個(gè)問(wèn)題,耐克和阿迪達(dá)斯對(duì)天貓商品描述的要求有不同意見(jiàn):在耐克的商品描述中,一個(gè)商品下面既有尺碼選項(xiàng)也有顏色選項(xiàng),而阿迪達(dá)斯的只有尺碼選項(xiàng),如果要標(biāo)識(shí)顏色,代表商品屬性的是另外一串?dāng)?shù)字。
“這背后有銷量的博弈。”何家瓊說(shuō),在淘寶天貓的搜索因素中,銷量占很大權(quán)重,核心表現(xiàn)就是按照商品的銷量自動(dòng)排序。以慢跑鞋為例,耐克慢跑鞋的銷量是其各種顏色之和,阿迪達(dá)斯慢跑鞋則是按紅色、藍(lán)色、紫色等不同銷量各自呈現(xiàn)。在阿里平臺(tái)有個(gè)現(xiàn)象:用戶搜索“慢跑鞋”時(shí),耐克因其銷量高出現(xiàn)在較為靠前的頁(yè)面,阿迪達(dá)斯則會(huì)靠后。
兩個(gè)品牌都是天貓的重要賣家,何家瓊不敢掉以輕心,親自給對(duì)方負(fù)責(zé)人及前5名的專營(yíng)店賣家打電話溝通。耐克希望達(dá)爾文計(jì)劃繼續(xù)保持原來(lái)的商品描述方式,阿迪達(dá)斯則分成兩派,官方旗艦店希望商品描述和阿迪達(dá)斯官網(wǎng)保持一致,不同顏色的商品有不同的屬性值;專營(yíng)店賣家考慮銷量,希望取消顏色屬性值,讓買家在統(tǒng)一款號(hào)的商品下自行選擇顏色。
目前,達(dá)爾文團(tuán)隊(duì)還沒(méi)想到合適的方案來(lái)解決這個(gè)問(wèn)題。何家瓊的設(shè)想是,對(duì)于服裝服飾等非標(biāo)準(zhǔn)化商品(非標(biāo)品),也許可以放開(kāi)一些彈性空間,天貓負(fù)責(zé)較大比例的類目管理,賣家根據(jù)自身情況進(jìn)行個(gè)性化類目描述。耐克和阿迪達(dá)斯兩家天貓旗艦店負(fù)責(zé)人拒絕就此發(fā)表意見(jiàn)。
改變搜索邏輯
2013年,天貓陸續(xù)完成了對(duì)數(shù)碼、家電、手表等標(biāo)品,服裝、化妝品、農(nóng)產(chǎn)品等非標(biāo)品的類目重新調(diào)整。
普通用戶感受到的是在天貓購(gòu)物更快速準(zhǔn)確了。王曦若說(shuō),“如果用戶的搜索信息足夠明確,我們甚至能提供唯一符合要求的商品。比如輸入iPhone 5s,搜索頁(yè)面中心只會(huì)出現(xiàn)一款手機(jī),不再有手機(jī)殼、配件等無(wú)關(guān)信息,為用戶們節(jié)省大量時(shí)間。”
如此精準(zhǔn)的推送來(lái)自天貓搜索系統(tǒng)的一套數(shù)據(jù)算法。當(dāng)用戶輸入iPhone 5s時(shí),搜索后臺(tái)會(huì)找到天貓賣家所有的iPhone 5s手機(jī),根據(jù)銷量、人氣、價(jià)格、顧客評(píng)價(jià)等算出綜合得分最好的一個(gè),系統(tǒng)再次評(píng)估后推送給用戶。這是一套相對(duì)公平的算法,面向所有賣家和用戶。
在類目之外,搜索是天貓最大的流量入口。過(guò)去5年,天貓搜索依賴的是模糊詞匯,“你輸入一個(gè)關(guān)鍵詞,后臺(tái)系統(tǒng)會(huì)幫忙匹配很多商品,只要這些商品的標(biāo)簽中含有這個(gè)關(guān)鍵詞。”天貓產(chǎn)品運(yùn)營(yíng)部產(chǎn)品總監(jiān)胡秋根對(duì)記者說(shuō)。他是天貓搜索業(yè)務(wù)的負(fù)責(zé)人,在達(dá)爾文計(jì)劃運(yùn)作過(guò)程中,搜索也配合商品信息的改變有了突破。
模糊詞匯匹配的好處不言而喻:盡可能“一網(wǎng)打盡”把相關(guān)的商品展示給用戶。“余杭區(qū)的馬小姐想找一件真絲無(wú)袖連衣裙,理論上她只要輸入這7個(gè)字,不管翻多少頁(yè),她都能從中找到自己想找的那一件。”胡秋根說(shuō)。
這其實(shí)是歷史遺留問(wèn)題,跟天貓前期商品信息的模糊混亂息息相關(guān)。達(dá)爾文計(jì)劃使天貓補(bǔ)上了商品類目規(guī)范和升級(jí)的課,阿里愈加在大數(shù)據(jù)應(yīng)用上領(lǐng)先京東、當(dāng)當(dāng)、蘇寧等競(jìng)爭(zhēng)對(duì)手(這三家拒絕接受采訪)。如今在天貓,你搜索一件商品,其展示結(jié)果從原來(lái)的成百上千件,變?yōu)榫酆铣纱_定的一件或幾件。
“搜索邏輯的變化對(duì)賣家影響很大,讓很多賣家改變了運(yùn)營(yíng)邏輯。”以前很多賣家為了銷量,會(huì)為商品添加很多標(biāo)簽,現(xiàn)在天貓更青睞推送信息精準(zhǔn)的優(yōu)質(zhì)商品,賣家們盡力運(yùn)營(yíng)好某一款或幾款主打商品。“爆款”在天貓將成為過(guò)去時(shí)。天貓搜索不再推送多種同款商品給用戶,達(dá)不到賣家們跟風(fēng)的效果。胡秋根說(shuō),“這也更加符合天貓的定位,這個(gè)平臺(tái)的核心競(jìng)爭(zhēng)力是品牌,而不是只以銷量取勝。”
“釜底抽薪”
當(dāng)達(dá)爾文計(jì)劃逐漸開(kāi)花結(jié)果時(shí),一項(xiàng)更有價(jià)值、同時(shí)也更有難度的項(xiàng)目也同時(shí)交錯(cuò)在開(kāi)展。它觸及的是整個(gè)阿里電商平臺(tái)的底層數(shù)據(jù),是阿里發(fā)展大數(shù)據(jù)業(yè)務(wù)和未來(lái)DT目標(biāo)的根基。
2013年2月,這個(gè)項(xiàng)目由阿里共享事業(yè)群的商品技術(shù)開(kāi)發(fā)平臺(tái)團(tuán)隊(duì)提出。該平臺(tái)負(fù)責(zé)人趙營(yíng)苗告訴記者,從持續(xù)使用十年的經(jīng)驗(yàn)來(lái)看,淘寶平臺(tái)的“樹(shù)形結(jié)構(gòu)”對(duì)于賣家和買家都簡(jiǎn)單易用,但是隨著環(huán)境變化,越來(lái)越多的新商品出現(xiàn),有的難以歸類,這棵“生命之樹(shù)”不再?gòu)?qiáng)壯如初,“也就是說(shuō),現(xiàn)有的結(jié)構(gòu)類目已經(jīng)跟不上行業(yè)的發(fā)展了,跟時(shí)代比起來(lái)落伍啦。”
阿里運(yùn)營(yíng)部門的梳理結(jié)果更夸張。“除了國(guó)家法律政策規(guī)定不能交易的,槍支彈藥毒品不能賣,在淘寶上,你注冊(cè)個(gè)賣家賬號(hào),什么都可以賣。”DNA項(xiàng)目運(yùn)營(yíng)負(fù)責(zé)人朱春勇說(shuō)。趙營(yíng)苗承認(rèn),“這就是我們的商品數(shù)據(jù)庫(kù)模型出了問(wèn)題,改變迫在眉睫。”
在阿里大數(shù)據(jù)委員會(huì)會(huì)長(zhǎng)車品覺(jué)看來(lái),這不是阿里一家公司的問(wèn)題,整個(gè)電商行業(yè)其實(shí)都存在商品信息管理的難題,在傳統(tǒng)零售行業(yè),這也是至關(guān)重要的一環(huán)。“大數(shù)據(jù)應(yīng)用中最重要的三個(gè)因素是數(shù)據(jù)的可實(shí)時(shí)性、數(shù)據(jù)的可解釋性和數(shù)據(jù)質(zhì)量的準(zhǔn)確穩(wěn)定性。DNA項(xiàng)目涉及的是商品信息的準(zhǔn)確穩(wěn)定性,對(duì)于阿里大數(shù)據(jù)應(yīng)用來(lái)說(shuō)是基礎(chǔ)而且重要的步驟。”
2003年5月,淘寶創(chuàng)立10周年,每個(gè)部門都對(duì)業(yè)務(wù)做了大梳理。歷經(jīng)兩三個(gè)月,商品開(kāi)發(fā)團(tuán)隊(duì)拿出了可行的整體項(xiàng)目方案。他們決定先從手機(jī)、3C產(chǎn)品、數(shù)碼配件、酒類、保健品5個(gè)類目開(kāi)始,“相對(duì)其他要遷移的69類商品來(lái)說(shuō),這些類目商品數(shù)據(jù)相對(duì)標(biāo)準(zhǔn)和規(guī)范。”
但意義如此重大,項(xiàng)目開(kāi)展時(shí)間卻遲遲未定。在阿里內(nèi)部,價(jià)值觀和企業(yè)文化影響每個(gè)員工,“讓天下沒(méi)有難做的生意”是統(tǒng)一口號(hào),但是每個(gè)業(yè)務(wù)線都有自己的業(yè)績(jī)?nèi)蝿?wù),短期內(nèi)并不一定合拍。從一開(kāi)始,DNA項(xiàng)目被各個(gè)部門接受的程度也不一樣。
時(shí)任天貓總裁的張勇看完方案提了兩點(diǎn)意見(jiàn):天貓將支持項(xiàng)目的進(jìn)展,但此項(xiàng)目不能開(kāi)展于2013年11月11日之前。后一條用意很明顯,雙11是天貓最重要的消費(fèi)節(jié)點(diǎn),這一天的交易額代表著阿里交易業(yè)務(wù)甚至中國(guó)電商市場(chǎng)的繁榮程度。萬(wàn)一DNA項(xiàng)目出現(xiàn)任何差錯(cuò),都會(huì)讓這一天的阿里顏面掃地。
時(shí)任淘寶負(fù)責(zé)人張宇也表態(tài)支持項(xiàng)目開(kāi)展,她認(rèn)為此事對(duì)于淘寶系的交易平臺(tái)至關(guān)重要,但有沖突的是,她希望保持淘寶的強(qiáng)勢(shì),比如能夠整理清晰的類目一定要做到規(guī)范標(biāo)準(zhǔn),但對(duì)于暫時(shí)理不清的類目,她希望從淘寶剝離出去的天貓能夠遵循淘寶的規(guī)則。
阿里的搜索、廣告、聚劃算等業(yè)務(wù)部門的意見(jiàn)也各自不同。特別是廣告部門,年底要沖業(yè)績(jī),極力希望大搬家推遲。最終,王曦若和趙營(yíng)苗的團(tuán)隊(duì)用了兩三個(gè)月時(shí)間,說(shuō)服集團(tuán)高層拍板決定2014年初啟動(dòng)DNA項(xiàng)目。
朱春勇帶領(lǐng)的運(yùn)營(yíng)團(tuán)隊(duì)是2013年5月加入DNA項(xiàng)目組的。彼時(shí)移動(dòng)互聯(lián)網(wǎng)船票戰(zhàn)爭(zhēng)奪已經(jīng)火熱,騰訊的微信如日中天。淘寶系的后臺(tái)體系是以PC端為基礎(chǔ)構(gòu)建的,整體結(jié)構(gòu)謹(jǐn)慎安全,但在以輕和快為標(biāo)準(zhǔn)節(jié)奏的移動(dòng)互聯(lián)時(shí)代,它顯得繁瑣和沉重。朱春勇說(shuō),“我們希望未來(lái)淘寶的商品信息架構(gòu)是輕便和靈活的。現(xiàn)在人人都可以是電商賣家,比如我家院子有棵石榴樹(shù),可能就是一瞬間的想法,我用手機(jī)拍下來(lái),發(fā)到淘寶上去賣。”
DNA項(xiàng)目團(tuán)隊(duì)有30多人,分為兩批:一批是對(duì)商品或者賣家比較熟悉的人,及時(shí)和賣家溝通,把商品相關(guān)行業(yè)的現(xiàn)狀和趨勢(shì)摸透,為技術(shù)后臺(tái)重構(gòu)數(shù)據(jù)庫(kù)做準(zhǔn)備;另一批是對(duì)淘寶系產(chǎn)品比較熟悉的人,他們有良好的技術(shù)背景,做過(guò)產(chǎn)品經(jīng)理,能從產(chǎn)品和用戶體驗(yàn)方面對(duì)新的商品數(shù)據(jù)庫(kù)提供意見(jiàn)。
淘寶的類目數(shù)據(jù)梳理也交給了朱春勇的團(tuán)隊(duì)。在看似完備的類目體系上,他們發(fā)現(xiàn)了諸多瑣碎問(wèn)題,比如材質(zhì)為牛皮的商品,有女裝,有男裝,有包,有鞋等,這些類目之下的牛皮屬性值都不一樣,商品數(shù)據(jù)就因此多出幾串不必要的數(shù)字,把整個(gè)商品數(shù)據(jù)庫(kù)撐得龐大冗余。“把這些混亂的數(shù)據(jù)整理出來(lái),在技術(shù)層面是很難實(shí)現(xiàn)的。我們都會(huì)人工去做,人肉輸入和整理。僅僅這項(xiàng)工作,就花費(fèi)了整個(gè)團(tuán)隊(duì)半年多的時(shí)間。”
接下來(lái),他們跟行業(yè)專家交流,還跟商標(biāo)網(wǎng)、國(guó)家物品編碼中心等專業(yè)機(jī)構(gòu)交流,要把淘寶系商品信息做得既有數(shù)據(jù)化屬性,又符合國(guó)家和行業(yè)規(guī)范。賣家的意見(jiàn)也非常重要。每一類的商品信息數(shù)據(jù)化之前,運(yùn)營(yíng)團(tuán)隊(duì)都會(huì)聯(lián)系這類商品賣家集中的區(qū)域,做一兩次集中訪談。
2013年12月25日,圣誕節(jié),阿里西溪園區(qū)布滿圣誕樹(shù)和彩燈,很多員工放假回家過(guò)節(jié),但阿里DNA團(tuán)隊(duì)卻沒(méi)有這項(xiàng)“福利”,DNA項(xiàng)目最后也是最重要的環(huán)節(jié)——更換技術(shù)后臺(tái)將于2014年1月13日晚正式啟動(dòng),他們必須加班加點(diǎn)。
阿里的野心
孔柏漢的神經(jīng)一直處于緊張狀態(tài)。從2013年12月25日開(kāi)始,他所在的小組開(kāi)始負(fù)責(zé)淘寶商品數(shù)據(jù)訂正,也就是把整個(gè)類目的商品屬性值進(jìn)行重新更改和修訂。在操作期間,賣家不能在后臺(tái)發(fā)布或更改商品信息,但買家可以正常交易。然而一旦訂正失誤,整個(gè)類目系統(tǒng)都會(huì)癱瘓。
整個(gè)淘寶系共有20億商品,每個(gè)商品都有自己的獨(dú)立代碼,一旦出現(xiàn)兩種商品代碼一致,可能整個(gè)類目都會(huì)凍結(jié)癱瘓。趙營(yíng)苗說(shuō),如果發(fā)生這種情況,就會(huì)影響到前端用戶的交易,這會(huì)是很嚴(yán)重的事故,必須做好各種預(yù)案,沒(méi)人敢掉以輕心。這不僅僅與阿里整個(gè)平臺(tái)有關(guān),更關(guān)系到數(shù)百萬(wàn)的淘寶系賣家、超過(guò)5億的注冊(cè)用戶,一定不能出問(wèn)題,“一定要把這個(gè)飛機(jī)引擎換好。”
1月13日之前,齊國(guó)梁所在的5人小組負(fù)責(zé)技術(shù)底層風(fēng)險(xiǎn)點(diǎn)的梳理。阿里集團(tuán)涉及交易的20多個(gè)業(yè)務(wù)部門梳理出來(lái)300多個(gè)風(fēng)險(xiǎn)點(diǎn),齊國(guó)梁小組的任務(wù)就是拿出規(guī)避這些風(fēng)險(xiǎn)的預(yù)案。“到了1月13日,我們的風(fēng)險(xiǎn)點(diǎn)梳理工作完成,又立即投入數(shù)據(jù)遷移。”
好在這場(chǎng)不為人知的硬戰(zhàn)順利完成。1月13日到1月30日,歷經(jīng)每晚從7點(diǎn)到次日早晨7點(diǎn)的奮戰(zhàn),手機(jī)、3C等5大類目的數(shù)據(jù)遷移全部完成,而且沒(méi)有一次影響平臺(tái)前端的購(gòu)物交易。阿里的生命之樹(shù)換上了部分新的血液。
2月12日下午,杭州下了2014年的第二場(chǎng)雪,阿里商品開(kāi)發(fā)技術(shù)平臺(tái)團(tuán)隊(duì)所在的5號(hào)樓“九天閣”會(huì)議室,王曦若拍著趙營(yíng)苗的肩膀說(shuō):“哥們,今晚開(kāi)始又是一場(chǎng)硬戰(zhàn),讓兄弟們加油啊!”
12個(gè)日以繼夜的緊張過(guò)后,商品開(kāi)發(fā)技術(shù)平臺(tái)團(tuán)隊(duì)終于松了口氣。趙營(yíng)苗站在DNA項(xiàng)目會(huì)議室,對(duì)滿臉倦容的20多個(gè)員工說(shuō):“兄弟們,回家睡覺(jué)吧,我們完工啦!”
至此,淘寶20億商品的信息數(shù)據(jù)遷移全部完成。“從用戶的角度來(lái)說(shuō),這個(gè)項(xiàng)目還暫時(shí)感受不到變化。我們第三個(gè)階段就是修訂子類目,項(xiàng)目完成后,用戶在使用搜索和類目時(shí)就會(huì)有新體驗(yàn),到時(shí)候淘寶商品將一改繁雜混亂的狀態(tài),以一種相對(duì)整齊、規(guī)范、清新的姿態(tài)出現(xiàn)在用戶面前。”趙營(yíng)苗說(shuō)。
阿里并不止于做達(dá)爾文計(jì)劃和DNA項(xiàng)目,更有野心打造整個(gè)中國(guó)電商行業(yè)的標(biāo)準(zhǔn)商品體系,甚至有一天淘寶天貓的商品信息庫(kù)不僅服務(wù)于自身,也可以服務(wù)到站外,服務(wù)到愿意擁抱互聯(lián)網(wǎng)的傳統(tǒng)企業(yè)。朱春勇說(shuō),“比如有一個(gè)賣家,他在線下有自己的品牌、專賣店、工廠,同時(shí)他也代理別的品牌,他可以做淘寶集市C2C,他也可以給天貓供貨,他可能還走京東、當(dāng)當(dāng)?shù)那?hellip;…其實(shí)整個(gè)互聯(lián)網(wǎng)目前沒(méi)有一個(gè)統(tǒng)一的商品標(biāo)準(zhǔn)。我們做DNA的愿景,就是建立一個(gè)全網(wǎng)甚至線下都能用的統(tǒng)一的商品信息體系。”
達(dá)爾文在其進(jìn)化論的代表作《物種起源》里寫道:“芽由于生長(zhǎng)而生出新芽,這些新芽如果健壯,就會(huì)分出枝條遮蓋四周許多較弱枝條,所以我相信,這巨大的‘生命之樹(shù)’在其傳代中也是這樣,這株大樹(shù)用它的枯落的枝條填充了地殼,并用它的生生不息的美麗的枝條遮蓋了地面。”