WOT講師專訪:大數(shù)據(jù)技術(shù)讓你不再錯(cuò)過約會(huì)女友
伴隨著近兩年O2O熱潮的持續(xù)升溫,互聯(lián)網(wǎng)O2O的觸角幾乎延生到了所有行業(yè)。其實(shí),O2O并沒有那么高大上,它的紐帶無非是企業(yè)借助互聯(lián)網(wǎng)轉(zhuǎn)型,滿足消費(fèi)者不斷更迭的需求,打造***的用戶體驗(yàn)。
缺失了大數(shù)據(jù)分析能力就談不上真正的O2O。對(duì)從互聯(lián)網(wǎng)中獲取的海量用戶信息進(jìn)行分析的挖掘,利用標(biāo)簽來進(jìn)行識(shí)別和精細(xì)化運(yùn)營,成為走出O2O迷霧的突破口。那么大數(shù)據(jù)與O2O怎樣才能實(shí)現(xiàn)更好的融合呢?在信息質(zhì)量不高的前提下,如何提高O2O基礎(chǔ)信息的精準(zhǔn)度,使用戶獲得更好的體驗(yàn)?zāi)?
帶著這些問題,51CTO記者采方到WOT2015“互聯(lián)網(wǎng)+”時(shí)代大數(shù)據(jù)技術(shù)峰會(huì)的特邀演講嘉賓美團(tuán)網(wǎng)高級(jí)經(jīng)理任化偉,從技術(shù)的角度一一進(jìn)行解讀。
任化偉,2006年西安交通大學(xué)畢業(yè),早期創(chuàng)業(yè)做汽車領(lǐng)域的搜索引擎,后續(xù)經(jīng)歷了12530的音樂搜索和百度的圖片搜索服務(wù),在垂直搜索領(lǐng)域積累了豐富的經(jīng)驗(yàn);離開百度后在品眾互動(dòng)做了2年的技術(shù)總監(jiān),對(duì)廣告領(lǐng)域也有較深認(rèn)識(shí);目前在美團(tuán)網(wǎng)負(fù)責(zé)商家數(shù)據(jù)中心的建設(shè);
020的核心是為消費(fèi)者提供便利
任化偉告訴記者,O2O 不僅僅是團(tuán)購,但團(tuán)購可以說是發(fā)展最為成熟,人們接受度***的O2組成部分。從“貓眼電影”到“美團(tuán)酒店”再到“美團(tuán)外賣”,在團(tuán)購業(yè)務(wù)的積淀下,美團(tuán)網(wǎng)開始全面進(jìn)軍O2O市場。
互聯(lián)網(wǎng)時(shí)代,O2O模式之所以能夠成為下一個(gè)掘金點(diǎn),是因?yàn)槔没ヂ?lián)網(wǎng)進(jìn)行更加充分、完善信息溝通,相較于傳統(tǒng)電B2C/C2C的平臺(tái)架構(gòu)設(shè)計(jì),O20的進(jìn)步體現(xiàn)在它不僅非常重視線下團(tuán)隊(duì)和商家的接觸,還需要將系統(tǒng)資源進(jìn)行有效整合,打通“人-店-商品”間的數(shù)據(jù)關(guān)聯(lián),形成線上線下的交易閉環(huán)這種方式,使消費(fèi)者和商家所獲得的信息實(shí)現(xiàn)***程度的對(duì)等,從而為消費(fèi)者提供便利,并刺激其持續(xù)消費(fèi),使商家盈利。
大數(shù)據(jù)技術(shù)讓O2O基礎(chǔ)信息更靠譜
基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性直接影響著消費(fèi)者的體驗(yàn)。任化偉說:“我自己也被地圖導(dǎo)航坑過。一次我根據(jù)導(dǎo)航來到約定的聚餐地點(diǎn),卻怎么也找不到商家,***在朋友的電話指揮之下才找到地方,這種情況對(duì)用戶的傷害還是很大的”。
基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性是非常重要的,提升基礎(chǔ)數(shù)據(jù)質(zhì)量的道路是艱難的;比如評(píng)估一個(gè)數(shù)據(jù)源的質(zhì)量只有80%,但是上線的質(zhì)量要求是95%;事實(shí)上因?yàn)闃?biāo)準(zhǔn)非常嚴(yán)苛,95%是經(jīng)過培訓(xùn)之后運(yùn)營同學(xué)清洗之后所能達(dá)到的質(zhì)量標(biāo)準(zhǔn);在這種情況下,為了上線這批數(shù)據(jù),就需要人工全部清洗一遍數(shù)據(jù);也就是說為了提升15%的數(shù)據(jù)質(zhì)量,需要付出100%的運(yùn)營資源,而其中80%的工作是不必要的。
在這種情況下,研發(fā)同學(xué)提出了自動(dòng)化校準(zhǔn)的思路,當(dāng)然前提條件是達(dá)到和運(yùn)營同學(xué)清洗后一樣的質(zhì)量效果;具體的過程,和大家通常判斷一個(gè)信息是否正確地思路是類似的,會(huì)經(jīng)過信息收集、信息清洗、信息關(guān)聯(lián)、信息決策這幾個(gè)步驟;不同的是,我們面臨的是判斷海量信息的正確性。
信息校準(zhǔn)是一個(gè)持續(xù)不斷的過程
大數(shù)據(jù)技術(shù)不是***的,在信息不完整時(shí),人工也很難判斷。比如你從不同渠道獲取了兩條門店信息,兩條信息的門店名稱是一樣的,地址是兩個(gè)相鄰的街道,距離偏差一千米;你是原意相信其中一個(gè)渠道的信息搞錯(cuò)了呢,還是原意相信物理世界上是存在兩家門店呢?如果是五***大酒店,相信大家都會(huì)判斷其中一個(gè)信息錯(cuò)了,如果是沙縣小吃呢?如果不到實(shí)地勘察一下,估計(jì)很難判定。
如果我們獲取了更多信息,比如我們獲取了上述例子中門店的遷址信息,并且地址也能匹配上,就可以對(duì)兩條信息給出一個(gè)明確的判斷;所以校準(zhǔn)是隨著信息不斷完善而逐步迭代的過程;另外客觀上也存在著商家不斷開展、遷址、倒閉的過程,所以信息校準(zhǔn)也是一個(gè)持續(xù)不斷追求和物理世界保持同步的過程。
WOT大數(shù)據(jù)技術(shù)峰會(huì)上將分享我們踩過的那些“坑”
外行人在看待技術(shù)時(shí),往往會(huì)產(chǎn)生一種高大上的“錯(cuò)覺”,而實(shí)際上,真正涉及到業(yè)務(wù)層面的流程和機(jī)制設(shè)計(jì)時(shí),往往是非?,嵥榈?,而且在沒有經(jīng)驗(yàn)的前提下,很難做出一些有價(jià)值的思考。
在11月28日由51CTO主辦的位于深圳的WOT2015“互聯(lián)網(wǎng)+”大數(shù)據(jù)技術(shù)峰會(huì)(http://wot.51cto.com/2015bigdata/)任化偉將和大家分享他們?cè)谝劳写髷?shù)據(jù)技術(shù)進(jìn)行信息自動(dòng)化校準(zhǔn)中的過程中的經(jīng)驗(yàn),特別是在數(shù)據(jù)質(zhì)量不高的前提下,他們都踩過哪些坑,解決方案是什么,最終達(dá)到了什么樣的效果,希望給大家?guī)硪恍﹩l(fā)。