技術(shù)不是大數(shù)據(jù)第一生產(chǎn)力,數(shù)據(jù)交易才能帶來應用爆發(fā)
導言:我從事大數(shù)據(jù)工作10余年,很多時候和圈內(nèi)朋友談及大數(shù)據(jù),大家首先談到的都是數(shù)據(jù)挖掘和人工智能算法,或是hadoop的架構(gòu)。我也曾深陷這樣的誤區(qū),認為“只要會寫算法、實現(xiàn)架構(gòu)就是大數(shù)據(jù)的全部”;但我這些年的應用實踐中,越來越發(fā)現(xiàn),阻礙大數(shù)據(jù)發(fā)展的最大瓶頸不是技術(shù),而是高質(zhì)量數(shù)據(jù)源的獲取、提供和交易環(huán)節(jié)沒有被打通。
技術(shù)不是關(guān)鍵,高質(zhì)量的數(shù)據(jù)源永遠是第一位
大數(shù)據(jù)行業(yè)很多新人,甚至業(yè)內(nèi)多年從業(yè)者都有這個誤區(qū):認為算法、模型很重要。而我認為,即使技術(shù)達到世界頂級水平,它依舊不是大數(shù)據(jù)價值引擎,高質(zhì)量數(shù)據(jù)源永遠是最重要的價值來源。
模型的成功必須依賴于高質(zhì)量數(shù)據(jù)源和對商業(yè)的理解能力。有沒有數(shù)據(jù),數(shù)據(jù)質(zhì)量如何,這是最為前置的條件。要有數(shù)據(jù)才能夠建模;模型也必須經(jīng)過數(shù)據(jù)應用,才能促進其完善。其次,模型往往是要基于商業(yè)目標的,要思考如何用既定的數(shù)據(jù)解決現(xiàn)實商業(yè)問題,不是為建模而建模。一個模型質(zhì)量和效果,從某種意義來講,取決于數(shù)據(jù)源的運用、宏觀的架構(gòu)能力以及對于商業(yè)的理解,并不是技術(shù)本身。
生產(chǎn)大數(shù)據(jù)價值的原料是數(shù)據(jù)源本身,模型是工具。脫離了工具,數(shù)據(jù)源不會因此而失去價值,但脫離了數(shù)據(jù)源,模型的價值蕩然無存。這就是為什么在黑市里面交易的是購房者、貸款者和企業(yè)主的個人資料,而不是數(shù)據(jù)挖掘模型。
沒有數(shù)據(jù)交易,高質(zhì)量數(shù)據(jù)源的潛能被禁錮
目前能夠做大數(shù)據(jù)實踐的,都是自身擁有大數(shù)據(jù)的部門或企業(yè)。最優(yōu)質(zhì)、最有價值的數(shù)據(jù)源往往掌握在政府、運營商、銀行以及像BAT這樣的大型互聯(lián)網(wǎng)公司。高質(zhì)量數(shù)據(jù)源擁有者總是缺乏開放的必要性和動力,甚至希望對數(shù)據(jù)進行壟斷。但由于內(nèi)部大數(shù)據(jù)應用的需求和場景往往較為單一,數(shù)據(jù)擁有者往往也沒有很好的變現(xiàn)產(chǎn)品和手段。
再加上數(shù)據(jù)獲取困難、缺少數(shù)據(jù)采集意識造成的數(shù)據(jù)缺失,以及信息安全、信息歸屬權(quán)等敏感性問題,大數(shù)據(jù)仍然非常小眾,看起來很高深,對于絕大多數(shù)人來說很陌生的。
但是,高質(zhì)量數(shù)據(jù)源偏偏是需要流動和使用,才能激發(fā)其巨大的價值潛能。在封閉環(huán)境下,數(shù)據(jù)的價值并沒有完全地發(fā)揮出來。以運營商數(shù)據(jù)為例,運營商數(shù)據(jù)不僅可以用于解決其自身的生產(chǎn)運營、精確營銷等問題,在商業(yè)選址、城市商圈規(guī)劃、制定企業(yè)營銷策略等很多領(lǐng)域都大有可為。
假設我們要為一家高級女裝店鋪進行選址,現(xiàn)有的選址方法只能夠告訴你周邊的人流量,卻不知道你周圍到到底有多少真正的潛在客戶。當我們借助運營商數(shù)據(jù),把客戶畫像、位置信息等數(shù)據(jù)能力輸出到這個場景中,便能依據(jù)周邊人群的特征、年齡、消費力等數(shù)據(jù),作出精準決策。
但實際上現(xiàn)在的商業(yè)選址是很粗放的。問題在于數(shù)據(jù)的交易環(huán)節(jié)沒被打通,數(shù)據(jù)能力無法輸出,導致需要用數(shù)據(jù)的人沒有數(shù)據(jù),甚至也不知道數(shù)據(jù)能帶來什么價值。只有實現(xiàn)數(shù)據(jù)拼接,才會帶來數(shù)據(jù)價值的裂變式增長。因此,未來的IT時代向DT時代的轉(zhuǎn)變,關(guān)鍵在于打通高質(zhì)量數(shù)據(jù)源的獲取、提供和交易環(huán)節(jié)。
打通交易環(huán)節(jié),才能帶來應用爆發(fā)
打通交易環(huán)節(jié),一方面能讓沒有數(shù)據(jù)的人用上數(shù)據(jù),讓數(shù)據(jù)在更多地方發(fā)揮價值;另一方面,數(shù)據(jù)擁有者有更多的途徑去輸出大數(shù)據(jù)能力,實現(xiàn)變現(xiàn)。數(shù)據(jù)的價值不會因為開放和應用而減少,相反,應用與數(shù)據(jù)的價值是相輔相成的,用得越多,數(shù)據(jù)越多;而所產(chǎn)生的數(shù)據(jù),又會反哺更多的應用。
再者,高質(zhì)量數(shù)據(jù)源的跨行業(yè)、跨領(lǐng)域流動,必定會帶來是帶來應用創(chuàng)新。金融征信已經(jīng)應用大數(shù)據(jù)進行創(chuàng)新。且看芝麻信用的數(shù)據(jù)來源,涵蓋了在線購物、與他人資金往來、還信用卡、資金理財、公用事業(yè)費繳納、房屋租賃或買賣、跳槽情況、婚姻狀態(tài)、社交關(guān)系等。
以往如果一個人沒有房產(chǎn),沒有固定職業(yè),會被認為償還能力低。而現(xiàn)在把社交關(guān)系、與他人資金來往、跳槽情況等等不同領(lǐng)域的數(shù)據(jù)整合,可能會發(fā)現(xiàn)有的人雖然沒有房產(chǎn),但租的是高檔住宅;雖然沒有固定的聘用方,但經(jīng)常出沒于CBD寫字樓和高端消費場合,顯然有相當?shù)氖杖肱c償還能力。數(shù)據(jù)的跨領(lǐng)域應用,對于拓展信貸、分期付款業(yè)務都有很高的價值。
國務院2015年印發(fā)的《促進大數(shù)據(jù)發(fā)展行動綱要》明確了要統(tǒng)籌國家大數(shù)據(jù)資源,推動共享開放,釋放數(shù)據(jù)紅利。這里釋放了一個積極的信號,表示數(shù)據(jù)資源將逐步放開,利好數(shù)據(jù)流動。
在保證信息安全的前提下,打通數(shù)據(jù)交易環(huán)節(jié),會迎來數(shù)據(jù)應用的爆發(fā)。而基于整合數(shù)據(jù)的跨行業(yè)、跨領(lǐng)域數(shù)據(jù)應用創(chuàng)新,將會是大數(shù)據(jù)未來又一個風口。
結(jié)語
我們雖然希望數(shù)據(jù)交易能夠帶來應用的爆發(fā),但是在現(xiàn)階段高質(zhì)量的數(shù)據(jù)源仍普遍缺失。在現(xiàn)有情況下,我們并不是什么都不能做。大數(shù)據(jù)講究的是“量體裁衣”、“看菜吃飯”,即有什么樣的數(shù)據(jù),就做什么樣的事。在信息安全敏感程度較低的領(lǐng)域,逐步試錯,去嘗試對接數(shù)據(jù)資源,才能在數(shù)據(jù)交易即將帶來的應用爆發(fā)時代搶占先機。
本文作者簡介
江穎,帷策智能、原力大數(shù)據(jù)創(chuàng)始人兼CEO,大數(shù)據(jù)應用實施領(lǐng)域資深專家,中國大數(shù)據(jù)商業(yè)實踐先行者。自2003年起,一直致力于大數(shù)據(jù)領(lǐng)域的研究及應用實踐,深度涉入通信運營商、移動互聯(lián)網(wǎng)、零售、服裝、教育等多個行業(yè),擁有大量的行業(yè)經(jīng)驗和研究成果。