剖析:為什么我們應(yīng)該殺死“大數(shù)據(jù)”?
老實(shí)說(shuō)我以前是一個(gè)經(jīng)常濫用大數(shù)據(jù)這個(gè)詞的人,似乎每一個(gè)新成立的企業(yè)都與大數(shù)據(jù)有關(guān),就連風(fēng)險(xiǎn)投資公司也更愿意投資關(guān)于大數(shù)據(jù)的公司。
為什么我現(xiàn)在越來(lái)越不喜歡“大數(shù)據(jù)”這個(gè)詞了?因?yàn)槲艺J(rèn)為這個(gè)詞條本身是落伍的,它的定義由一系列的單詞構(gòu)成,但這些單詞并沒(méi)有正確的反映了目前數(shù)據(jù)界發(fā)生了什么?,F(xiàn)在,我們應(yīng)該考慮的不是“大數(shù)據(jù)”,而是應(yīng)該想一想我們能用數(shù)據(jù)做些什么。這些與運(yùn)用分層數(shù)據(jù)創(chuàng)建的應(yīng)用有關(guān),也與這些應(yīng)用能體現(xiàn)的深層意義有關(guān)。我不是第一個(gè)對(duì)大數(shù)據(jù)的夸夸其談感到厭煩的人,我與大量的投資者、數(shù)據(jù)專家以及企業(yè)家聊過(guò),很多人與我有同樣的感受。
根據(jù)Vincent Mcburney的說(shuō)法,“大數(shù)據(jù)”一詞起源于賓夕法尼亞大學(xué)的Francis Diebold,他在2000年7月寫的一篇關(guān)于金融建模的文章中首度提及此詞。從那時(shí)到現(xiàn)在已經(jīng)超過(guò)了10年的時(shí)間,在此期間關(guān)于人們?cè)撊绾芜\(yùn)用大數(shù)據(jù),發(fā)生了太多的事情。

大數(shù)據(jù)不僅僅只與大企業(yè)有關(guān)。事實(shí)上任何一個(gè)公司,從Facebook、Twitter這種巨人公司到Cloudera、Box、Okta這種快速發(fā)展的創(chuàng)業(yè)公司都是大數(shù)據(jù)公司,依照大數(shù)據(jù)的定義來(lái)看。每個(gè)有著一定用戶規(guī)模的公司都在搜集大量的數(shù)據(jù),也就是“大數(shù)據(jù)”。在一個(gè)數(shù)據(jù)是產(chǎn)品創(chuàng)新關(guān)鍵的世界,成為一個(gè)“大數(shù)據(jù)”公司并不算什么獨(dú)特的事,老實(shí)說(shuō)一點(diǎn)都不能說(shuō)明一個(gè)公司的具體狀況。
根據(jù)IBM,大數(shù)據(jù)包括四個(gè)方面:數(shù)量、速度、多樣化以及真實(shí)性。在這個(gè)充滿了社交網(wǎng)絡(luò)、電子商務(wù)以及企業(yè)數(shù)據(jù)存儲(chǔ)的世界,這些因素在許多領(lǐng)域都有被應(yīng)用到。大數(shù)據(jù)真的不能代表全部,既然我們有這么多不同的方法來(lái)篩選及使用這些大量數(shù)據(jù)的話。
這并非是低估在整理、分析大量數(shù)據(jù)方面創(chuàng)新的重要性。事實(shí)上,許多產(chǎn)業(yè)的未來(lái),包括電子商務(wù)與廣告,都要依賴于對(duì)數(shù)據(jù)的處理。像GoodData、Infochimps、Moat等這些創(chuàng)業(yè)公司,都在研究讓數(shù)據(jù)能更好的為人所用的方法。
另一點(diǎn)值得指出的是,在大數(shù)據(jù)這個(gè)詞發(fā)明之前,像IBM、大型零售商、金融巨頭等大型企業(yè)就已經(jīng)開(kāi)始在分析大量數(shù)據(jù)上面花時(shí)間了。所以讓我們思考出另外一種方式來(lái)描述需要處理大量數(shù)據(jù)的創(chuàng)業(yè)公司吧,或許是和應(yīng)用的實(shí)際功能與數(shù)據(jù)的對(duì)比有關(guān)。