大數(shù)據(jù)產(chǎn)業(yè)投資:1美元只賺50美分
調(diào)查結(jié)果顯示,大數(shù)據(jù)最近的市場表現(xiàn)令人大跌眼鏡。部分由于媒體炒作的影響,許多企業(yè)都并未實際了解大數(shù)據(jù)產(chǎn)業(yè)價值時就對其進行了投資。之后,預(yù)料之中,一份新的分析報告顯示眾企業(yè)從大數(shù)據(jù)上得到的回報比他們預(yù)期的少得多,甚至少于他們的投資額。
少到什么程度呢?根據(jù)Wikibon的初步研究結(jié)果來看,答案是少得令人吃驚。
果然,Wikibon發(fā)現(xiàn)46%的大數(shù)據(jù)投資者僅從他們的項目中竭力維持了部分的成功,而2%的投資者不得不取消他們的投資并以完全失敗告終。
不過這并不代表大數(shù)據(jù)最終會不可避免地以失敗收場。
Wikibon指出,大數(shù)據(jù)投資的失敗原因之一是“許多企業(yè)投資像Hadoop這樣的大數(shù)據(jù)科技卻沒有與這個項目相聯(lián)系的精確可測量的商務(wù)應(yīng)用。”他們僅僅是聽到“大數(shù)據(jù)”的名字就紛紛往里砸錢,卻沒想過他們真正期望達到的目標(biāo)是什么。這與高德納的分析結(jié)果是相一致的。
對于大多數(shù)企業(yè)來說,大數(shù)據(jù)就等于Hadoop,而Hadoop的大意被IT人員解釋為“一個無人管理的數(shù)據(jù)垃圾堆。”而Criteo公司的工程副總裁朱麗恩·西蒙(Julien Simon)稱“大數(shù)據(jù)經(jīng)常就僅僅代表著無用的數(shù)據(jù)。”
如果不知道數(shù)據(jù)的用途就貯存它,那么這些數(shù)據(jù)就只會增加噪音和掩蓋信號。著名統(tǒng)計學(xué)家內(nèi)特·斯?fàn)栁?Nate Silver)假設(shè)道:
如果信息的數(shù)量增加至每天2.5*1^18字節(jié),那么有用信息的數(shù)量幾乎為零。這些數(shù)據(jù)大多只是噪音,而噪音數(shù)量比信號數(shù)量增加得快。有太多假設(shè)需要被測試,總數(shù)據(jù)增加得太多了,但客觀實在的數(shù)據(jù)量是相對穩(wěn)定不變的。
換句話說,增加更多數(shù)據(jù),并不是大數(shù)據(jù)問題的解決方法,卻通常是問題的起因,而這也是許多公司從大數(shù)據(jù)投資中得到回報非常少的原因。
Wikibon的研究表明,最好的大數(shù)據(jù)項目“并沒有被引入IT界,而是為企業(yè)運營部門所用,它們通常被用于市場營銷,或用于小型但有策略的案例中。”這些企業(yè)會挖掘大數(shù)據(jù)內(nèi)行專家,并對他們能用這項技術(shù)達到的效果報以切實的期望。
這些項目開始時非常小,但之后就會在最初的基礎(chǔ)上擴展開來。
為了避免將不必要的巨資投入大數(shù)據(jù)項目,最好像上述企業(yè)那樣做。所有最好的大數(shù)據(jù)科技資源都是開放的,所以在購買之前可以先試用,然后再根據(jù)各自的需求來選擇和發(fā)展最好的技術(shù)。