大數(shù)據(jù)就是一堆沒用的東西嗎?
許多公司已經(jīng)在積極使用大數(shù)據(jù),只是它們沒有稱之為大數(shù)據(jù)罷了。雖然“大數(shù)據(jù)”一詞有諸多爭(zhēng)議,可是這項(xiàng)技術(shù)還是變得對(duì)公司業(yè)務(wù)來說必不可少。
據(jù)Dresner咨詢服務(wù)公司的一項(xiàng)新調(diào)查顯示,幾乎沒人能說清大數(shù)據(jù)到底是什么鬼;而且參與調(diào)查的所有公司,也幾乎都沒用大數(shù)據(jù)做真正有意義的事兒。
是不是覺得很吃驚?
其實(shí)也沒什么好吃驚的。就算是許多年前就有人預(yù)言大數(shù)據(jù)的出現(xiàn),可歸根結(jié)底,大多數(shù)公司還是把全部的精力,投入到如何將小數(shù)據(jù)充分利用起來。
這倒不是說大數(shù)據(jù)沒那么重要。誰也不能否認(rèn),企業(yè)如今從數(shù)據(jù)中收獲頗多。因?yàn)槭聦?shí)就是這樣。但是,想從大數(shù)據(jù)中獲得價(jià)值,企業(yè)首先要變得務(wù)實(shí)。
誰需要大數(shù)據(jù)?
正如Datamation雜志的詹姆斯·馬奎爾(James Maguire)所寫,Dresner咨詢服務(wù)公司并沒有看到大數(shù)據(jù)獲得大規(guī)模部署的現(xiàn)象。
只有17%的公司承認(rèn)正在使用大數(shù)據(jù),另有47%表示計(jì)劃未來使用,但何時(shí)使用還不確定。如此看來,難怪報(bào)告***得出的結(jié)論是:“盡管經(jīng)過了長(zhǎng)期的造勢(shì)和炒作,眼下大數(shù)據(jù)分析技術(shù)的實(shí)際部署,仍然無法廣泛適用于大多數(shù)企業(yè)組織。”
大數(shù)據(jù),就是一大堆沒用的東西嗎?
答案當(dāng)然是否定的。畢竟,在報(bào)告調(diào)查的對(duì)象中,有59%的觀點(diǎn)表明,大數(shù)據(jù)“至關(guān)重要”,盡管他們現(xiàn)在并沒有明顯地感覺到,有用什么大數(shù)據(jù)處理的任務(wù)。那么這里,顯然這里有某個(gè)因素在作祟……
我堅(jiān)定地認(rèn)為,一 定是有“某個(gè)東西”。
你不斷使用那個(gè)詞……
早在2012年,NewVantage Partners就顛覆了公眾對(duì)于大數(shù)據(jù)中“大”的定義。盡管在Hadoop及其生態(tài)系統(tǒng)的廠商的幕后推手下,媒體大肆報(bào)道PB級(jí)數(shù)據(jù)問題,但事實(shí)上大多數(shù)公司根本不存在所謂的PB級(jí)數(shù)據(jù)問題。
正如這項(xiàng)調(diào)查所發(fā)現(xiàn)的那樣,企業(yè)面臨的主要問題,還是數(shù)據(jù)的種類和處理速度。
市場(chǎng)終于心領(lǐng)神會(huì),開始將越來越多的資金投入到可以更輕松地管理不同類型數(shù)據(jù)的技術(shù)上(比如MongoDB等NoSQL數(shù)據(jù)庫(kù)和DataStax版本的Cassandra),以及處理流數(shù)據(jù)的技術(shù)上(比如Apache Spark)。
與此同時(shí),企業(yè)繼續(xù)求助于更傳統(tǒng)的數(shù)據(jù)基礎(chǔ)設(shè)施,比如甲骨文。就像DB-Engines在2015年年底盤點(diǎn)中發(fā)現(xiàn)的那樣,甲骨文在去年***的廠商評(píng)比中,漲幅***(綜合衡量發(fā)布崗位、技術(shù)論壇提及率和谷歌搜索等方面)。
它甚至超過風(fēng)頭正勁的NoSQL,超過云優(yōu)先的亞馬遜,超過其他任何廠商或技術(shù)。
當(dāng)然,甲骨文這種人氣的上揚(yáng),某種角度講與大數(shù)據(jù)關(guān)系不大,而是緣于管理整齊的行列數(shù)據(jù)。但是從NewVantage Partners的調(diào)查數(shù)據(jù)來看,這種比較“小”的數(shù)據(jù)才恰恰是大多數(shù)大數(shù)據(jù)分析技術(shù)的處理對(duì)象。
另外,拋開結(jié)構(gòu)化數(shù)據(jù),我想也許許多公司還是不認(rèn)為多樣化、高速度的數(shù)據(jù),就是“大數(shù)據(jù)”。這可能是很少有公司聲稱自己在對(duì)大量任務(wù)進(jìn)行處理時(shí),實(shí)際已經(jīng)使用大數(shù)據(jù)技術(shù)的一個(gè)原因。
正如MySQL數(shù)據(jù)庫(kù)工程師賈斯汀·斯旺哈特(Justin Swanhart)所說:“大數(shù)據(jù)毫無意義。你還不如問別人他們想要哪種數(shù)據(jù)庫(kù)。”
總而言之,就算大數(shù)據(jù)如此活躍地出現(xiàn)在人們的視野中,但許多公司未必認(rèn)為它就是“大數(shù)據(jù)”。
那又如何?
對(duì)于正在想自己是不是被大數(shù)據(jù)甩在后頭的企業(yè)來說,別再瞎擔(dān)心了。正如Gartner的分析師尼克·霍德克(Nick Heudecker)所說,“大數(shù)據(jù)”已遷移到大家更熟悉的領(lǐng)域中:
- 先進(jìn)分析和數(shù)據(jù)科學(xué)
- 商業(yè)智能和分析
- 企業(yè)信息管理
- 內(nèi)存中計(jì)算技術(shù)
- 信息基礎(chǔ)設(shè)施
很多企業(yè)已經(jīng)在充分利用大數(shù)據(jù)做項(xiàng)目,只是不把它們稱之為大數(shù)據(jù)。即便如此,有大量工作還是沒有做到位。
正如麻省理工學(xué)院斯隆學(xué)院數(shù)字商業(yè)中心的研究員邁克爾·施拉格(Michael Schrage)所說:“預(yù)測(cè)分析產(chǎn)生的最深遠(yuǎn)的影響,并不來自大幅改進(jìn)預(yù)測(cè)質(zhì)量,而是使企業(yè)從根本上轉(zhuǎn)變考慮問題和機(jī)遇的角度。”
換句話說,許多公司可能并不缺少將大數(shù)據(jù)充分利用起來的必要技術(shù)。他們?nèi)鄙俚模菍?duì)尋找徹底將數(shù)據(jù)充分利用起來的那種方式的渴望。分析員們解讀數(shù)據(jù)是一回事,而真正利用分析結(jié)果扒動(dòng)公司業(yè)務(wù)的實(shí)時(shí)變化,則是另外一回事。
這不是你從某家廠商所能買到的那種東西。它一定需要在企業(yè)的DNA內(nèi)部發(fā)生變化。既要更準(zhǔn)確地了解大數(shù)據(jù),又要用大數(shù)據(jù)切實(shí)處理一些任務(wù),企業(yè)確實(shí)面臨艱巨的任務(wù)。
文章轉(zhuǎn)載自微信公眾號(hào)“一斑”(ID: yiban51CTO)