八部電影幫你看懂大數(shù)據(jù)
如果你是位數(shù)據(jù)分析行業(yè)的專家,你肯定以為我們會(huì)提到《點(diǎn)球成金》(Money Ball),很遺憾以下將要介紹的電影貌似與大數(shù)據(jù)無關(guān),但能幫助我們從八個(gè)不同角度解讀大數(shù)據(jù)的未來,以及,作為IT經(jīng)理的我們的未來。
一、《V客帝國(guó)》
(V for Vendetta 2005-James McTeigue)
在大數(shù)據(jù)的世界里,V并非指“仇殺”(Vendetta),而是著名的3V定律:
Velocity速度——以接近實(shí)時(shí)的速度處理數(shù)據(jù)產(chǎn)生報(bào)告,而不是像過去那樣漫長(zhǎng)的休假結(jié)束后才能看到報(bào)告。
Volume容量——在不斷膨脹的海量數(shù)據(jù)中依然能發(fā)現(xiàn)有價(jià)值的信息。
Variety多樣性——能處理各種數(shù)據(jù)源(結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù))
二、《速度與激情》
(Fast and the Furious 2001-Rob Cohen)
在未來數(shù)據(jù)驅(qū)動(dòng)的企業(yè)中,任何一項(xiàng)業(yè)務(wù)計(jì)劃能否成功都需要依賴飛速的大數(shù)據(jù)分析,企業(yè)間比拼的是大數(shù)據(jù)跑車的極速性能,如果你能比競(jìng)爭(zhēng)對(duì)手更快了解一個(gè)業(yè)務(wù)計(jì)劃的可行性并快速?zèng)Q策,你的將成為快公司,而那些不夠Fast的CIO們,迎來的將是老板的Furious。
三、《淘金記》
(The Gold Rush 1925-Charles Chaplin)
你也許不止一次在討論會(huì)上聽說:數(shù)據(jù)將是未來世界經(jīng)濟(jì)的“原油”。大數(shù)據(jù)是個(gè)大金礦,但是對(duì)于大多數(shù)企業(yè)來說,通往大數(shù)據(jù)致富的道路鋪滿荊棘而不是鮮花。最大的障礙不是技術(shù),而是來自企業(yè)向數(shù)據(jù)驅(qū)動(dòng)型企業(yè)文化的痛苦轉(zhuǎn)型,其艱難程度堪比卓別林在阿拉斯加啃鞋底。
四、《飛屋環(huán)游記》
(Up 2009)
Pixar出品的最感人的電影非《飛屋環(huán)游記》莫屬。影片為我們展示了在云端漫游的浪漫和快樂。是的,彈性云基礎(chǔ)設(shè)施能很好地應(yīng)對(duì)大數(shù)據(jù)的規(guī)模增長(zhǎng)。如果你過于關(guān)注大數(shù)據(jù)硬件的可擴(kuò)展性,那么說明你還停留在解決技術(shù)支撐層面的事情,而不是大數(shù)據(jù)的商業(yè)價(jià)值。Amazon和Joyent這樣的彈性云服務(wù)商能幫企業(yè)忘掉大數(shù)據(jù)的技術(shù)性問題。
五、《象人》
(The elephant Man 1980)
大數(shù)據(jù)世界也有一頭風(fēng)騷無比的黃色大象——Hadoop,曾經(jīng)是Google的一個(gè)項(xiàng)目,開源后成為大數(shù)據(jù)基礎(chǔ)設(shè)施的基石。Hadoop還提供一系列相關(guān)配套工具,將Hadoop的潛能發(fā)揮到極致,例如Ahache Mahout——機(jī)器學(xué)習(xí),和Apache Hive——在Hadoop之上搭建數(shù)據(jù)倉(cāng)庫(kù),并與MongoDB等NoSQL數(shù)據(jù)庫(kù)形成天作之合。
六、《泰坦尼克號(hào)》
(Titanic 1997)
沒有對(duì)隱藏的未知因素進(jìn)行建模和分析就做出的決策將可能是災(zāi)難性的。大數(shù)據(jù)給你看得見的信息,同時(shí)還能從數(shù)據(jù)中發(fā)現(xiàn)你看不見的東西。分析海量數(shù)據(jù)之間的“模式”、“關(guān)聯(lián)”..你會(huì)發(fā)現(xiàn)很多水面下的信息內(nèi)幕。例如,汽車顏色與保險(xiǎn)費(fèi)用之間的關(guān)系。大數(shù)據(jù)時(shí)代之前,大多數(shù)的企業(yè)管理都盲人騎瞎馬,或者像泰坦尼克號(hào)那樣黑夜中在冰山中穿行。
七、《少數(shù)派報(bào)告》
(Minority Report 2002)
《少數(shù)派報(bào)告》中,阿湯哥工作的犯罪預(yù)防部門采用的基本是預(yù)測(cè)型分析技術(shù),這也是大數(shù)據(jù)的殺手應(yīng)用,未來的優(yōu)秀企業(yè)領(lǐng)導(dǎo)者無需借助管理藝術(shù)、或者類似瑪雅巫師的管理哲學(xué),機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)將成為管理者的數(shù)字水晶球。
八、《老無所依》
(No country old men 2007 )
這個(gè)故事有點(diǎn)殘酷,但事實(shí)就是如此,大數(shù)據(jù)需要全新的技能組合,在大數(shù)據(jù)面前甚至80后都不再年輕。老一輩數(shù)據(jù)庫(kù)專家們需要洗心革面,全身換血,掌握最新的數(shù)據(jù)存儲(chǔ)和處理技術(shù)。此外,大數(shù)據(jù)的“多樣性”還意味著大量數(shù)據(jù)將來自互聯(lián)網(wǎng)的API或SPARQL等端點(diǎn),利用這些數(shù)據(jù)你還需要掌握Python、PHP、Java等技術(shù)。