大數(shù)據(jù)真的在云計算上的快車上嗎?
軟件初創(chuàng)廠商AtScale公司去年年底發(fā)布了其年度大數(shù)據(jù)成熟度調(diào)查報告(以前稱為“Hadoop成熟度調(diào)查”),顯示商業(yè)智能大數(shù)據(jù)是首要任務(wù),并正處于云計算的快速發(fā)展階段,數(shù)據(jù)治理越來越受到關(guān)注。
該報告及其結(jié)果在最近ODPi用戶顧問委員會(UAB)的會議上成為了一個主要的討論話題,ODPi用戶顧問委員會(UAB)是由來自汽車,技術(shù)和娛樂行業(yè)等使用Apache Hadoop和其他大數(shù)據(jù)技術(shù)的大型企業(yè)的代表組成。ODPi UAB十分認(rèn)同報告中所提出的日益增長的數(shù)據(jù)治理問題。自助服務(wù)訪問大數(shù)據(jù)和這種自助服務(wù)的治理確實觸動了人們的心弦。行業(yè)專家討論了讓人們幫助推動自助服務(wù)訪問政策的概念,這反映出越來越多的數(shù)據(jù)科學(xué)家是業(yè)務(wù)部門的一部分,而不是IT部門。該小組一致認(rèn)為,僅持有治理和安全控制的IT目前的狀態(tài)是不具成本效益的,而自治可能是一種幫助規(guī)模使用的策略。
關(guān)于云計算中大數(shù)據(jù)的主題,ODPi UAB在混合云模型中看到了他們的未來。雖然他們認(rèn)為人們將在未來三年內(nèi)看到云計算更多的應(yīng)用,但他們將會在現(xiàn)有投資的基礎(chǔ)上開展,而不是完全取代現(xiàn)有的投資。此外,ODPi UAB認(rèn)為現(xiàn)有的中央處理與本地處理節(jié)點相輔相成,以幫助擴大需求,更好地遵守法規(guī)。目前,UAB成員看到全面擴展到云計算成本過高,但隨著物聯(lián)網(wǎng)數(shù)據(jù)本身運行的用例開始增長,云計算將變得更加有趣。
在ODPiUAB闡述之后,然后回到企業(yè)自己的使用模式。在本文中將介紹這些使用模式,ODPiUAB提供的見解以及云計算在Hadoop和大數(shù)據(jù)中的作用的體驗。預(yù)生產(chǎn)和生產(chǎn)Hadoop之間有明顯的區(qū)別。
表1概述了隨著企業(yè)使用情況的變化,運營Hadoop的核心差異。
AtScale公司的報告指出,73%的受訪者在使用生產(chǎn),與2015年同期相比增長了8%。調(diào)研機構(gòu)Gartner公司的業(yè)務(wù)調(diào)查報告為15%以上。由于在數(shù)量上有如此大的差異,很明顯在行業(yè)中部署階段的基線定義并不明確。UAB和ODPi成員在這里已經(jīng)提出了這個詳細(xì)的部署,認(rèn)為它們與市場準(zhǔn)確匹配。
繪制出適合于連續(xù)性的位置,可以更客觀地看待生產(chǎn)使用情況。
分析大數(shù)據(jù)的云計算
雖然72%的受訪者表示計劃在云端實施大數(shù)據(jù),但更深入的分析可能會顯示出一些重要的細(xì)微差別。UAB成員希捷技術(shù)公司企業(yè)分析總監(jiān)Nicholas Berg表示:“要進(jìn)行深入研究,人們還會問:企業(yè)的應(yīng)用程序和IT在本地部署數(shù)據(jù)中心和云計算中的比例是多少?企業(yè)的大數(shù)據(jù)在本地部署數(shù)據(jù)中心和云計算中的比例是多少?最后,企業(yè)在云中的實際生產(chǎn)有多少?我敢打賭這個百分比要小得多。”
另一個ODPiUAB成員評論說:“我認(rèn)為很多公司只是在云中進(jìn)行概念驗證(POC)測試,但仍然在內(nèi)部數(shù)據(jù)中心進(jìn)行生產(chǎn)部署。”UAB認(rèn)為,這里的主要驅(qū)動力是人們認(rèn)識到IT需要最大限度地降低風(fēng)險和成本。
這引出了云計算中最大的沒有解決的問題:成本。多年來,云計算供應(yīng)商一直在推動“降低成本和復(fù)雜性-走向云”的敘述,“避免服務(wù)器采購的資本支出-只是利用云”等等。然而,ODPiUAB明確的一個因素是,當(dāng)企業(yè)擴大規(guī)模時,云計算將變得更昂貴。
ODPi UAB一位成員談到自己的經(jīng)驗,并表示,“最近,我們已經(jīng)對數(shù)字不起作用做了一些成本分析,而不是當(dāng)人們談?wù)撊肟诨虺隹跀?shù)據(jù)量時重新考慮。這就是云供應(yīng)商的成本真正開始飛漲的地方,因此,當(dāng)企業(yè)完全轉(zhuǎn)向云端時數(shù)字不起作用。所以我們?nèi)匀辉诳紤]實驗的目的,但是沒有看到人們?nèi)绾瓮耆苿拥皆贫?,甚至考慮把大量的系統(tǒng)移到那里。我發(fā)現(xiàn)云端工作適用于小規(guī)模的子集,如果企業(yè)愿意,這可能是一種聚合,但是一旦試圖進(jìn)行長期的存儲,它將使成本增加的非??焖佟?rdquo;
這是否意味著ODPi UAB成員感覺到Hadoop和云中的大數(shù)據(jù)是注定失敗的,除非成本下降?當(dāng)然不是。對他們來說,問題在于云計算的敘述,而在場景上,不斷被認(rèn)為是““非此即彼”的討論,而不是“兩者兼用”的討論。
云計算:物聯(lián)網(wǎng)數(shù)據(jù)的用例
ODPi UAB的一位成員分享了一個物聯(lián)網(wǎng)數(shù)據(jù)的使用情況,“當(dāng)企業(yè)正在考慮解決某些問題時,將不同區(qū)域的數(shù)據(jù)轉(zhuǎn)移到云計算中處理,云計算開始變得更有意義。當(dāng)人們開始談?wù)撐锫?lián)網(wǎng)時尤其如此,企業(yè)難道真的想在自己的數(shù)據(jù)中心運行所有的物聯(lián)網(wǎng)數(shù)據(jù)嗎?人們查看一下描述的用例,就會發(fā)現(xiàn)所有的數(shù)據(jù)在自己的數(shù)據(jù)中心將面臨一些問題,無論是在數(shù)量上還是在法律上。例如德國等一些國家,除非要在這些國家建立數(shù)據(jù)中心。”而其他專家也贊同這種看法。他說:”我們認(rèn)為云平臺的存在也是一個挑戰(zhàn),特別是作為一家在全球各地設(shè)有辦事處的全球性公司,如果不想在每個國家和地我建立數(shù)據(jù)中心,那么采用云計算是一個很好的選擇。”
從上述所有ODPi UAB反饋意見來看,很明顯,云計算將繼續(xù)成為Hadoop和大數(shù)據(jù)的一個組成部分,但與組織的成本和效率需求保持一致。換句話說,就像其他技術(shù)轉(zhuǎn)向云端一樣,最現(xiàn)實的答案往往在某種形式的混合中。Nicholas Berg說,“我想隨著時間的推移,Hadoop將在云中的應(yīng)用更加廣泛,希望其成本結(jié)構(gòu)變得更加合理,事情就會開始轉(zhuǎn)變。我認(rèn)為這是會發(fā)生的,只是時間問題。我們可能總是有某種混合部署,隨著經(jīng)濟和用例更好地隨著時間的推移,云計算的使用率可能會更高。”
下一件大事
人們生活在行業(yè)中,坦率地說是一個世界中-而尋求下一件大事情,將會激發(fā)行業(yè)人士成長和發(fā)展的愿望。行業(yè)先鋒經(jīng)常拒絕接受現(xiàn)狀,認(rèn)識到完美從未實現(xiàn),并總是不斷追求。正如Vince Lombardi曾經(jīng)說過,“完美是無法實現(xiàn)的,但如果我們追求完美,那么我們可以實現(xiàn)卓越。”
話雖如此,有一件很少有成果的事情就是強化創(chuàng)新。順應(yīng)技術(shù)潮流,應(yīng)對現(xiàn)代生活的挑戰(zhàn)和機遇,如果你聽過專業(yè)運動員的采訪,他們總是會說下一步要達(dá)到什么目標(biāo),技術(shù)也是如此,但規(guī)模更大,人們對此并不總是很清楚。