你想知道的關(guān)于Hadoop數(shù)據(jù)資源池的一切
隨著Hadoop數(shù)據(jù)資源池的概念進(jìn)入主流IT,越來(lái)越多的企業(yè)開(kāi)始試水Hadoop。但很多只是將一部分?jǐn)?shù)據(jù)池化,還沒(méi)有開(kāi)發(fā)出成熟的Hadoop環(huán)境。
數(shù)據(jù)資源池使用基于開(kāi)源Hadoop框架和商業(yè)硬件,以池化資源的形式處理、存儲(chǔ)和管理大數(shù)據(jù),尤其是支持分析應(yīng)用。支持者認(rèn)為數(shù)據(jù)池架構(gòu)提供了一個(gè)更便宜的替代傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的選項(xiàng),能夠處理結(jié)構(gòu)化、半結(jié)構(gòu)化以及非結(jié)構(gòu)化數(shù)據(jù)。不過(guò),數(shù)據(jù)資源池的概念還相對(duì)較新,帶來(lái)利益的同時(shí)也隱藏著陷阱。關(guān)注BI和大數(shù)據(jù)的咨詢公司Eckerson 集團(tuán)***咨詢師Wayne Eckerson表示:“在過(guò)去七年里,Hadoop取得了長(zhǎng)足的進(jìn)步,但它仍有很長(zhǎng)的路要求。”
在接受TechTarget采訪時(shí),Eckerson講述了他個(gè)人對(duì)于數(shù)據(jù)資源池的理解,以及可能影響該進(jìn)程的阻力。對(duì)于公司是否適合采用Hadoop資源池的問(wèn)題,他也給出了建議。
TechTarget:從您接觸到的公司來(lái)看,Hadoop資源池到底有多流行?
Wayne Eckerson:很 多公司已經(jīng)或打算使用Hadoop.只有當(dāng)你把所有數(shù)據(jù)都放入Hadoop集群的時(shí)候,數(shù)據(jù)資源池才是真實(shí)的。公司當(dāng)然對(duì)它有興趣,尤其是目前還沒(méi)有數(shù)據(jù) 倉(cāng)庫(kù)的公司,它們會(huì)選擇從Hadoop開(kāi)始,而不是關(guān)系型數(shù)據(jù)庫(kù),當(dāng)然前提是它們有掌握Hadoop的人才。不過(guò)我認(rèn)為,供應(yīng)商推Hadoop的力度大于 用戶對(duì)Hadoop的需求。泡沫的成分還是有的。
TechTarget:公司為什么要考慮數(shù)據(jù)池,數(shù)據(jù)池能夠給公司帶來(lái)的***好處是什么?
Eckerson:理論上這種方法大有裨益。你把數(shù)據(jù)放入資源池,不需要再移動(dòng)它。你需要做的只是把數(shù)據(jù)提取到支持業(yè)務(wù)的正確的處理系統(tǒng)中。數(shù)據(jù)資源池的好處是你把數(shù)據(jù)存儲(chǔ)在 數(shù)據(jù)產(chǎn)生的地方,然后把處理流程加在數(shù)據(jù)上,這樣能夠讓公司更少地移動(dòng)數(shù)據(jù)。但是問(wèn)題是,在過(guò)去二十年里,我們積累了如何從數(shù)據(jù)中提取答案的經(jīng)驗(yàn),但這些 經(jīng)驗(yàn)并不完全適用于數(shù)據(jù)資源池。公司要重新確認(rèn)流程,保證能得到正確答案。不過(guò)因?yàn)槌杀镜?,所以人們還是很愿意去嘗試它。
企業(yè)在部署Hadoop時(shí),對(duì)數(shù)據(jù)資源池的概念是否會(huì)有誤解?
Eckerson:對(duì) 于任何新技術(shù),人們都不免會(huì)希望它能“包治百病”。但事實(shí)并非如此,Hadoop需要專業(yè)的技術(shù)人才,而且有很多功能還不成熟,比如安全、管理、容災(zāi)和恢 復(fù)、交互查詢等?,F(xiàn)在,這些功能正逐漸被添加到Hadoop平臺(tái)上,它現(xiàn)在正在向企業(yè)級(jí)方向發(fā)展。不過(guò)它仍然沒(méi)有傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境那么成熟。你不能只給人 們一個(gè)生數(shù)據(jù)的入口,就期望他們能完成任何事。你需要構(gòu)建不同的數(shù)據(jù)視圖,不同的結(jié)構(gòu),不同部門(mén)的人員看到不同的數(shù)據(jù)。這和數(shù)據(jù)倉(cāng)庫(kù)的道理是一樣的,只是 用到的技術(shù)不同。我認(rèn)為***的誤解是認(rèn)為Hadoop是適用于業(yè)務(wù)用戶的環(huán)境,其實(shí)不是,Hadoop還是需要掌握固定技能的專家的。
數(shù)據(jù)資源池適用于所有企業(yè)嗎,還是只適用于部分企業(yè)?
Eckerson:任何公司,只要有時(shí)間和資源,都可以嘗試數(shù)據(jù)資源池。公司要以開(kāi)放的心態(tài)迎接新技術(shù),需要花費(fèi)時(shí)間進(jìn)行試驗(yàn),了解數(shù)據(jù)資源池能夠給自己帶來(lái)什么。早期的Hadoop使用者已經(jīng)在大范圍部署Hadoop了。但也有公司忙于應(yīng)對(duì)已有的數(shù)據(jù)倉(cāng)庫(kù),無(wú)暇考慮Hadoop。這是企業(yè)文化的問(wèn)題,有些對(duì)新技術(shù)比較積極,有些則不然。
我們一直都在努力堅(jiān)持原創(chuàng).......請(qǐng)不要一聲不吭,就悄悄拿走。
我原創(chuàng),你原創(chuàng),我們的內(nèi)容世界才會(huì)更加精彩!