15種最佳方式幫你順利掌握Hadoop技術(shù)
譯文在探討今天的主題——如何利用各類資源學(xué)習(xí)Hadoop知識(shí)——之前,讓我們首先搞清楚另一個(gè)問(wèn)題:大數(shù)據(jù)Hadoop到底是什么?簡(jiǎn)單來(lái)講,Hadoop是一套用于實(shí)現(xiàn)大數(shù)據(jù)技術(shù)的框架方案。為了順利掌握Hadoop,大家需要理解兩項(xiàng)與文件存儲(chǔ)以及數(shù)據(jù)處理緊密相關(guān)的基礎(chǔ)知識(shí)。在Hadoop當(dāng)中,我們甚至可以保存比可用存儲(chǔ)空間更大的文件。Hadoop提供相關(guān)選項(xiàng),允許大家將大型文件存儲(chǔ)在節(jié)點(diǎn)之上。很明顯,處理規(guī)模如此可觀的文件絕非兒戲,不過(guò)Hadoop能夠引入“MapReduce”機(jī)制讓一切變得更為簡(jiǎn)單。MapReduce也是一套框架,其主要任務(wù)就是實(shí)現(xiàn)數(shù)據(jù)處理。MapReduce能夠以迅如閃電的速度完成數(shù)據(jù)處理任務(wù),從而幫助我們節(jié)約大量時(shí)間。
實(shí)踐證明,Hadoop確實(shí)擁有重要的實(shí)際價(jià)值,而這種價(jià)值主要體現(xiàn)在由其提供的各類特性當(dāng)中。Hadoop的顯著特性包括以下幾點(diǎn):
- 易于擴(kuò)展: Hadoop是一套具備可擴(kuò)展能力的存儲(chǔ)平臺(tái),其能夠?qū)?shù)據(jù)分發(fā)至成千上萬(wàn)個(gè)分布式節(jié)點(diǎn)及低成本服務(wù)器之上,并讓這些硬件設(shè)備以并行方式共同處理同一任務(wù)。
- 靈活性: Hadoop并不會(huì)對(duì)數(shù)據(jù)類型或者數(shù)據(jù)來(lái)源作出任何硬性限制。我們可以輕松利用它處理點(diǎn)擊流數(shù)據(jù)、欺詐檢測(cè)、電子郵件會(huì)話、社交媒體以及日志處理等工作。
- 性價(jià)比出色: 傳統(tǒng)存儲(chǔ)系統(tǒng)面臨的最大問(wèn)題在于極為昂貴的使用成本,但Hadoop的出現(xiàn)卻能夠幫助大家節(jié)約下非常驚人的寶貴資金。
目前幾乎每一家IT技術(shù)巨頭企業(yè)都在使用Hadoop進(jìn)行數(shù)據(jù)管理。在Hadoop使用方面,最值得一提的企業(yè)包括Amazon、Adobe、阿里巴巴、Cloudspace、EBay、Facebook、IBM、雅虎以及Twitter等等。
隨著Hadoop在應(yīng)用領(lǐng)域的人氣不斷攀升,大量令人興奮的全新發(fā)展機(jī)遇也由此陸續(xù)出現(xiàn)。為了幫助大家成為大數(shù)據(jù)與Hadoop技術(shù)層面的緊俏人才,我們整理出了15種學(xué)習(xí)Hadoop技術(shù)的最佳方式及資源,下面一起來(lái)看。
Hadoop文字教程
tutorialspoint
這份教程能夠?yàn)榇蠹姨峁┝己玫募夹g(shù)指導(dǎo),而且也用事實(shí)驗(yàn)證了自身的出色水平。它針對(duì)大數(shù)據(jù)概念快速理解、Hadoop分布式文件系統(tǒng)以及MapReduce算法提供了簡(jiǎn)潔易懂的教學(xué)方案,能夠幫助各位新手輕松掌握Hadoop。這套教程適用于ETL開(kāi)發(fā)人員、軟件專家以及分析專業(yè)人士。
coreservlets
Core Servlets提供一套清晰易行的Hadoop學(xué)習(xí)教程。其中每個(gè)章節(jié)都包含練習(xí)內(nèi)容以及相應(yīng)的解決方案提示,這樣大家就能夠在無(wú)需求助于他人的前提下自行學(xué)習(xí)。這份教程同時(shí)也非常適用于那些擁有一定Java編程知識(shí)的學(xué)習(xí)者。在認(rèn)真研讀之后,相信大家一定能建立起堅(jiān)實(shí)的Hadoop專業(yè)知識(shí)基礎(chǔ)。
3) Vogella
vogella
Vogella提供一系列與Hadoop學(xué)習(xí)相關(guān)的簡(jiǎn)短教程。作為學(xué)習(xí)起點(diǎn),它首先通過(guò)概述幫助大家理解Hadoop宏觀概念、利用Hadoop能夠完成哪些任務(wù)并闡述了映射與歸約兩大基本功能的確切定義。這份教程涵蓋了多項(xiàng)基本議題,包括文件系統(tǒng)、映射歸約及其安裝指南。
4) Guru99
guru99
Guru99提供一套基于Hadoop的深層指導(dǎo)方案。它采用大量示例加圖表的配合方式,能夠幫助大家輕松學(xué)習(xí)到Hadoop相關(guān)知識(shí)。可以說(shuō),它是我們所見(jiàn)過(guò)的最為簡(jiǎn)單易行的Hadoop學(xué)習(xí)教程。其中的具體議題則包括技術(shù)介紹、安裝、映射歸約以及由大量代碼及注釋實(shí)現(xiàn)的示例方案。
5) Hortonworks
hortonworks
Hortonworks針對(duì)Hadoop提供一系列非常優(yōu)秀的教程資料。除了常規(guī)教程內(nèi)容之外,它還提供與Hadoop相關(guān)的認(rèn)證機(jī)制。這項(xiàng)資質(zhì)認(rèn)證能夠幫助專業(yè)人士開(kāi)啟大數(shù)據(jù)技術(shù)領(lǐng)域的職業(yè)生涯。它的涵蓋范圍很廣,但同時(shí)又不失深度。
Hadoop視頻教程
6) Udemy
udemy
Udemy在技術(shù)視頻教程領(lǐng)域已經(jīng)擁有相當(dāng)一段時(shí)間的從業(yè)經(jīng)歷,而且事實(shí)證明其表現(xiàn)算得上可圈可點(diǎn)。它以完整教程的形式對(duì)Hadoop認(rèn)證的各個(gè)層面作出了清晰而詳盡的解釋,從而使學(xué)習(xí)過(guò)程充滿樂(lè)趣。對(duì)于Hadoop毫無(wú)概念的新人同樣能夠在它的幫助下輕松建立并提升自己的Hadoop專業(yè)知識(shí)。值得一提的是,它甚至能夠用輕松易懂的方式闡述MapReduce等相當(dāng)艱深的概念。
7) Eduonix
eduonix
這套教程由多位訓(xùn)練有素的專業(yè)人員共同打造,力爭(zhēng)幫助大家扎實(shí)穩(wěn)健地一步步完成自己的大數(shù)據(jù)與Hadoop培訓(xùn)之路。其中包含有74次講座以及長(zhǎng)達(dá)15.5小時(shí)的視頻內(nèi)容。除了清晰闡述各類核心技術(shù)概念之外,它還解釋了MapReduce等特定定義的具體內(nèi)容。如果大家有意在Hadoop領(lǐng)域試試身手,那么這套教程無(wú)疑應(yīng)該成為各位的必修課程。
8) Simplilearn
simplilearn
這套教程擁有明確的定義以及理想的結(jié)構(gòu)設(shè)置,即使是來(lái)自其它行業(yè)、毫無(wú)技術(shù)基礎(chǔ)的朋友也能輕松理解。大家還可以選擇與Hadoop相關(guān)的認(rèn)證資質(zhì),并借此幫助自己從競(jìng)爭(zhēng)對(duì)手當(dāng)中脫穎而出。這套在線Hadoop培訓(xùn)資源以Hadoop技術(shù)簡(jiǎn)介作為起點(diǎn),而后解釋了相關(guān)架構(gòu)并隨進(jìn)度推移提出更多高級(jí)技術(shù)概念。
9) Edureka
edureka
掌握Hadoop雖然說(shuō)不上困難無(wú)比,但前提是大家需要具備一定程度的Java核心知識(shí)。幸運(yùn)的是,Edureka在《面向Hadoop的Java基礎(chǔ)》當(dāng)中提供豐富的學(xué)習(xí)資源。為了完成配套習(xí)題,大家需要在自己的系統(tǒng)當(dāng)中安裝Edureka虛擬機(jī)。如果各位的系統(tǒng)無(wú)法滿足配置要求,也可以遠(yuǎn)程訪問(wèn)Edureka集群。這套教程還擁有另一大令人印象深刻的特色,其出色的技術(shù)支持團(tuán)隊(duì)能夠快速解答我們學(xué)習(xí)過(guò)程中遇到的各類難題。
Hadoop論著
10) Eric Sammer撰寫(xiě)的Hadoop Operations
Hadoop Operations by Eric Sammer
這本書(shū)明確闡述了如何建立并維護(hù)一套Hadoop集群。它甚至以每分鐘為單位進(jìn)行詳盡說(shuō)明,同時(shí)從操作系統(tǒng)層面出發(fā)指導(dǎo)大家進(jìn)行細(xì)微調(diào)試。另外,它也介紹了大量先進(jìn)議題,具體包括MapReduce、HDFS架構(gòu)、YARN執(zhí)行模式以及集群配置等等。
11) Boris Lublinsky撰寫(xiě)的Professional Hadoop Solutions
Professional Hadoop Solutions by Boris Lublinsky
這本書(shū)以MapReduce編程作為開(kāi)篇,并通過(guò)三個(gè)章節(jié)以深層方式對(duì)這一議題進(jìn)行了全面探究。而包括Oozie在內(nèi)的其它議題同樣非常重要,其能夠以深入淺出的方式幫助我們學(xué)會(huì)如何開(kāi)發(fā)出一套大規(guī)模處理系統(tǒng)。幾乎沒(méi)有幾部論著會(huì)從Oozie這樣具體的議題出發(fā)進(jìn)行學(xué)習(xí)指導(dǎo),但這本書(shū)做到了——它對(duì)Hadoop的各個(gè)相關(guān)概念都作出了細(xì)致闡述。
12) Tom White撰寫(xiě)的Hadoop the Definitive Guide
Hadoop the Definitive Guide by Tom White
這本書(shū)在Hadoop開(kāi)發(fā)者當(dāng)中極受歡迎,有些人甚至將其視為Hadoop學(xué)習(xí)的圣經(jīng)。不過(guò)需要強(qiáng)調(diào)的是,它的定位并非完全為了幫助新手學(xué)習(xí)Hadoop知識(shí)。這本書(shū)的開(kāi)篇部分成為理解后續(xù)內(nèi)容的基石,但也需要大家拿出時(shí)間和精力好好研討。不過(guò)只要啃下了開(kāi)頭部分,那么在接下來(lái)的學(xué)習(xí)過(guò)程中,各位肯定能感受到這部論著的出色之處。
13) Donald Miner與Adam Shook撰寫(xiě)的Map Reduce design pattern
Map Reduce design pattern by Donald Miner and Adam Shook
這本書(shū)能夠幫助大家輕松建立起對(duì)各類關(guān)鍵性概念的印象,并提供大量示例以降低理解難度。但需要指出的是,這本書(shū)并非為新人所編寫(xiě),大家至少需要在開(kāi)始閱讀之前對(duì)云計(jì)算以及Hadoop有所了解。本書(shū)還將各類映射歸約算法一網(wǎng)打盡,可以說(shuō)是每一位有理想、有抱負(fù)的開(kāi)發(fā)人員不能錯(cuò)過(guò)的經(jīng)典論著。
14) Chuck Lam撰寫(xiě)的Hadoop in Action
Hadoop in Action by Chuck Lam
這本書(shū)以非常簡(jiǎn)單易行的方式解釋了與Hadoop相關(guān)的知識(shí)要點(diǎn),即使是剛剛上手的新人也能輕松掌握。本書(shū)的前三章涵蓋了Hadoop技術(shù)的基礎(chǔ)性內(nèi)容,接下來(lái)的三章專注于MapReduce算法,而最后則面向五種常見(jiàn)MapReduce技術(shù)作出闡釋。
15) Jason Venner撰寫(xiě)的Pro Hadoop
Pro Hadoop by Jason Venner
這本書(shū)的立意在于撥亂反正,幫助大家了解如何避免各類常見(jiàn)編程錯(cuò)誤以及如何對(duì)這些問(wèn)題進(jìn)行排查。這是一部新人在學(xué)習(xí)過(guò)程中不可錯(cuò)過(guò)的寶典,因?yàn)槠渲械娜孔h題皆以簡(jiǎn)潔易懂的方式進(jìn)行說(shuō)明。
隨著云計(jì)算的迅速崛起以及數(shù)據(jù)管理資源的嚴(yán)重缺失,我們需要一種新的技術(shù)成果解決此類問(wèn)題,而Hadoop確實(shí)能夠很好地完成這項(xiàng)歷史任務(wù)。Hadoop的未來(lái)可謂一片光明,而希望借此良機(jī)實(shí)現(xiàn)職業(yè)生涯飛躍的從業(yè)者們則應(yīng)當(dāng)馬上投入學(xué)習(xí),并由此踏上另一條不同于以往的發(fā)展道路。因此,希望大家能夠在了解到這份推薦清單之后從中找到適合自己的學(xué)習(xí)資源,并在自我提升的道路上高歌猛進(jìn)。
相信大家在Hadoop學(xué)習(xí)過(guò)程當(dāng)中,也整理出了自己的一套心得體會(huì)。請(qǐng)?jiān)谠u(píng)論欄中與大家分享您的真知灼見(jiàn),我們期待著來(lái)自您的更多大數(shù)據(jù)及Hadoop學(xué)習(xí)資源推薦。
原文標(biāo)題:15 Best ways to learn Hadoop Technology
核子可樂(lè)譯