自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

運維經(jīng)驗分享：Hadoop管理員的十個最佳實踐

作者：張月 2012-09-03 10:39:13

運維系統(tǒng)運維 Hadoop

大多數(shù)管理員都是從Apache Hadoop開始學習。筆者最開始也使用Apache版本Hadoop進行開發(fā)和部署工作，但接觸到Cloudera CDH后，我發(fā)現(xiàn)它可以使管理員的工作更簡單，不僅可以獲得最新的特性和Bug修復，有時也會帶來令人驚喜的性能改善。

接觸Hadoop有兩年的時間了，期間遇到很多的問題，既有經(jīng)典的NameNode和JobTracker內(nèi)存溢出故障，也有HDFS存儲小文件問題，既有任務(wù)調(diào)度問題，也有MapReduce性能問題.遇到的這些問題有些是Hadoop自身的缺陷（短板），有些則是使用的不當。

在解決問題的過程中，有時需要翻源碼，有時會向同事、網(wǎng)友請教，遇到復雜問題則會通過mail list向全球各地Hadoop使用者,包括Hadoop Committer（Hadoop開發(fā)者）求助。在獲得很多人幫助后，自己將遇到問題和心得整理成文，希望本文可以對那些焦頭爛額的Hadoop新手們有所幫助，少走筆者的彎路。

PS. 本文基于 Cloudera CDH 3u4（同Apache Hadoop 1.0）編寫。相關(guān)推薦配置為官方推薦值或者筆者經(jīng)驗數(shù)值，它不是絕對的，可能會因為不同的應(yīng)用場景和硬件環(huán)境有所出入。

1. 選擇Cloudera CDH部署你的Cluster

動機

大多數(shù)管理員都是從Apache Hadoop開始學習。筆者最開始也使用Apache版本Hadoop進行開發(fā)和部署工作，但接觸到Cloudera CDH后，我發(fā)現(xiàn)它可以使管理員的工作更簡單，不僅可以獲得最新的特性和Bug修復，有時也會帶來令人驚喜的性能改善。

CDH為什么更好？筆者羅列了以下幾點：

CDH基于穩(wěn)定版Apache Hadoop，并應(yīng)用了最新Bug修復或者Feature的Patch。Cloudera常年堅持季度發(fā)行Update版本，年度發(fā)行Release版本，更新速度比Apache官方快，而且在實際使用過程中CDH表現(xiàn)無比穩(wěn)定，并沒有引入新的問題。
Cloudera官方網(wǎng)站上安裝、升級文檔詳細，省去Google時間。
CDH支持Yum/Apt包，Tar包，RPM包，Cloudera Manager四種方式安裝，總有一款適合您。官方網(wǎng)站推薦Yum/Apt方式安裝，筆者體會其好處如下：

聯(lián)網(wǎng)安裝、升級，非常方便。當然你也可以下載rpm包到本地，使用Local Yum方式安裝。
自動下載依賴軟件包，比如要安裝Hive，則會級聯(lián)下載、安裝Hadoop。
Hadoop生態(tài)系統(tǒng)包自動匹配，不需要你尋找與當前Hadoop匹配的Hbase，F(xiàn)lume，Hive等軟件，Yum/Apt會根據(jù)當前安裝Hadoop版本自動尋找匹配版本的軟件包，并保證兼容性。
自動創(chuàng)建相關(guān)目錄并軟鏈到合適的地方（如conf和logs等目錄）；自動創(chuàng)建hdfs, mapred用戶，hdfs用戶是HDFS的最高權(quán)限用戶，mapred用戶則負責mapreduce執(zhí)行過程中相關(guān)目錄的權(quán)限。

推薦指數(shù)：★★★

推薦理由：獲取最新特性和最新Bug修復；安裝維護方便，節(jié)省運維時間。

2. Hadoop集群配置與管理

安裝和維護Hadoop集群涉及大量的管理工作，包括軟件安裝，設(shè)備管理（crontab、iptables等）、配置分發(fā)等。

對于小型集群軟件分發(fā)和節(jié)點管理可以使用PDSH這款軟件，它可以通過免密鑰的SSH將文件分發(fā)到目標服務(wù)器，以及為一組目標設(shè)備發(fā)送命令并獲得反饋。如果是大型集群或者硬件配置差別很大的集群，推薦使用puppet這樣的工具幫助你維護配置文件，或者通過Cloudera Manager以GUI的方式的管理集群（注意：Clodera Manager不是開源軟件，免費版最多支持50個節(jié)點）。

推薦指數(shù)：★★★

推薦理由：提高運維效率

3. 開啟SecondaryNameNode

SecondaryNameNode（下稱SNN）的主要功能是工作是幫助NameNode（下稱NN）合并編輯日志，然后將合并后的鏡像文件copy回NN，以減少NN重啟時合并編輯日志所需的時間。SNN不是NN的熱備，但是通過以下步驟可以實現(xiàn)將SNN切換為NN的目的。首先，SNN節(jié)點上導入從NN Copy過來的鏡像文件，然后修改SNN機器名和IP與NN一致，最后重啟集群。

特別注意的是SNN的內(nèi)存配置要與NN一致，因為合并編輯日志的工作需要將metadata加載到內(nèi)存完成。另外，不僅僅是SNN，任何保存NN鏡像的節(jié)點都可以通過上面步驟變?yōu)镹N，只是SNN更適合罷了。

推薦指數(shù)：★★★

推薦理由：減少NN重啟導致集群服務(wù)中斷時間；NN節(jié)點故障后，SNN充當NN角色

4. 使用Ganglia和Nagios監(jiān)控你的集群

當運行一個大型mapreduce 作業(yè)時，我們通常非常關(guān)心該作業(yè)對TaskTracker（下稱TT）CPU、內(nèi)存、磁盤，以及整個網(wǎng)絡(luò)的帶寬情況，這時候就需要Ganglia這個工具為我們生成相關(guān)圖表來診斷、分析問題。

Ganglia可以監(jiān)控集群狀態(tài)，但當你的服務(wù)器down機或者某個TT掛掉，它卻無法通知到你，這時我們可以使用Nagios這款告警軟件，它可以配置郵件告警和短息告警。通過編寫plugins，可以實現(xiàn)自己的監(jiān)控功能。我們的集群目前做了如下監(jiān)控：

NameNode、JobTracker內(nèi)存
DataNode和TaskTracker運行狀態(tài)
NFS服務(wù)狀態(tài)
磁盤使用情況
服務(wù)器負載狀態(tài)

推薦指數(shù)：★★★

推薦理由：Ganglia可以幫你記錄集群狀態(tài)，方便診斷問題；Nagios可以再遇到問題時第一時間通知你。

5. 設(shè)置好內(nèi)存至關(guān)重要

Hadoop集群安裝完畢后，第一件事就是修改bin/hadoop-evn.sh文件設(shè)置內(nèi)存。主流節(jié)點內(nèi)存配置為32GB，典型場景內(nèi)存設(shè)置如下：

NN: 15-25 GB  
JT：2-4GB  
DN：1-4 GB  
TT：1-2 GB，Child VM 1-2 GB

集群的使用場景不同相關(guān)設(shè)置也有不同，如果集群有大量小文件，則要求NN內(nèi)存至少要20GB，DN內(nèi)存至少2GB。

推薦指數(shù)：★★★★★

推薦理由：幾個組件中NN對內(nèi)存最為敏感，它有單點問題，直接影響到集群的可用性；JT同樣是單點，如果JT內(nèi)存溢出則所有MapReduce Job都無法正常執(zhí)行。

6. 管理員玩轉(zhuǎn)MapReduce

Hadoop原生MapReduce需要Java語言編寫，但是不會Java也沒問題，通過Hadoop streaming框架管理員可以使用Python，Shell，Perl等語言進行MapReduce開發(fā)，但更簡單的辦法是安裝和使用Hive或者Pig。

推薦指數(shù)：★★★

推薦理由：減少運維時間，快速響應(yīng)各種ad-hot需求和故障診斷。

7. NameNode HA

前面已經(jīng)說過，NN是整個集群可能出現(xiàn)的單點故障。

Hadoop通過在hdfs.site.xml文件的dfs.name.dir屬性指定保持的metadata路徑，如果希望保持到多個路徑，可以使用逗號分割配置多個路徑。

<property> 
    <name>dfs.name.dir</name> 
    <value>/data/cache1/dfs/nn,/data/cache2/dfs/nn</value> 
</property>

Hadoop官方推薦配置為metadata配置多個path，其中包含一個NFS的路徑。但根據(jù)筆者一次集群嚴重故障經(jīng)驗，即使這樣，還是導致了所有鏡像文件損壞，包括SNN上的鏡像文件，所以定期備份一個可用的副本還是很有必要的。

推薦指數(shù)：★★★★★

推薦理由：Cloudera3uX和Apache1.0的NN單點問題是大家最頭痛問題之一，多些準備，少許痛苦。

8. 使用firewall阻止壞人進入

Hadoop的安全控制非常簡單，只包含簡單的權(quán)限，即只根據(jù)客戶端用戶名，決定使用權(quán)限。它的設(shè)計原則是：“避免好人做錯事，但不阻止壞人做壞事”。

如果你知道某臺NN的IP和端口，則可以很輕松獲取HDFS目錄結(jié)構(gòu)，并通過修改本機機器用戶名偽裝成HDFS文件所屬owner，對該文件進行刪除操作。

通過配置kerberos，可以實現(xiàn)身份驗證。但很多管理員使用更簡單有效的辦法——通過防火墻對訪問IP進行控制。

推薦指數(shù)：★★★★★

推薦理由：安全無小事，防范于未然。

9. 開啟垃圾箱(trash)功能

動機

我曾經(jīng)犯下一個錯誤，在我加班非常累，大腦稍有混亂的時候，不小心刪除執(zhí)行了一個命令“hadoop fs -rmr /xxx/xxx”，沒有刪除提示，幾TB的數(shù)據(jù)，一下子就沒有了。簡直讓我崩潰，后悔莫及。這時你多希望有個時間機器可以讓HDFS恢復到刪除前的狀態(tài)。

trash功能就是這個時間機器，它默認是關(guān)閉的，開啟后，被你刪除的數(shù)據(jù)將會mv到操作用戶目錄的".Trash"文件夾，可以配置超過多長時間，系統(tǒng)自動刪除過期數(shù)據(jù)。這樣一來，當操作失誤的時候，可以把數(shù)據(jù)mv回來。開啟垃圾箱步驟如下：

vi core-site.xml ，添加下面配置，value單位為分鐘。

<property>    
  <name>fs.trash.interval</name>    
  <value>1440</value>    
</property>

筆者在CDpu4下不用重啟Namenode就可以生效。開啟垃圾箱后，如果希望文件直接被刪除，可以在使用刪除命令時添加“–skipTrash” 參數(shù)，如下：

hadoop fs –rm –skipTrash /xxxx

推薦指數(shù)：★★★★★

推薦理由：想要時間機器嗎？

10. 去社區(qū)尋找?guī)椭?/strong>

Hadoop是一個非常優(yōu)秀的開源項目，但它仍存有很多尚未解決的問題，諸如，NN,JT單點問題，JT掛死問題，Block在小文件下匯報效率低下等問題。此時可以通過如下渠道找到可以幫助你的人，筆者幾次集群嚴重故障都是通過Cloudera公司的google user group直接獲得幾位 committer的幫助。通常前一天提問，第二天就會有反饋。下面是兩個能夠幫助的你的社區(qū)，當然你也可以幫助其他人：

Apache hadoop的mail list :

http://hadoop.apache.org/mailing_lists.html

Cloudera CDH google group:

https://groups.google.com/a/cloudera.org/forum/#!forum/cdh-user

推薦指數(shù)：★★★★★

推薦理由：沒有人比軟件作者更熟悉Hadoop本身，去社區(qū)求助，幫你解決很多自己無法跨越的問題。

責任編輯：黃丹來源： infoq

Hadoop 管理員

分享到微信

微信掃碼分享

分享到微博

相關(guān)推薦

Hadoop管理員的十個最佳實踐
接觸Hadoop有兩年的時間了，期間遇到很多的問題，既有經(jīng)典的NameNode和JobTracker內(nèi)存溢出故障，也有HDFS存儲小文件問題，既有任務(wù)調(diào)度問題，也有MapReduce性能問題.遇到的這些問題有些是Hadoop自身的缺陷（短板），有些則是使用的不當。

2012-09-03 10:33:43

Hadoop管理員的十個最佳實踐
Hadoop工具因大數(shù)據(jù)的火熱而流行起來，但你是否真的已經(jīng)掌握的Hadoop的使用技能，本文基于ClouderaCDH3u4編寫的，提供了一些關(guān)于Hadoop的管理方法。

2012-10-29 09:30:47

Hadoop Hadoop集群 Hadoop生態(tài)系統(tǒng)包

十個網(wǎng)絡(luò)管理最佳實踐
現(xiàn)代網(wǎng)絡(luò)現(xiàn)在不僅支持個人電池和服務(wù)器，還支持不斷增長的各種智能設(shè)備，如恒溫器、門鎖，甚至自動售貨機。研究機構(gòu)IoTAnalytics公司的一份物聯(lián)網(wǎng)現(xiàn)狀報告預測，到2025年，將有250億臺聯(lián)網(wǎng)的物聯(lián)網(wǎng)設(shè)備。

2023-09-12 06:55:27

特權(quán)訪問管理的十個最佳實踐
每次制定新的網(wǎng)絡(luò)安全政策時，確保明確向員工宣布并解釋其重要性。信息充分的員工更有可能遵守信息安全協(xié)議，避免可能危及組織安全的風險行為。

2025-03-18 00:10:00

IT運維管理的最佳實踐
ITIL是IT基礎(chǔ)架構(gòu)運維管理最佳實踐的集合，從戰(zhàn)略到實踐的角度出發(fā)，闡述ITIL對IT運維管理的指導，并以筆者的實際工作經(jīng)歷給出ITlL在服務(wù)管理中的一些具體應(yīng)用方法和經(jīng)驗。

2013-06-09 10:38:54

IT運維管理運維管理 ITIL管理

特權(quán)訪問管理應(yīng)遵循的十個最佳實踐
組織安全意識培訓對于有效監(jiān)控特權(quán)用戶非常重要。沒有適當?shù)木W(wǎng)絡(luò)安全知識的用戶可能不理解監(jiān)控它們的必要性，甚至可能試圖欺騙或破壞所實施的安全工具和策略。

2023-05-24 12:33:35

Python 日志記錄：十個日志管理的最佳實踐
本文介紹了十個Python日志管理的優(yōu)秀實踐，通過這些技巧，你可以更好地管理和優(yōu)化你的日志記錄系統(tǒng)。

2024-11-29 10:00:00

Python 日志記錄

十個精妙的Java編碼最佳實踐
這是一個比JoshBloch的EffectiveJava規(guī)則更精妙的10條Java編碼實踐的列表。和JoshBloch的列表容易學習并且關(guān)注日常情況相比，這個列表將包含涉及APISPI設(shè)計中不常見的情況，可能有很大影響。

2015-06-24 10:07:34

Java 編碼最佳實踐

安全運維的十個靈魂拷問
近日安全牛有幸邀請到了行業(yè)資深專家杜建榮先生，從組織、流程、人員幾個方面，圍繞安全運維中的十個常見問題，來解答企業(yè)在安全運維中可能遇到的疑問，以下是主要內(nèi)容

2020-05-29 11:48:01

安全運維信息安全網(wǎng)絡(luò)安全

構(gòu)建強大REST API的十個最佳實踐
RESTAPI不應(yīng)在服務(wù)器上維護狀態(tài)，這是客戶端的責任。這很重要，因為它可以使API具備可緩存性、可擴展性，并使其與客戶端解耦。

2023-12-06 07:13:16

REST API 客戶端

設(shè)計下拉菜單的十個最佳實踐
下拉菜單是一種標準UI控件，它提供了一種干凈直觀的方式來向用戶呈現(xiàn)選項列表。然而，如果設(shè)計不當，它們可能會讓用戶感到困惑。本文將討論一些幫助您創(chuàng)建下拉菜單以增強產(chǎn)品可用性的最佳實踐。

2024-09-23 00:00:00

下拉菜單 UI 控件

【干貨分享】360網(wǎng)絡(luò)運維的最佳實踐
李洪亮，奇虎360網(wǎng)絡(luò)運維負責人。2007年加入360公司，目前已有11年的網(wǎng)絡(luò)與網(wǎng)絡(luò)安全工作經(jīng)驗，擁有CISSP和CCNP證書，帶領(lǐng)團隊實現(xiàn)了奇虎360網(wǎng)絡(luò)架構(gòu)從1000臺服務(wù)器到10萬臺服務(wù)器的跨越式發(fā)展。本文按照360公司服務(wù)器發(fā)展的不同階段，分享在網(wǎng)絡(luò)建設(shè)和運維過程中遇到的哪些挑戰(zhàn)、陷阱、經(jīng)驗和收獲。

2015-09-01 09:23:38

360 網(wǎng)絡(luò)運維

十個 Linux 新手管理員易犯錯誤
如果您是Linux的新手，那么一些常見錯誤很可能會給您帶來麻煩。提前了解它們，您就可以再逐漸熟悉Linux時避免出現(xiàn)重大問題。

2019-12-20 09:29:25

Linux 數(shù)據(jù)庫軟件

經(jīng)驗分享學習新語言的十個方法
本文介紹的是十種方法，這十種方法可以幫助你更好的學習另一種新的編程語言。希望對你有幫助，一起來看。

2011-07-13 18:09:07

編程語言

運維工作經(jīng)驗總結(jié)：逃離系統(tǒng)故障的十個心得
系統(tǒng)故障，對于DBA或是運維人員來說，都是心中永遠的痛。每次創(chuàng)傷、都是一次成熟、這便是運維人員的真實寫照。本文是作者對自己運維工作的經(jīng)驗總結(jié)，分享了逃離系統(tǒng)故障的十個心得，希望對大家有幫助。

2013-04-02 10:24:22

系統(tǒng)故障運維

一名運維小哥對運維規(guī)則的十個總結(jié)
作為一個IT小哥，在閱覽技術(shù)書籍時，看到作者對運維規(guī)則的總結(jié)，反復閱讀幾遍后，發(fā)現(xiàn)其內(nèi)容言簡而意賅，質(zhì)樸而真諦。

2021-11-05 11:56:34

運維規(guī)則書籍

企業(yè)補丁管理的十個優(yōu)秀實踐
隨著軟件供應(yīng)鏈和零日漏洞攻擊日益猖獗，基于邊界的安全工具（例如防火墻、入侵防御系統(tǒng)等網(wǎng)絡(luò)安全工具）已經(jīng)力不從心，最佳緩解方式就是直接修補軟件和固件，這意味著補丁管理的重要性正與日俱增。

2024-04-08 14:33:18

Python 項目管理的十個優(yōu)秀實踐
對于Python開發(fā)者來說，掌握一些項目管理的最佳實踐可以大大提高項目的成功率。今天，我們就來聊聊Python項目管理的十個最佳實踐。

2024-11-21 17:22:40

微服務(wù)和容器安全應(yīng)用的十個最佳實踐
服務(wù)編排是個復雜的過程，可使微服務(wù)和容器的部署、管理、擴展和連接實現(xiàn)自動化。編排器負責從注冊中心提取映像，將這些映像部署到容器，并管理容器運行。編排器提供的抽象讓用戶可以指定運行某個映像所必需的容器數(shù)量，以及需要為它們分配哪些主機資源。

2022-11-02 12:17:41

編寫Node.js Rest API的十個最佳實踐
Node.js除了用來編寫WEB應(yīng)用之外，還可以用來編寫API服務(wù)，我們在本文中會介紹編寫Node.jsRESTAPI的最佳實踐，包括如何命名路由、進行認證和測試等話題，內(nèi)容摘要如下：

2017-03-06 13:20:31

相似話題

數(shù)據(jù)庫運維
 1517內(nèi)容

服務(wù)器運維
 1421內(nèi)容

網(wǎng)絡(luò)運維
 2250內(nèi)容

自動化
 1114內(nèi)容
全部話題

同話題下的熱門內(nèi)容

Linux 日志輪轉(zhuǎn)機制 logrotate 詳解（超詳細版）實戰(zhàn)：Linux系統(tǒng)時間不同步的三種修復方法一文搞懂 rsync：原理剖析 + Rocky Linux 主機同步部署實戰(zhàn)從定時到實時：用 inotify+rsync 實現(xiàn)文件高效同步新手最容易踩的五個 Linux 坑，你踩過幾個？

相關(guān)專題更多

解讀惠普Z系列工作站ZBook Ultra G1a高性能移動

HPE ProLiant DL145 Gen11 服務(wù)器解讀

2025-04-21 09:59:50

開發(fā)者成長學院 | 成長有徑 · 代碼有方

2025-04-23 08:49:09

我收藏的內(nèi)容

微博

QQ

微信

復制鏈接

微信掃碼分享

51CTO業(yè)務(wù)

媒體
51CTO CIOAge HC3i Techplur
社區(qū)
51CTO博客軟考社區(qū)鴻蒙開發(fā)者社區(qū)AI.x社區(qū)
教育
51CTO學堂精培企業(yè)培訓 CTO訓練營

51CTO學堂

51CTO學堂企業(yè)版

51CTO官微

51CTO

關(guān)于我們&條款

關(guān)于我們

新聞動態(tài)

站點地圖

意見反饋

English

用戶協(xié)議

隱私協(xié)議

北京市海淀區(qū)中關(guān)村南1條甲1號ECO中科愛克大廈6-7層

北京市公安局海淀分局備案編號：110108002980號
營業(yè)執(zhí)照京ICP備09067568號

Copyright ? 2005-2025 51CTO.COM 京ICP證060544 版權(quán)所有未經(jīng)許可請勿轉(zhuǎn)載

營業(yè)執(zhí)照出版物經(jīng)營許可證

友情鏈接

新浪科技騰訊科技網(wǎng)易科技鳳凰科技驅(qū)動科技科技行者 TechWeb 艾瑞網(wǎng)站長之家速途網(wǎng)中國經(jīng)濟新聞網(wǎng)IT之家工聯(lián)網(wǎng)極客公園 236視頻會議中國IDC圈企業(yè)網(wǎng)D1Net 投資界次方元火山引擎

51CTO技術(shù)棧公眾號

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

在線客服

媒體
51CTO CIOAge HC3i

社區(qū)
51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育
51CTO學堂精培企業(yè)培訓 CTO訓練營

感谢您访问我们的网站，您可能还对以下资源感兴趣：
自拍偷在线精品自拍偷

^{<blockquote id="pedmo"></blockquote>}