自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

玩轉(zhuǎn)Hadoop分布式集群搭建

作者：純潔的微笑 2017-08-10 10:17:32

云計(jì)算分布式 Hadoop

Hadoop的搭建有三種方式，單機(jī)版適合開發(fā)調(diào)試;偽分布式版，適合模擬集群學(xué)習(xí);完全分布式，生產(chǎn)使用的模式。這篇文件介紹如何搭建完全分布式的hadoop集群，一個(gè)主節(jié)點(diǎn)，三個(gè)數(shù)據(jù)節(jié)點(diǎn)為例來講解。

終于要開始玩大數(shù)據(jù)了，之前對(duì)haoop生態(tài)幾乎沒有太多的了解，現(xiàn)在趕鴨子上架，需要完全使用它來做數(shù)據(jù)中心，這是我的haoop***篇文章，以后估計(jì)會(huì)寫很多大數(shù)據(jù)相關(guān)的文章。

Hadoop的搭建有三種方式，單機(jī)版適合開發(fā)調(diào)試;偽分布式版，適合模擬集群學(xué)習(xí);完全分布式，生產(chǎn)使用的模式。這篇文件介紹如何搭建完全分布式的hadoop集群，一個(gè)主節(jié)點(diǎn)，三個(gè)數(shù)據(jù)節(jié)點(diǎn)為例來講解。

基礎(chǔ)環(huán)境

環(huán)境準(zhǔn)備

1、軟件版本

四臺(tái)服務(wù)器配置，系統(tǒng)：centos6.5、內(nèi)存：1G、硬盤：20G

四臺(tái)服務(wù)器分配的IP地址：192.168.0.71/72/73/74

規(guī)劃：71用作主節(jié)點(diǎn)用作hadoop-master，其它三臺(tái)為數(shù)據(jù)節(jié)點(diǎn)72、73、74用作hadoop-salve1~3

jdk和生成保持一致使用1.7版本

hadoop使用2.7.3版本，下載地址：http://apache.claz.org/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz

2、host配置和主機(jī)名(四臺(tái))

修改四臺(tái)服務(wù)器的hosts文件

vim /etc/hosts

192.168.0.71 hadoop-master  
192.168.0.72 hadoop-slave1  
192.168.0.73 hadoop-slave2  
192.168.0.74 hadoop-slave3

分別斯塔服務(wù)器的主機(jī)名:HOSTNAME，master為例說明

vi /etc/sysconfig/network

HOSTNAME=hadoop-master

執(zhí)行reboot后生效，完成之后依次修改其它salve服務(wù)器為： hadoop-slave1~3。

3、服務(wù)器安裝jdk(四臺(tái))

建議使用yum安裝jdk,也可以自行下載安裝

yum -y install java-1.7.0-openjdk*

配置環(huán)境變量，修改配置文件vim /etc/profile

export JAVA_HOME=/usr/lib/jvm/jre-1.7.0-openjdk.x86_64 
export PATH=$JAVA_HOME/bin:$PATH 
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

使用souce命令讓立刻生效

source /etc/profile

免密登陸

一、首先關(guān)閉四臺(tái)服務(wù)器的防火墻和SELINUX

查看防火墻狀態(tài)

service iptables status

關(guān)閉防火墻

service iptables stop  
chkconfig iptables off

關(guān)閉SELINUX后，需要重啟服務(wù)器

-- 關(guān)閉SELINUX 
# vim /etc/selinux/config 
-- 注釋掉 
#SELINUX=enforcing 
#SELINUXTYPE=targeted 
-- 添加 
SELINUX=disabled

二、免密碼登錄本機(jī)

下面以配置hadoop-master本機(jī)無密碼登錄為例進(jìn)行講解，用戶需參照下面步驟完成h-salve1~3三臺(tái)子節(jié)點(diǎn)機(jī)器的本機(jī)無密碼登錄;

1)生產(chǎn)秘鑰

ssh-keygen -t rsa

2)將公鑰追加到”authorized_keys”文件

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

3)賦予權(quán)限

chmod 600 .ssh/authorized_keys

4)驗(yàn)證本機(jī)能無密碼訪問

ssh hadoop-master

***，依次配置h-salve1~3無密碼訪問

二、hadoop-master本機(jī)無密碼登錄hadoop-slave1、hadoop-slave2、hadoop-slave3，以hadoop-master無密碼登錄hadoop-slave1為例進(jìn)行講解：

1)登錄hadoop-slave1 ，復(fù)制hadoop-master服務(wù)器的公鑰”id_rsa.pub”到hadoop-slave1服務(wù)器的”root”目錄下。

scp root@hadoop-master:/root/.ssh/id_rsa.pub /root/

2)將hadoop-master的公鑰(id_rsa.pub)追加到hadoop-slave1的authorized_keys中

cat id_rsa.pub >> .ssh/authorized_keys 
rm -rf  id_rsa.pub

3)在 hadoop-master上面測(cè)試

ssh hadoop-slave1

三、配置hadoop-slave1~hadoop-slave3本機(jī)無密碼登錄hadoop-master

下面以hadoop-slave1無密碼登錄hadoop-master為例進(jìn)行講解，用戶需參照下面步驟完成hadoop-slave2~hadoop-slave3無密碼登錄hadoop-master。

1)登錄hadoop-master，復(fù)制hadoop-slave1服務(wù)器的公鑰”id_rsa.pub”到hadoop-master服務(wù)器的”/root/”目錄下。

scp root@hadoop-slave1:/root/.ssh/id_rsa.pub /root/

2)將hadoop-slave1的公鑰(id_rsa.pub)追加到hadoop-master的authorized_keys中。

cat id_rsa.pub >> .ssh/authorized_keys 
rm -rf  id_rsa.pub //刪除id_rsa.pub

3)在 hadoop-slave1上面測(cè)試

ssh hadoop-master

依次配置 hadoop-slave2、hadoop-slave3

到此主從的無密登錄已經(jīng)完成了。

Hadoop環(huán)境搭建

配置hadoop-master的hadoop環(huán)境

1、hadoop-master上解壓縮安裝包及創(chuàng)建基本目錄

#下載   
wget http://apache.claz.org/hadoop/common/hadoop-2.7.3/hadoop-2.7.3.tar.gz 
#解壓   
tar -xzvf  hadoop-2.7.3.tar.gz    -C /usr/local  
#重命名    
mv  hadoop-2.7.3  hadoop

2、配置hadoop-master的hadoop環(huán)境變量

1)配置環(huán)境變量，修改配置文件vi /etc/profile

export HADOOP_HOME=/usr/local/hadoop 
export PATH=$PATH:$HADOOP_HOME/bin

使得hadoop命令在當(dāng)前終端立即生效

source /etc/profile

下面配置，文件都在：/usr/local/hadoop/etc/hadoop路徑下

2、配置core-site.xml

修改Hadoop核心配置文件/usr/local/hadoop/etc/hadoop/core-site.xml，通過fs.default.name指定NameNode的IP地址和端口號(hào)，通過hadoop.tmp.dir指定hadoop數(shù)據(jù)存儲(chǔ)的臨時(shí)文件夾。

<configuration> 
    <property> 
        <name>hadoop.tmp.dir</name> 
        <value>file:/usr/local/hadoop/tmp</value> 
        <description>Abase for other temporary directories.</description> 
    </property> 
    <property> 
        <name>fs.defaultFS</name> 
        <value>hdfs://hadoop-master:9000</value> 
    </property> 
</configuration>

特別注意：如沒有配置hadoop.tmp.dir參數(shù)，此時(shí)系統(tǒng)默認(rèn)的臨時(shí)目錄為：/tmp/hadoo-hadoop。而這個(gè)目錄在每次重啟后都會(huì)被刪除，必須重新執(zhí)行format才行，否則會(huì)出錯(cuò)。

3、配置hdfs-site.xml：

修改HDFS核心配置文件/usr/local/hadoop/etc/hadoop/hdfs-site.xml，通過dfs.replication指定HDFS的備份因子為3，通過dfs.name.dir指定namenode節(jié)點(diǎn)的文件存儲(chǔ)目錄，通過dfs.data.dir指定datanode節(jié)點(diǎn)的文件存儲(chǔ)目錄。

<configuration> 
    <property> 
        <name>dfs.replication</name> 
        <value>3</value> 
    </property> 
    <property> 
        <name>dfs.name.dir</name> 
        <value>/usr/local/hadoop/hdfs/name</value> 
    </property> 
    <property> 
        <name>dfs.data.dir</name> 
        <value>/usr/local/hadoop/hdfs/data</value> 
    </property> 
</configuration>

4、配置mapred-site.xml

拷貝mapred-site.xml.template為mapred-site.xml，在進(jìn)行修改

cp /usr/local/hadoop/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/etc/hadoop/mapred-site.xml   
vim /usr/local/hadoop/etc/hadoop/mapred-site.xml

<configuration> 
  <property> 
      <name>mapreduce.framework.name</name> 
      <value>yarn</value> 
  </property> 
   <property> 
      <name>mapred.job.tracker</name> 
      <value>http://hadoop-master:9001</value> 
  </property> 
</configuration>

5、配置yarn-site.xml

<configuration> 
<!-- Site specific YARN configuration properties --> 
    <property> 
        <name>yarn.nodemanager.aux-services</name> 
        <value>mapreduce_shuffle</value> 
    </property> 
    <property> 
        <name>yarn.resourcemanager.hostname</name> 
        <value>hadoop-master</value> 
    </property> 
</configuration>

6、配置masters文件

修改/usr/local/hadoop/etc/hadoop/masters文件，該文件指定namenode節(jié)點(diǎn)所在的服務(wù)器機(jī)器。刪除localhost，添加namenode節(jié)點(diǎn)的主機(jī)名hadoop-master;不建議使用IP地址，因?yàn)镮P地址可能會(huì)變化，但是主機(jī)名一般不會(huì)變化。

vi /usr/local/hadoop/etc/hadoop/masters 
## 內(nèi)容 
hadoop-master

7、配置slaves文件(Master主機(jī)特有)

修改/usr/local/hadoop/etc/hadoop/slaves文件，該文件指定哪些服務(wù)器節(jié)點(diǎn)是datanode節(jié)點(diǎn)。刪除locahost，添加所有datanode節(jié)點(diǎn)的主機(jī)名，如下所示。

vi /usr/local/hadoop/etc/hadoop/slaves 
## 內(nèi)容 
hadoop-slave1 
hadoop-slave2 
hadoop-slave3

配置hadoop-slave的hadoop環(huán)境

下面以配置hadoop-slave1的hadoop為例進(jìn)行演示，用戶需參照以下步驟完成其他hadoop-slave2~3服務(wù)器的配置。

1)復(fù)制hadoop到hadoop-slave1節(jié)點(diǎn)

scp -r /usr/local/hadoop hadoop-slave1:/usr/local/

登錄hadoop-slave1服務(wù)器，刪除slaves內(nèi)容

rm -rf /usr/local/hadoop/etc/hadoop/slaves

2)配置環(huán)境變量

vi /etc/profile 
## 內(nèi)容 
export HADOOP_HOME=/usr/local/hadoop 
export PATH=$PATH:$HADOOP_HOME/bin

使得hadoop命令在當(dāng)前終端立即生效;

source /etc/profile

依次配置其它slave服務(wù)

啟動(dòng)集群

1、格式化HDFS文件系統(tǒng)

進(jìn)入master的~/hadoop目錄，執(zhí)行以下操作

bin/hadoop namenode -format

格式化namenode，***次啟動(dòng)服務(wù)前執(zhí)行的操作，以后不需要執(zhí)行。

2、然后啟動(dòng)hadoop：

sbin/start-all.sh

3、使用jps命令查看運(yùn)行情況

#master 執(zhí)行 jps查看運(yùn)行情況 
25928 SecondaryNameNode 
25742 NameNode 
26387 Jps 
26078 ResourceManager

#slave 執(zhí)行 jps查看運(yùn)行情況 
24002 NodeManager 
23899 DataNode 
24179 Jps

4、命令查看Hadoop集群的狀態(tài)

通過簡(jiǎn)單的jps命令雖然可以查看HDFS文件管理系統(tǒng)、MapReduce服務(wù)是否啟動(dòng)成功，但是無法查看到Hadoop整個(gè)集群的運(yùn)行狀態(tài)。我們可以通過hadoop dfsadmin -report進(jìn)行查看。用該命令可以快速定位出哪些節(jié)點(diǎn)掛掉了，HDFS的容量以及使用了多少，以及每個(gè)節(jié)點(diǎn)的硬盤使用情況。

hadoop dfsadmin -report

輸出結(jié)果：

Configured Capacity: 50108030976 (46.67 GB) 
Present Capacity: 41877471232 (39.00 GB) 
DFS Remaining: 41877385216 (39.00 GB) 
DFS Used: 86016 (84 KB) 
DFS Used%: 0.00% 
Under replicated blocks: 0 
Blocks with corrupt replicas: 0 
Missing blocks: 0 
Missing blocks (with replication factor 1): 0 
......

5、hadoop 重啟

sbin/stop-all.sh 
sbin/start-all.sh

錯(cuò)誤

在搭建完成啟動(dòng)的時(shí)候，發(fā)生過兩個(gè)錯(cuò)誤：

1、 xxx: Error: JAVA_HOME is not set and could not be found

這個(gè)錯(cuò)誤意思沒有找到j(luò)dk的環(huán)境變量，需要在hadoop-env.sh配置。

vi /usr/local/hadoop/etc/hadoop/hadoop-env.sh  
## 配置項(xiàng) 
export JAVA_HOME=/usr/lib/jvm/jre-1.7.0-openjdk.x86_64

2、The authenticity of host ‘0.0.0.0 (0.0.0.0)’ can’t be established.

解決方案關(guān)閉SELINUX

-- 關(guān)閉SELINUX 
# vim /etc/selinux/config 
-- 注釋掉 
#SELINUX=enforcing 
#SELINUXTYPE=targeted 
— 添加 
SELINUX=disabled

【本文為51CTO專欄作者“純潔的微笑”的原創(chuàng)稿件，轉(zhuǎn)載請(qǐng)通過微信公眾號(hào)聯(lián)系作者獲取授權(quán)】

戳這里，看該作者更多好文

責(zé)任編輯：武曉燕來源： 51CTO專欄

Hadoop 分布式搭建

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)