自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Hadoop完全分布模式安裝實現(xiàn)詳解

開發(fā) 架構(gòu) Hadoop
Hadoop的三種可用的安裝模式你是否熟悉,這里就向大家介紹一下完全分布模式實現(xiàn)Hadoop安裝,歡迎大家一起來學習Hadoop安裝方法,通過本文的介紹相信你對Hadoop安裝可用模式有一定的認識。

本節(jié)向大家介紹一下Hadoop完全分布模式安裝方法,你可以和之前介紹的兩種模式做一下對比,看看那種模式更適合你,歡迎大家一起來學習Hadoop完全分布模式安裝。

Hadoop完全分布模式安裝

Hadoop概念
  Hadoop是一個分布式系統(tǒng)基礎架構(gòu),由Apache基金會開發(fā)。用戶可以在不了解分布式底層細節(jié)的情況下,開發(fā)分布式程序。充分利用集群的威力高速運算和存儲。
  簡單地說來,Hadoop是一個可以更容易開發(fā)和運行處理大規(guī)模數(shù)據(jù)的軟件平臺。
  Hadoop實現(xiàn)了一個分布式文件系統(tǒng)(HadoopDistributedFileSystem),簡稱HDFS。HDFS有著高容錯性(fault-tolerent)的特點,并且設計用來部署在低廉的(low-cost)硬件上。而且它提供高傳輸率(highthroughput)來訪問應用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(largedataset)的應用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以流的形式訪問(streamingaccess)文件系統(tǒng)中的數(shù)據(jù)。當前最新版本是hadoop0.20.1。下面就hadoop0.20.1為藍本,介紹在UbuntuLinux9.10下hadoop完全分布模式安裝的方法。

支持的平臺:
  Linux,可作為開發(fā)和產(chǎn)品部署的平臺;
  Windows,可作為開發(fā)平臺。

事先需要的軟件:
  1.JavaTM1.6.x,必須安裝,建議選擇Sun公司發(fā)行的Java版本;
  2.ssh必須安裝,并保證sshd運行,hadoop將以ssh進行通訊;
  3.如果是windows,則需要裝Cygwin,用以支持shell命令。

安裝可用的模式:
  1.本地模式;
  2.偽分布模式;
  3.完全分布模式。

Hadoop完全分布模式安裝步驟(這里的步驟只讓hadoop能跑,不帶任何調(diào)優(yōu)步驟):
  
1.下載并解壓hadoop到集群中某臺服務器目標目錄。
  
2.配置/etc/hosts文件
  2.1確認集群中所有服務器均有hostname,并記錄IP
  2.2每一臺服務器的/etc/hosts文件里配置hostname和IP對應關(guān)系,加快解析速度。
  
3.配置SSH免密碼登陸
  3.1每臺服務器上運行:
     $ssh-keygen-tdsa-P''-f~/.ssh/id_dsa
     $cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys
   3.2把各臺服務器的~/.ssh/authorized_keys文件內(nèi)容合并到一個總的authorized_keys文件;
   3.3把那個總的authorized_keys文件scp到每臺服務器,替換原有的authorized_keys文件;
   3.4互相SSH對方機器,確認SSH登陸不需要密碼
  
4.配置各臺服務器時間,確保每臺服務器時間相同;Hadoop完全分布模式安裝過程中還要配置Hadoop。
  
5.配置hadoop
   5.1配置conf/hadoop-env.sh文件
    配置JAVA_HOME一行,配置正確的路徑。
   5.2配置conf/core-site.xml文件

  1. viewplaincopytoclipboardprint?  
  2. <configuration> 
  3. <property> 
  4. <name>fs.default.name</name> 
  5. <value>hdfs://host:9000</value> 
  6. </property> 
  7. </configuration> 
  8. <configuration> 
  9. <property> 
  10. <name>fs.default.name</name> 
  11. <value>hdfs://host:9000</value> 
  12. </property> 
  13. </configuration> 

注:這里的host必須改為對應的namenode的hostname
   5.3配置conf/hdfs-site.xml文件
    如果不修改使用默認設置也可以。
   5.4配置conf/mapred-site.xml文件
 

  1. viewplaincopytoclipboardprint?  
  2. <configuration> 
  3. <property> 
  4. <name>mapred.job.tracker</name> 
  5. <value>localhost:9001</value> 
  6. </property> 
  7. </configuration> 
  8. <configuration> 
  9. <property> 
  10. <name>mapred.job.tracker</name> 
  11. <value>localhost:9001</value> 
  12. </property> 
  13. </configuration> 

   注:這里的host必須改為對應的namenode的hostname
  
6.配置conf/slaves和conf/master文件
   slaves文件里寫datanode的hostname或IP,master里寫namenode、secondarynamenode的hostname或IP,每行寫一個服務器,以#開頭的行視為注釋。
  
7.分發(fā)hadoop
   直接通過scp,把hadoop整個目錄復制到各臺服務器的相同目錄即可
  
8.格式化hadoop的namenode
   執(zhí)行命令:$bin/hadoopnamenode-format
  
9.啟動hadoop
   執(zhí)行命令:$bin/start-all.sh
  至此,Hadoop完全分布模式安裝完畢,通常啟動到所有服務器完全識別出來需要一定的時間(我這里是5分鐘左右),要耐心等待,在namenode節(jié)點上,打開瀏覽器,輸入http://localhost:50070/即可看到整個hadoop情況,JobTracker情況可以看每一個服務器的http://localhost:50030/。

【編輯推薦】

  1. Hadoop偽分布模式安裝如何實現(xiàn)?
  2. Hadoop本地模式安裝如何實現(xiàn)?
  3. 專家講解 Hadoop:HBASE松散數(shù)據(jù)存儲設計
  4. 兩種模式運行Hadoop分布式并行程序
  5. Hadoop應用之Hadoop安裝篇
責任編輯:佚名 來源: csdn.net
相關(guān)推薦

2010-06-04 15:44:06

Hadoop偽分布

2010-06-04 15:27:17

Hadoop本地

2019-09-26 15:43:52

Hadoop集群防火墻

2010-06-04 16:47:49

實現(xiàn)Hadoop

2010-06-04 18:45:43

Hadoop分布式文件

2010-06-03 10:51:09

Hadoop安裝部署

2010-06-04 18:29:02

Hadoop單機模式

2010-06-03 19:46:44

Hadoop

2010-01-20 09:23:38

jBPM高級交互模式jBPM四眼原則

2009-08-25 18:04:30

C#實現(xiàn)Singlet

2009-10-23 11:30:03

無線接入技術(shù)

2022-07-03 14:03:57

分布式Seata

2011-06-28 15:18:45

Qt 單例模式

2010-06-03 19:28:02

Hadoop

2011-12-22 09:21:04

云計算Hadoop大數(shù)據(jù)

2013-12-04 13:32:30

2020-09-08 13:25:52

HBase分布式數(shù)據(jù)庫

2009-11-02 17:25:04

ADSL常見問題

2009-10-23 14:14:07

網(wǎng)吧接入網(wǎng)

2009-10-30 16:57:40

ADSL常見接入問題
點贊
收藏

51CTO技術(shù)棧公眾號