自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

詳解Hadoop 2.0中的CDH4 MR配置

大數據 Hadoop
我們今天要談到的是Hadoop 2.0中的CDH4 MR配置,另外mr1,mr2不能同時運行在hadoop資源上,但是可以調整配置,使其兩者可切換啟動。

MR1

cdh不建議使用MRv2.0作為生產環(huán)境,故依舊提供了mr1的包

mr1-2.0.0-mr1-cdh4.1.2.tar.gz

解壓后copy至原h(huán)adoop路徑,有如下文件沖突:

  1. [root@h011171 ~]# cp -r hadoop-2.0.0-cdh4.1.2/* /usr/local/hadoop/ 
  2. cp: overwrite `/usr/local/hadoop/bin/rcc’? y 
  3. cp: overwrite `/usr/local/hadoop/bin/hadoop’? y 
  4. cp: overwrite `/usr/local/hadoop/cloudera/cdh_version.properties’? y 
  5. cp: overwrite `/usr/local/hadoop/cloudera/apply-patches’? y 
  6. cp: overwrite `/usr/local/hadoop/cloudera/build.properties’? y 
  7. cp: overwrite `/usr/local/hadoop/cloudera/CHANGES.cloudera.txt’? y 

均覆蓋即可

基本兼容cdh3 mr1的所有mapreduce配置,包括公平調度器/hadoop acl權限設置,

使用

  1. ./bin/start-mapred.sh 
  2. ./bin/stop-mapred.sh 

監(jiān)控調度界面同原CDH3

MR2(YARN)

MRv2最基本的設計思想是將JobTracker的兩個主要功能,即資源管理和作業(yè)調度/監(jiān)控分成兩個獨立的進程。在該解決方案中包含兩個組件:全局的ResourceManager(RM)和與每個應用相關的ApplicationMaster(AM)。這里的“應用”指一個單獨的MapReduce作業(yè)或者DAG作業(yè)。RM和與NodeManager(NM,每個節(jié)點一個)共同組成整個數據計算框架。RM是系統(tǒng)中將資源分配給各個應用的最終決策者。AM實際上是一個具體的框架庫,它的任務是【與RM協(xié)商獲取應用所需資源】和【與NM合作,以完成執(zhí)行和監(jiān)控task的任務】。

架構描述如下:

配置

mapred-site.xml配置

 

  1. <!– YARN –> 
  2.   <property> 
  3. <name>mapreduce.framework.name</name> 
  4. <value>yarn</value> 
  5. </property> 
  6. <property> 
  7. <name>mapreduce.jobhistory.address</name> 
  8. <value>h011200.hebe.grid.sina.com.cn:10020</value> 
  9. </property> 
  10. <property> 
  11. <name>mapreduce.jobhistory.webapp.address</name> 
  12. <value>h011200.hebe.grid.sina.com.cn:19888</value> 
  13. </property> 

yarn-site.xml配置

 

  1. <property> 
  2. <name>yarn.resourcemanager.resource-tracker.address</name> 
  3. <value>h011200.hebe.grid.sina.com.cn:8031</value> 
  4. </property> 
  5. <property> 
  6. <name>yarn.resourcemanager.address</name>                # RMtracker地址意同jobtrakcer 
  7. <value>h011200.hebe.grid.sina.com.cn:8032</value> 
  8. </property> 
  9. <property> 
  10. <name>yarn.resourcemanager.scheduler.address</name>     # RMscheduler地址意同mv1的jobscheduler 
  11. <value>h011200.hebe.grid.sina.com.cn:8030</value> 
  12. </property> 
  13. <property> 
  14. <name>yarn.resourcemanager.admin.address</name> 
  15. <value>h011200.hebe.grid.sina.com.cn:8033</value> 
  16. </property> 
  17. <property> 
  18. <name>yarn.resourcemanager.webapp.address</name>  #RM Web地址同mr1 默認的50030 
  19. <value>h011200.hebe.grid.sina.com.cn:8088</value> 
  20. </property> 
  21.  
  22.   <property> 
  23.  
  24. <description>Classpath for typical applications.</description> 
  25. <name>yarn.application.classpath</name> 
  26. <value> 
  27. $HADOOP_CONF_DIR, 
  28. $HADOOP_COMMON_HOME/*,$HADOOP_COMMON_HOME/lib/*, 
  29. $HADOOP_HDFS_HOME/*,$HADOOP_HDFS_HOME/lib/*, 
  30. $HADOOP_MAPRED_HOME/*,$HADOOP_MAPRED_HOME/lib/*, 
  31. $YARN_HOME/*,$YARN_HOME/lib/* 
  32. </value> 
  33. </property> 
  34. <property> 
  35. <name>yarn.nodemanager.aux-services</name> 
  36. <value>mapreduce.shuffle</value> 
  37. </property> 
  38. <property> 
  39. <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> 
  40. <value>org.apache.hadoop.mapred.ShuffleHandler</value> 
  41. </property> 
  42. <property> 
  43. <name>yarn.nodemanager.local-dirs</name> 
  44. <value>/data1/hadoop/data/yarn/local</value> 
  45. </property> 
  46. <property> 
  47. <name>yarn.nodemanager.log-dirs</name> 
  48. <value>/data1/hadoop/data/yarn/log</value> 
  49. </property> 
  50. <property> 
  51. <description>Where to aggregate logs</description> 
  52. <name>yarn.nodemanager.remote-app-log-dir</name> 
  53. <value>/var/log/hadoop-yarn/apps</value> 
  54. </property> 
  55.  
  56.   <property> 
  57. <name>yarn.app.mapreduce.am.staging-dir</name> 
  58. <value>/user</value> 
  59. </property> 
啟動

 

./sbin/start-yarn.sh

會啟動本地RM及遠程NM

./sbin/mr-jobhistory-daemon.sh start historyserver

啟動本地historyserver

RM界面

Job history界面

原文鏈接:http://minidb.sinaapp.com/?p=138

【編輯推薦】

責任編輯:彭凡 來源: Data&Storage
相關推薦

2013-05-27 14:19:39

Hadoop

2013-07-11 13:39:23

Hadoop

2014-01-07 11:24:45

SparkHadoop

2014-01-07 14:16:22

Hadoop2.0日志

2010-06-03 15:39:47

Hadoop配置

2012-09-18 09:55:44

Hadoop 2.0

2010-06-04 17:43:12

Hadoop集群搭建

2017-03-22 20:21:16

Hadoop框架分布式

2010-04-23 13:23:42

Silverlight

2013-05-27 14:31:34

Hadoop 2.0

2012-05-28 09:23:40

JavaHadoopApache

2013-06-08 14:34:42

Hadoop 2.0

2013-05-27 14:05:16

2010-11-25 16:48:20

HadoopHbase

2013-05-27 15:12:49

Hadoop 2.0

2020-10-10 14:21:49

CDH6.3.2flink部署

2010-11-09 10:25:09

SlowLogMySQL

2014-01-07 16:34:36

HadoopYARN

2013-05-28 09:12:59

Hadoop 2.0

2009-10-26 15:55:43

URL Routing
點贊
收藏

51CTO技術棧公眾號