Hadoop YARN配置參數(shù)剖析(3)—MapReduce相關參數(shù)
MapReduce相關配置參數(shù)分為兩部分,分別是JobHistory Server和應用程序參數(shù),Job History可運行在一個獨立節(jié)點上,而應用程序參數(shù)則可存放在mapred-site.xml中作為默認參數(shù),也可以在提交應用程序時單獨指定,注 意,如果用戶指定了參數(shù),將覆蓋掉默認參數(shù)。
以下這些參數(shù)全部在mapred-site.xml中設置。
1. MapReduce JobHistory相關配置參數(shù)
在JobHistory所在節(jié)點的mapred-site.xml中配置。
(1) mapreduce.jobhistory.address
參數(shù)解釋:MapReduce JobHistory Server地址。
默認值: 0.0.0.0:10020
(2) mapreduce.jobhistory.webapp.address
參數(shù)解釋:MapReduce JobHistory Server Web UI地址。
默認值: 0.0.0.0:19888
(3) mapreduce.jobhistory.intermediate-done-dir
參數(shù)解釋:MapReduce作業(yè)產(chǎn)生的日志存放位置。
默認值: /mr-history/tmp
(4) mapreduce.jobhistory.done-dir
參數(shù)解釋:MR JobHistory Server管理的日志的存放位置。
默認值: /mr-history/done
2. MapReduce作業(yè)配置參數(shù)
可在客戶端的mapred-site.xml中配置,作為MapReduce作業(yè)的缺省配置參數(shù)。也可以在作業(yè)提交時,個性化指定這些參數(shù)。
參數(shù)名稱 | 缺省值 | 說明 |
mapreduce.job.name | 作業(yè)名稱 | |
mapreduce.job.priority | NORMAL | 作業(yè)優(yōu)先級 |
yarn.app.mapreduce.am.resource.mb | 1536 | MR ApplicationMaster占用的內(nèi)存量 |
yarn.app.mapreduce.am.resource.cpu-vcores | 1 | MR ApplicationMaster占用的虛擬CPU個數(shù) |
mapreduce.am.max-attempts | 2 | MR ApplicationMaster***失敗嘗試次數(shù) |
mapreduce.map.memory.mb | 1024 | 每個Map Task需要的內(nèi)存量 |
mapreduce.map.cpu.vcores | 1 | 每個Map Task需要的虛擬CPU個數(shù) |
mapreduce.map.maxattempts | 4 | Map Task***失敗嘗試次數(shù) |
mapreduce.reduce.memory.mb | 1024 | 每個Reduce Task需要的內(nèi)存量 |
mapreduce.reduce.cpu.vcores | 1 | 每個Reduce Task需要的虛擬CPU個數(shù) |
mapreduce.reduce.maxattempts | 4 | Reduce Task***失敗嘗試次數(shù) |
mapreduce.map.speculative | false | 是否對Map Task啟用推測執(zhí)行機制 |
mapreduce.reduce.speculative | false | 是否對Reduce Task啟用推測執(zhí)行機制 |
mapreduce.job.queuename | default | 作業(yè)提交到的隊列 |
mapreduce.task.io.sort.mb | 100 | 任務內(nèi)部排序緩沖區(qū)大小 |
mapreduce.map.sort.spill.percent | 0.8 | Map階段溢寫文件的閾值(排序緩沖區(qū)大小的百分比) |
mapreduce.reduce.shuffle.parallelcopies | 5 | Reduce Task啟動的并發(fā)拷貝數(shù)據(jù)的線程數(shù)目 |
注意,MRv2重新命名了MRv1中的所有配置參數(shù),但兼容MRv1中的舊參數(shù),只不過會打印一條警告日志提示用戶參數(shù)過期。MapReduce新 舊參數(shù)對照表可參考Java類org.apache.hadoop.mapreduce.util.ConfigUtil,舉例如下:
過期參數(shù)名 | 新參數(shù)名 |
mapred.job.name | mapreduce.job.name |
mapred.job.priority | mapreduce.job.priority |
mapred.job.queue.name | mapreduce.job.queuename |
mapred.map.tasks.speculative.execution | mapreduce.map.speculative |
mapred.reduce.tasks.speculative.execution | mapreduce.reduce.speculative |
io.sort.factor | mapreduce.task.io.sort.factor |
io.sort.mb | mapreduce.task.io.sort.mb |
原文鏈接:http://dongxicheng.org/mapreduce-nextgen/hadoop-yarn-configurations-mapreduce/