自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

百度Hadoop分布式系統(tǒng)揭秘:4000節(jié)點(diǎn)集群

數(shù)據(jù)庫(kù) 其他數(shù)據(jù)庫(kù) 分布式 Hadoop
在 NoSQL 方面,之前了解到百度對(duì) Hadoop 和 hypertable 都有研究,而且 hypertable 方面更是作為其主要贊助商之一,但之前和百度的一些朋友了解到百度內(nèi)部對(duì) hypertable 倒是使用不多,相反在 Hadoop 方面倒是有比較大的應(yīng)用實(shí)例。下面一篇文章描述了百度內(nèi)部4000個(gè)結(jié)點(diǎn)的 Hadoop 集群的一些技術(shù)細(xì)節(jié)。

在 NoSQL 方面,之前了解到百度對(duì) Hadoop 和 hypertable 都有研究,而且 hypertable 方面更是作為其主要贊助商之一,但之前和百度的一些朋友了解到百度內(nèi)部對(duì) hypertable 倒是使用不多,相反在 Hadoop 方面倒是有比較大的應(yīng)用實(shí)例。下面一篇文章描述了百度內(nèi)部4000個(gè)結(jié)點(diǎn)的 Hadoop 集群的一些技術(shù)細(xì)節(jié)。

百度的高性能計(jì)算系統(tǒng)(主要是后端數(shù)據(jù)訓(xùn)練和計(jì)算)目前有4000節(jié)點(diǎn),超過10個(gè)的集群,最大的集群規(guī)模在1000個(gè)節(jié)點(diǎn)以上。每個(gè)節(jié)點(diǎn)由8核 CPU以及16G內(nèi)存以及12TB硬盤組成,每天的數(shù)據(jù)生成量在3PB以上。規(guī)劃當(dāng)中的架構(gòu)將有超過1萬個(gè)節(jié)點(diǎn),每天的數(shù)據(jù)生成量在10PB以上。

底層的計(jì)算資源管理層采用了Agent調(diào)度不同類型的計(jì)算分別給MPI結(jié)構(gòu)的算法和Map-Reduce和DAG算法應(yīng)用等。而通過調(diào)度的分配,可以讓HPC高性能計(jì)算集群和大規(guī)模分布式集群各得其所的計(jì)算相應(yīng)數(shù)據(jù)。

百度通過HCE對(duì)streaming作業(yè)的排序,壓縮,解壓縮,內(nèi)存控制進(jìn)行了優(yōu)化并提供了C++版的MapReduce接口。

百度HCE語(yǔ)言的有關(guān)內(nèi)容,HCE是基于C++的Hadoop環(huán)境,是一個(gè)全功能C++環(huán)境,可以避開Java語(yǔ)言對(duì)于釋放內(nèi)存和資源申請(qǐng)的弊端,并在調(diào)用數(shù)據(jù)時(shí)繞開Java語(yǔ)言的所有關(guān)節(jié),極大的提升算法效率。

百度的調(diào)度器是在capacity-scheduler的基礎(chǔ)上根據(jù)自身業(yè)務(wù)改進(jìn)的。

百度計(jì)劃對(duì)shuffle流程進(jìn)行大幅改造

原文鏈接:http://www.cnblogs.com/chinacloud/archive/2010/11/08/1871592.html

【編輯推薦】

  1. 微軟SQL Server增加對(duì)Hadoop的支持
  2. 淺析Hbase中的Hadoop單機(jī)環(huán)境配置

 

責(zé)任編輯:艾婧 來源: chinacloud
相關(guān)推薦

2017-02-28 09:48:30

2023-02-22 14:04:54

2017-08-10 10:17:32

Hadoop分布式搭建

2019-09-26 15:43:52

Hadoop集群防火墻

2016-11-11 20:23:17

分布式集群萬億量級(jí)計(jì)算百度

2016-11-08 21:18:22

百度

2021-07-14 07:17:37

Springboot分布式UIDGenerato

2010-06-04 18:45:43

Hadoop分布式文件

2013-12-04 13:32:30

2011-07-15 17:48:27

Platform

2015-08-03 15:48:42

Hadoop大數(shù)據(jù)

2012-02-23 09:59:05

Hadoop分布式應(yīng)用

2012-09-19 14:09:20

Hadoop開源

2010-06-03 14:42:47

Hadoop分布式集群

2017-12-07 15:24:10

Hadoop大數(shù)據(jù)服務(wù)器

2009-11-09 10:03:35

2024-03-19 11:41:12

2023-05-29 14:07:00

Zuul網(wǎng)關(guān)系統(tǒng)

2018-07-06 09:16:22

HadoopRAID文件系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)