自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

羅李:基于Hadoop數(shù)據(jù)服務平臺

云計算 Hadoop
Hadoop最重要的兩項服務是HDFS和MapReduce,阿里通過分組對資源做了切分,HDFS通過文件數(shù)和空間的配額做限制,mapreduce是做slot的限制。數(shù)據(jù)可以在阿里的平臺上方便的共享,計算資源通過分時共享,白天進行開發(fā)和測試任務,晚上進行生產(chǎn)任務。

  2013年4月26日-27日,由51CTO傳媒集團旗下WOT(World Of Tech)品牌主辦的2013大數(shù)據(jù)全球技術峰會在北京富力萬麗酒店召開。本次峰會將圍繞大數(shù)據(jù)基礎架構與上層應用的生態(tài)系統(tǒng),解決大規(guī)模數(shù)據(jù)引發(fā)的問題,探索大數(shù)據(jù)基礎的解決方案,激發(fā)數(shù)據(jù)挖掘帶來的競爭力,讓數(shù)據(jù)發(fā)出聲音。51CTO作為本次峰會的主辦方,將全程視頻、圖文直播報道這場數(shù)據(jù)的盛宴,更多內(nèi)容請點擊專題:2013大數(shù)據(jù)全球技術峰會。

 

2013大數(shù)據(jù)全球技術峰會專題

[[71730]]

來自于阿里巴巴集團分布式團隊成員羅李與在場觀眾分享,阿里的大數(shù)據(jù)發(fā)展經(jīng)歷幾個階段。

首先是單機版。但是面臨著容量問題,一臺機器放不下怎么辦?同時單機的性能也不能達到要求。

之后阿里用了市面上流行的分布式數(shù)據(jù)庫方案,容量和計算能力比單機版翻了好幾倍,當時滿足淘寶和阿里巴巴業(yè)務的發(fā)展。但發(fā)展到一定程度后,這種方式的問題初見端倪,首先容量有限制,作為一款商業(yè)軟件,它的價格不菲,按照容量收費導致軟件越用越貴。同時在大數(shù)據(jù)場景下,系統(tǒng)的穩(wěn)定性也不是特別好。

再后來阿里內(nèi)部有一些部門開始使用Hadoop,08年時阿里擁有7-8個大大小小的Hadoop集群,從十幾臺到一兩百臺,基本用于處理離線數(shù)據(jù)處理。但各個集群都各自為政獨立發(fā)展,卻又有千絲萬縷的聯(lián)系,雖相互依賴,但集群規(guī)模和運行水平卻參差不齊,所以集群的穩(wěn)定性一直是一個問題,***的問題就是集群重復建設,高成本,低效率。

那么什么才是適合阿里巴巴的大數(shù)據(jù)解決方案?

云梯Hadoop服務集群

• HDFS - 海量數(shù)據(jù)存儲服務

• 分組,通過quota(空間/文件數(shù))限制:/group/taobao

• 數(shù)據(jù)共享:淘寶/天貓/一淘/B2B/支付寶

• MapReduce - 大規(guī)模分布式計算服務

• 分組,slot限制,按需申請,集中分配和調(diào)度

• 生產(chǎn) / 開發(fā) / 測試共享集群,白天開發(fā),晚上生產(chǎn)

• 服務特色

• 單一大集群

• 多用戶共享

• 計算分時

• 資源按需申請,按使用量計費

Hadoop最重要的兩項服務是HDFS和MapReduce,阿里通過分組對資源做了切分,HDFS通過文件數(shù)和空間的配額做限制,mapreduce是做slot的限制。數(shù)據(jù)可以在阿里的平臺上方便的共享,計算資源通過分時共享,白天進行開發(fā)和測試任務,晚上進行生產(chǎn)任務。

云梯提供的其他Hadoop服務有哪些?

其實這些服務都來自于Hadoop開源生態(tài)圈,并且可以很方便的吸收進來,這就是使用開源軟件的優(yōu)勢。

最重要的服務是Hive,如果要遷移oracle的任務,就必須提供SQL語法的支持,hive做到了。之后阿里平臺發(fā)展壯大也主要是hive的功勞,現(xiàn)在阿里平臺上80%以上的作業(yè)是hive的。同時還提供了streaming,mahout,pig等工具。

阿里的HBase服務區(qū)別于獨立的HBase集群,hbase機器和云梯其他slave機器是共享的,和其他的Mapreduce任務共享一個HDFS,阿里期望在云梯大規(guī)模數(shù)據(jù)和計算能力背景下,吸收HBase存儲服務的特色,為云梯用戶提供更好的在線服務體驗。

[[71731]]

結尾:以上是51CTO.com記者從一線為您帶來的精彩報道。后續(xù)我們還有更加精彩的獨家報道,敬請關注。

責任編輯:王程程 來源: 51CTO
相關推薦

2017-01-07 11:45:43

醫(yī)療健康大數(shù)據(jù)虛擬化

2016-09-08 23:47:17

大數(shù)據(jù)大數(shù)據(jù)服務

2022-01-27 09:51:42

數(shù)據(jù)管理

2021-11-19 09:08:48

Alluxio

2018-06-15 20:44:40

Hadoop數(shù)據(jù)分析數(shù)據(jù)

2019-07-26 11:34:56

Veritas

2017-10-10 15:20:10

架構數(shù)據(jù)存儲PB級數(shù)據(jù)

2012-02-14 10:18:11

WCF數(shù)據(jù)服務

2021-09-24 10:46:00

MaxCompute Hologres 數(shù)據(jù)服務

2019-10-29 14:15:25

云存檔數(shù)據(jù)服務技術

2017-02-28 16:00:03

VRVR旅游大數(shù)據(jù)

2015-11-26 10:23:25

電科華云

2021-05-21 14:19:45

數(shù)據(jù)服務API技術

2015-05-07 14:35:07

FreeStor軟件定義存儲數(shù)據(jù)服務

2021-08-27 11:05:13

Commvault

2009-11-13 13:35:54

ADO.NET數(shù)據(jù)服務

2015-07-31 16:26:46

IBM收購Compose

2024-11-01 10:37:31

2022-09-23 14:16:29

PingCAPTiDB分布式數(shù)據(jù)庫

2015-07-01 13:51:12

HadoopMapReduce數(shù)據(jù)分析
點贊
收藏

51CTO技術棧公眾號