自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Facebook實(shí)時(shí)信息系統(tǒng):HBase每月存儲(chǔ)1350億條信息

原創(chuàng)
數(shù)據(jù)庫(kù) 新聞
Facebook上的信息是海量的,這么大量的信息究竟有多少?具體的數(shù)字是每月1350億條。那么Facebook是如何存儲(chǔ)這些信息的呢?答案是HBase。

【51CTO經(jīng)典譯文】也許你已經(jīng)在一些地方看到這個(gè)消息,F(xiàn)acebook 已經(jīng)開(kāi)發(fā)一款新的社會(huì)化收件箱,集成了電子郵件、即時(shí)通訊、短信、文本信息、Facebook站內(nèi)信息。最重要的是,他們需要每個(gè)月存儲(chǔ) 1350 億條信息。他們?cè)谀睦锎鎯?chǔ)這些信息?Facebook的Kannan Muthukkaruppan 在《信息背后的技術(shù)》一文中給出一個(gè)令人驚奇的答案:HBase。HBase 擊敗了MySQL、Cassandra和其他一些選項(xiàng),成為了Facebook的選擇。

51CTO向您推薦《Facebook數(shù)據(jù)庫(kù)工具Flashcache初探

為什么這一選擇令人驚奇?Facebook 創(chuàng)建了Cassandra,其目的就是為了建造一個(gè)收件箱類型的應(yīng)用程序,但是最終他們發(fā)現(xiàn),Cassandra的一致性模型并不能很好地適用于Facebook 新的實(shí)時(shí)信息系統(tǒng)。另外,F(xiàn)acebook 還有一個(gè)擴(kuò)展的MySQL 架構(gòu),不過(guò)他們發(fā)現(xiàn),當(dāng)數(shù)據(jù)集和索引變大時(shí),性能會(huì)變得讓人無(wú)法忍受。另外,他們?cè)究梢宰约洪_(kāi)發(fā)一套系統(tǒng),但他們最終還是選擇了 HBase。

HBase是一個(gè)可以橫向擴(kuò)張的表存儲(chǔ)系統(tǒng),能夠?yàn)榇笠?guī)模數(shù)據(jù)提供速度極快的低等級(jí)更新。這正是信息系統(tǒng)所需要的功能。另外,HBase是一個(gè)基于列的鍵值存儲(chǔ)系統(tǒng),并且是構(gòu)建于 BigTabe 模型之上。HBase善于根據(jù)鍵訪問(wèn)行,以及對(duì)于一系列的行進(jìn)行掃描和過(guò)濾。同樣,這也是信息系統(tǒng)所需要的功能。不過(guò),它并不支持復(fù)雜查詢。查詢通常交給分析工具處理,比如Hive,F(xiàn)acebook創(chuàng)建了Hive,目的是處理他們?nèi)萘扛哌_(dá)多個(gè)拍字節(jié)(petabyte)的數(shù)據(jù)倉(cāng)庫(kù)。同時(shí),Hive 是基于Hadoop的文件系統(tǒng)HDFS,而HBase使用的也是這一文件系統(tǒng)。

Facebook 選擇了HBase,因?yàn)樗麄儗?duì)他們的應(yīng)用進(jìn)行了監(jiān)視,并明白他們到底需要什么。他們所需要的是一個(gè)可以處理以下兩種類型的數(shù)據(jù)模式:

1. 一小組經(jīng)常變化的臨時(shí)數(shù)據(jù);

2. 一組不斷增加但很少訪問(wèn)的數(shù)據(jù)。

這很有道理。當(dāng)前收件箱里的郵件你只會(huì)看一次,之后你很少會(huì)再去翻看這些電子郵件。這兩種類似的數(shù)據(jù)是如此不同,所以有人也許在想應(yīng)該使用兩種不同的系統(tǒng)。不過(guò),很明顯,HBase 能夠很好地處理這兩種類型的數(shù)據(jù)。他們?nèi)绾翁幚沓R?guī)的搜索功能,尚不清楚,因?yàn)檫@并非 HBase 的優(yōu)勢(shì)所在,不過(guò),HBase 可以集成多個(gè)搜索系統(tǒng)。

Facebook 系統(tǒng)的一些關(guān)鍵點(diǎn):

● HBase:

○ 具有比Cassandra更簡(jiǎn)潔的一致性模型。

○ 對(duì)于他們的數(shù)據(jù)模式具有很好的擴(kuò)展能力和處理能力。

○ 大多數(shù)功能能夠滿足他們的需求:自動(dòng)加載平衡和故障轉(zhuǎn)移、壓縮支持功能、單個(gè)服務(wù)器的多碎片功能等。

○ HBase 所使用的文件系統(tǒng)HDFS,支持復(fù)制、端對(duì)端校驗(yàn)和,以及自動(dòng)再次平衡。

○ Facebook 的運(yùn)營(yíng)團(tuán)隊(duì)具有豐富的HDFS使用經(jīng)驗(yàn),因?yàn)镕acebook是Hadoop的大用戶,而Hadoop使用 HDFS 作為它的分布式文件系統(tǒng)。

● Haystack 用于存儲(chǔ)附件。

● 從無(wú)到有,編寫可自定義的應(yīng)用程序服務(wù)器,其目的是為了滿足多個(gè)不同來(lái)源流入的大量信息。

● 用戶發(fā)現(xiàn)服務(wù)(user discovery service)構(gòu)建于 Zookeeper 之上。

● 對(duì)于以下功能可訪問(wèn)架構(gòu)服務(wù):電子郵件賬號(hào)驗(yàn)證、好友關(guān)系、隱私?jīng)Q策以及發(fā)送決策(通過(guò)聊天工具或短信發(fā)送一條消息?)

● 保持小團(tuán)隊(duì)做大事情的一貫作風(fēng),15 位工程師在一年內(nèi)發(fā)布了 20 項(xiàng)新的架構(gòu)服務(wù)。

● Facebook將不會(huì)對(duì)單個(gè)數(shù)據(jù)庫(kù)平臺(tái)進(jìn)行標(biāo)準(zhǔn)化,對(duì)于不同的任務(wù)他們將使用不同的平臺(tái)。

Facebook 通過(guò)選擇HBase將極大地推動(dòng)該系統(tǒng)的采用,同時(shí)Facebook具有豐富的 HDFS/Hadoop/Hive 使用經(jīng)驗(yàn)。想到這些,就讓人興奮的無(wú)法入睡。這是任何一款產(chǎn)品的夢(mèng)想:成為另一個(gè)非常流行的產(chǎn)品的搭檔,并期待成為其生態(tài)系統(tǒng)的一部分。這正是 HBase 所取得的成功。HBase 已經(jīng)在許多方面去多了不錯(cuò)的成績(jī):實(shí)時(shí)、分布、線性擴(kuò)展、健壯、BigData、開(kāi)源、鍵值、面對(duì)列,我們將會(huì)看到 HBase 變得更加流行,尤其是它已經(jīng)獲得了 Facebook 的眷顧和青睞。

原文標(biāo)題:Facebook's New Real-Time Messaging System: HBase To Store 135+ Billion Messages A Month

相關(guān)閱讀

HBase是一個(gè)分布式的、面向列的開(kāi)源數(shù)據(jù)庫(kù),該技術(shù)來(lái)源于Chang et al所撰寫的Google論文“Bigtable:一個(gè)結(jié)構(gòu)化數(shù)據(jù)的分布式存儲(chǔ)系統(tǒng)”。就像Bigtable利用了Google文件系統(tǒng)(File System)所提供的分布式數(shù)據(jù)存儲(chǔ)一樣,HBase在Hadoop之上提供了類似于Bigtable的能力。HBase是Apache的Hadoop項(xiàng)目的子項(xiàng)目。HBase不同于一般的關(guān)系數(shù)據(jù)庫(kù),它是一個(gè)適合于非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)庫(kù).另一個(gè)不同的是HBase基于列的而不是基于行的模式。HBase使用和Bigtable非常相同的數(shù)據(jù)模型。用戶存儲(chǔ)數(shù)據(jù)行在一個(gè)表里。一個(gè)數(shù)據(jù)行擁有一個(gè)可選擇的鍵和任意數(shù)量的列。表是疏松的存儲(chǔ)的,因此用戶可以給行定義各種不同的列。HBase主要用于需要隨機(jī)訪問(wèn),實(shí)時(shí)讀寫你的大數(shù)據(jù)(Big Data)。

 

 

HBase架構(gòu)圖

 

 

【編輯推薦】

  1. 開(kāi)源數(shù)據(jù)庫(kù)Hibari發(fā)布 針對(duì)大數(shù)據(jù)量處理
  2. SQL Server數(shù)據(jù)庫(kù)對(duì)大數(shù)據(jù)量表數(shù)據(jù)進(jìn)行DELETE
  3. MongoDB CEO談NoSQL的大數(shù)據(jù)量處理能力
  4. 詳解NoSQL數(shù)據(jù)庫(kù)使用實(shí)例
  5. 云計(jì)算時(shí)代NoSQL當(dāng)?shù)?關(guān)系數(shù)據(jù)庫(kù)日薄西山

 

責(zé)任編輯:彭凡 來(lái)源: 51CTO
相關(guān)推薦

2009-06-17 09:41:33

Facebook即時(shí)通FbChat

2020-09-22 07:00:00

事件驅(qū)動(dòng)信息系統(tǒng)架構(gòu)

2021-09-29 15:32:32

數(shù)據(jù)泄露漏洞信息安全

2020-04-21 11:56:42

Facebook數(shù)據(jù)泄露暗網(wǎng)

2021-01-25 12:25:49

物聯(lián)網(wǎng)智能冰箱IoT

2021-11-18 11:45:54

Stripchat漏洞信息泄露

2021-04-06 09:34:31

Facebook隱私黑客

2013-01-10 12:54:29

大數(shù)據(jù)探討Twitter

2011-01-25 10:42:16

信息系統(tǒng)項(xiàng)目管理師

2014-12-09 13:09:02

華為存儲(chǔ)

2014-12-04 10:08:22

華為大數(shù)據(jù)存儲(chǔ)

2020-04-22 15:10:45

信息泄露暗網(wǎng)網(wǎng)絡(luò)攻擊

2011-02-25 10:41:33

2011-07-18 11:13:30

2012-10-10 22:02:35

2010-11-25 15:19:22

2021-11-05 07:00:51

Facebook元宇宙人臉信息

2015-04-20 10:12:30

谷歌搜索

2017-01-12 16:54:04

信息泄露網(wǎng)絡(luò)安全房產(chǎn)商

2009-06-30 10:33:22

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)