自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

給Hadoop一個支點:撬動大數(shù)據(jù)

運(yùn)維 系統(tǒng)運(yùn)維 大數(shù)據(jù) Hadoop
大數(shù)據(jù)大概是繼云計算之后,最熱門的科技名詞了。一些科技廠商不約而同,紛紛打出大數(shù)據(jù)口號,情況就像云計算熱潮一樣。那么大數(shù)據(jù)到底是怎么回事?

  大數(shù)據(jù)大概是繼云計算之后,最熱門的科技名詞了。一些科技廠商不約而同,紛紛打出大數(shù)據(jù)口號,情況就像云計算熱潮一樣。那么大數(shù)據(jù)到底是怎么回事?

  大數(shù)據(jù)照字面翻譯,就是"大數(shù)據(jù)",而這個"大",最起碼包含3種意思:大量的數(shù)據(jù)存儲、很大的數(shù)據(jù)、很大的數(shù)據(jù)庫。所以就中文譯名來看,不論是翻成"大數(shù)據(jù)"或"海量數(shù)據(jù)",其實都只能道出大數(shù)據(jù)的部分特性。然而,不管是大數(shù)據(jù)或是海量數(shù)據(jù),都指向一個共同的趨勢,就是數(shù)據(jù)增長的速度越來越快,而之所以能構(gòu)成大數(shù)據(jù)這個新議題,就在于數(shù)據(jù)量之大已不同之前,目前的技術(shù)已經(jīng)難以處理。

  以前只有少數(shù)的產(chǎn)業(yè)會面臨海量數(shù)據(jù)處理、分析的需求,例如氣象、基因、科學(xué)仿真,或是金融交易詐欺分析等等,但隨著科技應(yīng)用的改變,有更多的產(chǎn)業(yè)也面臨海量數(shù)據(jù)分析的挑戰(zhàn)。例如搜索引擎廠商要索引全球的網(wǎng)頁,就是一個艱巨的任務(wù);電子商務(wù)企業(yè)要掌握顧客消費(fèi)行為,所要分析的數(shù)據(jù)也越來越多。

  以eBay的使用經(jīng)驗為例,看到國外媒體的看到稿件上寫著eBay的數(shù)據(jù)庫每天增加50TB,一度懷疑是不是粗心把5TB多加了個零,結(jié)果真的是50TB.因為eBay每天最少都有數(shù)百萬次的商品查詢,數(shù)據(jù)庫每日增加1.5兆筆記錄,而數(shù)據(jù)庫的總?cè)萘縿t已超過9PB.所以,不僅每天新增的數(shù)據(jù)量龐大,連數(shù)據(jù)庫也是超級龐大,而要從中分析顧客的瀏覽、消費(fèi)行為,就是一件困難的事情。

  大家熟悉的Facebook社交網(wǎng)站,每天都有數(shù)億用戶留下龐大的數(shù)據(jù),甚至其中有很大的比例是圖片、影片等傳統(tǒng)數(shù)據(jù)庫系統(tǒng)較不擅長的非結(jié)構(gòu)化數(shù)據(jù)。這不僅挑戰(zhàn)社交網(wǎng)站廠商如何管理,對于想利用社交網(wǎng)站來掌握消費(fèi)者動態(tài)的企業(yè)而言,所面臨的挑戰(zhàn)也是***的。

  美國***的超市Wal-Mart,既要分析顧客在網(wǎng)站上的購物行為,還要分析消費(fèi)者是通過哪些關(guān)鍵詞的搜索跳轉(zhuǎn)而來,甚至,Wal-Mart想要進(jìn)一步分析顧客在Facebook等社交網(wǎng)站的動態(tài)。Wal-Mart過去通過結(jié)賬數(shù)據(jù)分析,將啤酒與紙尿布擺在一起,促進(jìn)了啤酒的銷售量,此舉令人津津樂道。然而,這已經(jīng)是屬于事后分析,未來他們想要更主動了解顧客在社交網(wǎng)站反應(yīng)的個人狀態(tài),早一步掌握潛在的消費(fèi)需求,有可能他們以后會比父親更快知道女兒懷孕了。

  其實制造業(yè)也面臨相同的挑戰(zhàn),例如隨著晶圓的規(guī)格越來越精細(xì),要掌握更精細(xì)的制程分析數(shù)據(jù)以確保準(zhǔn)確率,就必須分析比過去還要多很多的數(shù)據(jù)。那么如何有能力分析海量數(shù)據(jù),以及在可接受的時間內(nèi)完成數(shù)據(jù)分析,就是個關(guān)鍵了。為此,很多公司就早早布局大數(shù)據(jù)的關(guān)鍵技術(shù)──Hadoop.

  未來會有更多的產(chǎn)業(yè)要面臨龐大數(shù)據(jù)量的挑戰(zhàn),而目前走在前頭的企業(yè),都不約而同的采用Hadoop這樣的技術(shù)來克服難題。

  Hadoop是基于Google搜索引擎的分布式計算技術(shù),Google的哲學(xué)是螞蟻雄兵精神,利用大量平價的服務(wù)器,搭配平行計算架構(gòu),以***經(jīng)濟(jì)效益的方式創(chuàng)造龐大的計算量。當(dāng)Hadoop以此技術(shù)發(fā)展出海量數(shù)據(jù)平臺,對企業(yè)而言無疑是一道克服海量數(shù)據(jù)挑戰(zhàn)的曙光,因為企業(yè)可以不再依賴價格高昂的大型專屬設(shè)備,而可以通過自建大量x86服務(wù)器群集來解決。

  最近,Hadoop終于發(fā)表1.0正式版,就像是只要給我一個支點,就能撐起地球,Hadoop或許就是撐起大數(shù)據(jù)的那個支點。

責(zé)任編輯:黃丹 來源: eNet硅谷動力
相關(guān)推薦

2017-06-02 11:15:04

2018-01-04 14:35:54

大數(shù)據(jù)安防智慧城市

2018-01-12 15:14:08

大數(shù)據(jù)數(shù)據(jù)資源經(jīng)濟(jì)

2014-12-08 10:06:50

Hadoop大數(shù)據(jù)

2013-10-29 09:33:20

Hadoop 2Hadoop大數(shù)據(jù)應(yīng)用

2019-06-26 11:05:35

大數(shù)據(jù)Hadoop

2014-08-20 09:37:39

國產(chǎn)操作系統(tǒng)

2015-07-27 10:34:55

大數(shù)據(jù)大忽悠

2015-10-19 10:11:00

2016-12-20 18:21:29

Hadoop大數(shù)據(jù)面試

2013-05-24 11:06:53

大數(shù)據(jù)行為數(shù)據(jù)

2012-09-26 22:18:19

IBM大數(shù)據(jù)Hadoop

2014-06-16 09:11:29

快數(shù)據(jù)大數(shù)據(jù)

2014-04-29 09:59:44

2017-03-21 21:17:50

大數(shù)據(jù)數(shù)據(jù)互聯(lián)網(wǎng)

2014-08-15 10:34:42

快數(shù)據(jù)大數(shù)據(jù)

2020-09-21 15:16:09

大數(shù)據(jù)IT技術(shù)

2016-11-28 15:17:52

大數(shù)據(jù)應(yīng)用大數(shù)據(jù)

2015-09-14 13:57:22

大數(shù)據(jù)科技革命
點贊
收藏

51CTO技術(shù)棧公眾號