令人難以想象的大數(shù)據(jù)規(guī)模
20 年前,電子醫(yī)療記錄還是個(gè)新鮮物,數(shù)字音樂(lè)還只是人們的幻想,Twitter 這個(gè)詞匯還只是單純地指鳥兒唧唧喳喳的叫聲,Google 聯(lián)合創(chuàng)始人 Sergey Brin 還只是 Wolfram Research 的暑期實(shí)習(xí)生。
20 年后的今天,信息革命已經(jīng)為我們的生活帶來(lái)了翻天覆地的變化。從直觀的數(shù)字上來(lái)看,大數(shù)據(jù)的規(guī)模已經(jīng)讓人難以想象。根據(jù)市場(chǎng)調(diào)研公司 IDC 的報(bào)告,2012 年人們創(chuàng)造了 2.8 ZB(1 ZB 是 1 TB 的十億倍)的數(shù)據(jù)信息量。09 年的時(shí)候,這個(gè)數(shù)據(jù)約為 0.8 ZB,2011 年時(shí)該數(shù)據(jù)是 1.9 ZB。
Wired 歸納了目前全球一些有意思的數(shù)據(jù)信息:
商務(wù)郵件每年的數(shù)據(jù)量是 298.6 萬(wàn) TB
每年上傳到 Facebook 的內(nèi)容是 18.25 萬(wàn) TB
Google 的索引條目 9.76 萬(wàn) TB
每年上傳到 YouTube 的視頻是 1.5 萬(wàn) TB
納斯達(dá)克交易所數(shù)據(jù)庫(kù)是 3072 TB
2012 年人們發(fā)送的 tweet 量是 19 TB
在這個(gè)大數(shù)據(jù)時(shí)代,信息爆炸已經(jīng)不可避免,預(yù)計(jì) 2020 年人們創(chuàng)造的數(shù)據(jù)信息量將超過(guò) 20 ZB。單單在今天,人們可能就創(chuàng)造了上千或者上萬(wàn)的 PB 數(shù)據(jù)信息量(1 PB 是 1024 TB),你的一條評(píng)論也將是這其中極小的一部分。