大數(shù)據(jù)發(fā)展簡(jiǎn)史
以下是我所羅列的在計(jì)量數(shù)據(jù)量的歷史過程中一些具有里程碑意義的事件,以及屬于“大數(shù)據(jù)”概念進(jìn)化歷程中的一些“第一次”或者是新發(fā)現(xiàn)。
1944年
衛(wèi)斯理大學(xué)圖書館員弗萊蒙特·雷德出版了《學(xué)者與研究型圖書館的未來》一書。他估計(jì)美國(guó)高校圖書館的規(guī)模每16年就翻一番。按照這一增長(zhǎng)速度,雷德推測(cè)2040年耶魯大學(xué)圖書館將擁有“約2億冊(cè)藏書,將占據(jù)6,000余英里書架…[需要的]編目人員超過6,000人。”
1961年
德里克·普賴斯出版了《巴比倫以來的科學(xué)》,在這本書中,普賴斯通過觀察科學(xué)期刊和論文的增長(zhǎng)規(guī)律來研究科學(xué)知識(shí)的增長(zhǎng)。他得出以下結(jié)論:新期刊的數(shù)量以指數(shù)方式增長(zhǎng)而不是以線性方式增長(zhǎng),每15年翻一番,每50年以10為指數(shù)倍進(jìn)行增長(zhǎng)。普賴斯將其稱之為“指數(shù)增長(zhǎng)規(guī)律”,并解釋道,“科學(xué)每前進(jìn)一步就以一個(gè)相當(dāng)恒定的出現(xiàn)率產(chǎn)生一系列新的進(jìn)步。因此在任何時(shí)候,新科學(xué)的產(chǎn)生數(shù)量永遠(yuǎn)嚴(yán)格地與科學(xué)發(fā)現(xiàn)總量成正比。”
1964年4月
哈里·J·格雷和亨利·拉斯頓在美國(guó)電氣與電子工程師協(xié)會(huì)(IEEE)的《電子計(jì)算機(jī)學(xué)報(bào)》上發(fā)表了《應(yīng)對(duì)信息爆炸的技巧》一文,在文中,他們提出了以下建議:
1)任何人都不應(yīng)該發(fā)表新論文。2)如果1)不可行,僅短小的論文可以被發(fā)表。“短小”的意思是文章不超過2,500字符,空格、標(biāo)點(diǎn)符號(hào)都計(jì)算在內(nèi)。3)如果2)被采納,則應(yīng)該實(shí)行下述限制:“只有將現(xiàn)存總長(zhǎng)度為2501或更多字符的文章刪除一篇或多篇,短小的文章才可以被發(fā)表。”
上述建議的實(shí)行將產(chǎn)生一個(gè)重要的副產(chǎn)品,即減輕人才選拔委員會(huì)的負(fù)擔(dān)。因?yàn)橐粋€(gè)人的出版物列表將僅被一個(gè)負(fù)數(shù)所代替,這個(gè)負(fù)數(shù)指代了他從現(xiàn)有信息存儲(chǔ)中刪除論文的凈數(shù)目。
1967年11月
B·A·馬里恩和P·A·D·德·梅恩在《美國(guó)計(jì)算機(jī)協(xié)會(huì)通訊》上發(fā)表了《自動(dòng)數(shù)據(jù)壓縮》一文,文章指出,“近年來被人們所關(guān)注的‘信息爆炸’使得對(duì)所有信息的存儲(chǔ)需求保持在最低限度是非常必要的。”文章描寫道:“全自動(dòng)壓縮機(jī)由三部分組成,能夠快速處理信息,它可以被應(yīng)用于‘任何’信息主體,大大降低了緩慢的外部存儲(chǔ)要求,并可以通過計(jì)算機(jī)提高信息傳輸速度。”
1971年
亞瑟·米勒在《侵犯隱私》中寫道:“太多的信息處理者看似是以個(gè)人檔案存儲(chǔ)容量的比特?cái)?shù)目來衡量一個(gè)人。”
1975年
日本郵電部開始實(shí)施了“信息流普查”計(jì)劃,以調(diào)查日本的信息總量(這一思想首次是在1969年的一篇文章中提出的)。普查以“字?jǐn)?shù)總量”作為所有媒體的統(tǒng)一衡量單位。1975年的普查已經(jīng)發(fā)現(xiàn)信息供給要比信息消費(fèi)發(fā)展得快得多。1978年的普查報(bào)告指出“人們對(duì)單向傳播的大眾傳媒所提供信息的需求停滯不前,對(duì)以雙向傳播為特征的個(gè)人通信媒體所提供信息的需求大規(guī)模增長(zhǎng)…我們的社會(huì)正在進(jìn)入一個(gè)新階段…在這一階段中,處于優(yōu)勢(shì)地位的是那些能夠滿足個(gè)人需求的碎片性的、更為詳細(xì)的信息,而不再是那些傳統(tǒng)的被大量復(fù)制的、一致性的信息。[阿利斯泰爾·D·達(dá)夫,2000;參見馬丁·希爾伯特,2012]
1980年4月
I·A·特詹姆斯蘭德在第四屆美國(guó)電氣和電子工程師協(xié)會(huì)(IEEE)“大規(guī)模存儲(chǔ)系統(tǒng)專題研討會(huì)”上做了一個(gè)報(bào)告,題為《我們?cè)摵稳ズ螐??》。在?bào)告中,他指出“那些很早以前就熟悉存儲(chǔ)裝置的人們發(fā)現(xiàn),‘帕金森第一法則’可以被用來解釋我們的現(xiàn)狀——‘數(shù)據(jù)擴(kuò)展至任何可用空間’…我相信大量數(shù)據(jù)正在被保留,因?yàn)橛脩魺o(wú)法識(shí)別無(wú)用的數(shù)據(jù);相較于丟棄潛在有用數(shù)據(jù)的不利后果,存儲(chǔ)無(wú)用數(shù)據(jù)的損失不那么明顯。”
1981年
匈牙利中央統(tǒng)計(jì)辦公室開始實(shí)施了一項(xiàng)調(diào)查國(guó)家信息產(chǎn)業(yè)的研究項(xiàng)目,包括以比特為單位計(jì)量信息量。這項(xiàng)研究一直持續(xù)至今。1993年,匈牙利中央統(tǒng)計(jì)辦公室首席科學(xué)家伊斯特萬(wàn)·迪恩斯編制了一本國(guó)家信息賬戶的標(biāo)準(zhǔn)體系手冊(cè)。[見伊斯特萬(wàn)·迪恩斯,1994;馬丁·希爾伯特,2012]
1983年8月
伊契爾·索勒·普爾在《科學(xué)》雜志上發(fā)表了《追蹤信息流》一文,通過對(duì)1960年到1977年17種主流通訊媒體發(fā)展趨勢(shì)的觀察,他得出如下結(jié)論“這些媒體為10歲以上的美國(guó)人創(chuàng)造的可用詞匯以每年8.9%的速度增長(zhǎng)…事實(shí)上這些媒體創(chuàng)造的、真正參與流通的單詞僅以每年2.9%的速度增長(zhǎng)…在上述期間,信息流的增長(zhǎng)在很大程度上是由于廣播的發(fā)展…但是在那段時(shí)期末 [1977年]情況發(fā)生了變化:點(diǎn)對(duì)點(diǎn)的媒體比廣播發(fā)展得快。”普爾、伊諾茲、高崎、赫維茨在《通信流:一項(xiàng)美國(guó)與日本的信息普查》中做了后續(xù)研究,這本書對(duì)美國(guó)和日本所產(chǎn)生的信息量進(jìn)行了比較。
1986年7月
哈爾·B·貝克爾在《數(shù)據(jù)通信》上發(fā)表了《用戶真的能夠以今天或者明天的速度吸收數(shù)據(jù)嗎?》一文。貝克爾預(yù)計(jì)“古滕堡所實(shí)現(xiàn)的記錄密度大約是每立方英尺500個(gè)符號(hào)(字符),是公元前4,000年蘇美爾人泥土片記錄密度的500倍。到2000年,半導(dǎo)體隨機(jī)存取存儲(chǔ)器將能夠在每立方英尺存儲(chǔ)1.25×1011個(gè)字節(jié)。”
對(duì)于數(shù)據(jù)存儲(chǔ)而言,1996年數(shù)字存儲(chǔ)就比紙張存儲(chǔ)更能節(jié)約成本,這是R·J·T·莫里斯和B·J·特拉斯克渥奇在2003年7月1日《IBM系統(tǒng)期刊》上所發(fā)表的《存儲(chǔ)系統(tǒng)的演進(jìn)》一文中指出的。
1997年10月
邁克爾·考克斯和大衛(wèi)·埃爾斯沃思在第八屆美國(guó)電氣和電子工程師協(xié)會(huì)(IEEE)關(guān)于可視化的會(huì)議論文集中發(fā)表了《為外存模型可視化而應(yīng)用控制程序請(qǐng)求頁(yè)面調(diào)度》的文章。文章以下述內(nèi)容開頭:“可視化對(duì)計(jì)算機(jī)系統(tǒng)提出了一個(gè)有趣的挑戰(zhàn):通常情況下數(shù)據(jù)集相當(dāng)大,耗盡了主存儲(chǔ)器、本地磁盤、甚至是遠(yuǎn)程磁盤的存儲(chǔ)容量。我們將這個(gè)問題稱為大數(shù)據(jù)。當(dāng)主存儲(chǔ)器(內(nèi)核)無(wú)法容納數(shù)據(jù)集,或者當(dāng)本地磁盤都無(wú)法容納數(shù)據(jù)集的時(shí)候,最常用的解決辦法就是獲取更多的資源。”這是在美國(guó)計(jì)算機(jī)學(xué)會(huì)的數(shù)字圖書館中第一篇使用“大數(shù)據(jù)”這一術(shù)語(yǔ)的文章。
1997年
邁克爾·萊斯克發(fā)表了《世界上究竟有多少信息?》一文,萊斯克得出以下結(jié)論“世界上的信息總量近乎幾千PB;到2000年,磁帶和磁盤的生產(chǎn)將達(dá)到上述水平。因此,在短短幾年內(nèi),(a)我們可以存儲(chǔ)任何信息——沒有信息不得不被放棄,(b)人們?cè)僖膊粫?huì)看到典型的信息片段。”
1998年10月
K·G·科夫曼和安德魯·奧德里科發(fā)表了《互聯(lián)網(wǎng)的規(guī)模與增長(zhǎng)速度》一文。他們認(rèn)為“公共互聯(lián)網(wǎng)流量的增長(zhǎng)速度,雖然比通常認(rèn)為的要低,卻仍然以每年100%的速度增長(zhǎng),要比其他網(wǎng)絡(luò)流量的增長(zhǎng)快很多。然而,如果以當(dāng)前的趨勢(shì)繼續(xù)發(fā)展,在2002年左右,美國(guó)的數(shù)據(jù)流量就要趕超聲音流量,且將由互聯(lián)網(wǎng)主宰。”奧德里科隨后建立了明尼蘇達(dá)互聯(lián)網(wǎng)流量研究所(MINTS),跟蹤2002年到2009年互聯(lián)網(wǎng)流量的增長(zhǎng)情況。
1999年8月
史蒂夫·布賴森、大衛(wèi)·肯懷特、邁克爾·考克斯、大衛(wèi)·埃爾斯沃思以及羅伯特·海門斯在《美國(guó)計(jì)算機(jī)協(xié)會(huì)通訊》上發(fā)表了《千兆字節(jié)數(shù)據(jù)集的實(shí)時(shí)性可視化探索》一文。這是《美國(guó)計(jì)算機(jī)協(xié)會(huì)通訊》上第一篇使用“大數(shù)據(jù)”這一術(shù)語(yǔ)的文章(這篇文章有一個(gè)部分的標(biāo)題為“大數(shù)據(jù)的科學(xué)可視化”)。文章開篇指出:“功能強(qiáng)大的計(jì)算機(jī)是許多查詢領(lǐng)域的福音。它們也是禍害;高速運(yùn)轉(zhuǎn)的計(jì)算產(chǎn)生了規(guī)模龐大的數(shù)據(jù)。曾幾何時(shí)我們認(rèn)為兆字節(jié)(MB)的數(shù)據(jù)集就很大了,現(xiàn)在我們?cè)趩蝹€(gè)模擬計(jì)算中就發(fā)現(xiàn)了300GB范圍的數(shù)據(jù)集。但是研究高端計(jì)算產(chǎn)生的數(shù)據(jù)是一個(gè)很有意義的嘗試。不止一位科學(xué)家曾經(jīng)指出,審視所有的數(shù)字是極其困難的。正如數(shù)學(xué)家、計(jì)算機(jī)科學(xué)家先驅(qū)理查德·W·海明指出的,計(jì)算的目的是獲得規(guī)律性的認(rèn)識(shí),而不是簡(jiǎn)單地獲得數(shù)字。”10月份,在美國(guó)電氣和電子工程師協(xié)會(huì)(IEEE)1999年關(guān)于可視化的年會(huì)上,布賴森、肯懷特、海門斯與大衛(wèi)·班克斯、羅伯特·范·里拉和山姆·思爾頓在名為“自動(dòng)化或者交互:什么更適合大數(shù)據(jù)?”的專題討論小組中共同探討大數(shù)據(jù)的問題。
2000年10月
彼得·萊曼與哈爾·R·瓦里安在加州大學(xué)伯克利分校網(wǎng)站上發(fā)布了一項(xiàng)研究成果:《信息知多少?》。這是在計(jì)算機(jī)存儲(chǔ)方面第一個(gè)綜合性地量化研究世界上每年產(chǎn)生并存儲(chǔ)在四種物理媒體:紙張、膠卷、光盤(CD與DVD)和磁盤中新的以及原始信息(不包括備份)總量的成果。研究發(fā)現(xiàn),1999年,世界上產(chǎn)生了1.5EB獨(dú)一無(wú)二的信息,或者說是為地球上每個(gè)男人、每個(gè)女人以及每個(gè)孩子產(chǎn)生了250MB信息。研究同時(shí)發(fā)現(xiàn),“大量唯一的信息是由個(gè)人創(chuàng)造和存儲(chǔ)的”(被稱為“數(shù)字民主化”),“數(shù)字信息產(chǎn)品不僅數(shù)量龐大,而且以最快的速度增長(zhǎng)”。作者將這項(xiàng)發(fā)現(xiàn)稱為“數(shù)字統(tǒng)治”。萊曼和瓦里安指出,“即使在今天,大多數(shù)文本信息都是以數(shù)字形式產(chǎn)生的,在幾年之內(nèi),圖像也將如此。”2003年,萊曼與瓦里安發(fā)布了最新研究成果:2002年世界上大約產(chǎn)生了5EB新信息,92%的新信息存儲(chǔ)在磁性介質(zhì)上,其中大多數(shù)存儲(chǔ)在磁盤中。
2001年2月
梅塔集團(tuán)分析師道格·萊尼發(fā)布了一份研究報(bào)告,題為《3D數(shù)據(jù)管理:控制數(shù)據(jù)容量、處理速度及數(shù)據(jù)種類》。十年后,3V作為定義大數(shù)據(jù)的三個(gè)維度而被廣泛接受。
2005年9月
蒂姆·奧萊利發(fā)表了《什么是Web2.0》一文,在文中,他斷言“數(shù)據(jù)將是下一項(xiàng)技術(shù)核心”。奧萊利指出:“正如哈爾·瓦里安在去年的一次私人談話中所說的,‘結(jié)構(gòu)化查詢語(yǔ)言是一種新的超文本鏈接標(biāo)示語(yǔ)言’。數(shù)據(jù)庫(kù)管理是Web2.0公司的核心競(jìng)爭(zhēng)力,以至于我們有些時(shí)候?qū)⑦@些應(yīng)用稱為‘訊件’,而不僅僅是軟件。”
2007年3月
約翰·F·甘茨,大衛(wèi)·萊茵澤爾及互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)其他研究人員出版了一個(gè)白皮書,題為《膨脹的數(shù)字宇宙:2010年世界信息增長(zhǎng)預(yù)測(cè)》。這是第一份評(píng)估與預(yù)測(cè)每年世界所產(chǎn)生與復(fù)制的數(shù)字化數(shù)據(jù)總量的研究?;ヂ?lián)網(wǎng)數(shù)據(jù)中心估計(jì),2006年世界產(chǎn)生了161EB數(shù)據(jù),并預(yù)測(cè)在2006年至2010年間,每年為數(shù)字宇宙所增加的信息將是以上數(shù)字的六倍多,達(dá)到988EB,或者說每18個(gè)月就翻一番。據(jù)2010年和2011年同項(xiàng)研究所發(fā)布的信息,每年所創(chuàng)造的數(shù)字化數(shù)據(jù)總量超過了這個(gè)預(yù)測(cè),2010年達(dá)到了1,200EB,2011年增長(zhǎng)到了1,800EB。
2008年1月
布雷特·斯旺森和喬治·吉爾德發(fā)表了《評(píng)估數(shù)字洪流》一文,在文中他們提出到2015年美國(guó)IP流量將達(dá)到1ZB,2015年美國(guó)的互聯(lián)網(wǎng)規(guī)模將至少是2006年的50倍。
2008年6月
思科發(fā)布了一份報(bào)告,題為《思科視覺網(wǎng)絡(luò)指數(shù)——預(yù)測(cè)與方法,2007-2012》,作為“持續(xù)跟蹤和預(yù)測(cè)視覺網(wǎng)絡(luò)應(yīng)用影響的行動(dòng)”的一部分。這份報(bào)告預(yù)言,“從現(xiàn)在到2012年,IP流量將每?jī)赡攴环?rdquo;,2012年IP流量將達(dá)到0.5ZB。這份預(yù)測(cè)比較準(zhǔn)確,正如思科最近一份報(bào)告(2012年5月30日)指出的,2012年IP流量剛剛超過0.5ZB,“在過去的5年中增長(zhǎng)了8倍”。
2009年12月
羅杰·E·博恩和詹姆斯·E·少特發(fā)表了《信息知多少?2009年美國(guó)消費(fèi)者報(bào)告》。研究發(fā)現(xiàn),2008年“美國(guó)人消費(fèi)了約1.3萬(wàn)億小時(shí)信息,幾乎平均每天消費(fèi)12小時(shí)??傆?jì)3.6澤字節(jié)(ZB),10,845萬(wàn)億單詞,相當(dāng)于平均每人每天消費(fèi)100,500單詞及34GB信息。博恩、少特和沙坦亞·巴魯在2011年1月發(fā)表了《信息知多少?2010年企業(yè)服務(wù)器信息報(bào)告》,繼續(xù)上述研究。在文中他們估計(jì),2008年“世界上的服務(wù)器處理了9.57ZB信息,幾乎是95,700,000,000,000,000,000,000字節(jié)信息,或者是10萬(wàn)億GB。也就是平均每天每個(gè)工作者產(chǎn)生12GB信息,或者每年每個(gè)工作者產(chǎn)生3TB 信息。世界上所有的公司平均每年處理63TB信息。”
2010年2月
肯尼斯·庫(kù)克爾在《經(jīng)濟(jì)學(xué)人》上發(fā)表了一份關(guān)于管理信息的特別報(bào)告《數(shù)據(jù),無(wú)所不在的數(shù)據(jù)》。庫(kù)克爾在文中寫道:“…世界上有著無(wú)法想象的巨量數(shù)字信息,并以極快的速度增長(zhǎng)…從經(jīng)濟(jì)界到科學(xué)界,從政府部門到藝術(shù)領(lǐng)域,很多地方都已感受到了這種巨量信息的影響。科學(xué)家和計(jì)算機(jī)工程師已經(jīng)為這個(gè)現(xiàn)象創(chuàng)造了一個(gè)新詞匯:‘大數(shù)據(jù)’。”
2011年2月
馬丁·希爾伯特和普里西拉·洛佩茲在《科學(xué)》雜志上發(fā)表了《世界存儲(chǔ)、傳輸與計(jì)算信息的技術(shù)能力》一文。他們估計(jì)1986至2007年間,世界的信息存儲(chǔ)能力以每年25%的速度增長(zhǎng)。同時(shí)指出,1986年99.2%的存儲(chǔ)容量都是模擬性的,但是到了2007年,94%的存儲(chǔ)容量都是數(shù)字化的,兩種存儲(chǔ)方式發(fā)生了角色的根本性逆轉(zhuǎn)(2002年,數(shù)字化信息存儲(chǔ)第一次超過非數(shù)字化信息存儲(chǔ))。
2011年5月
麥肯錫全球研究院的詹姆斯•馬尼卡、邁克爾·崔、布雷德·布朗、杰克斯·卜黑、理查德·多布斯、查爾斯·羅克斯伯勒以及安杰拉·孔·拜爾斯發(fā)布了《大數(shù)據(jù):下一個(gè)具有創(chuàng)新力、競(jìng)爭(zhēng)力與生產(chǎn)力的前沿領(lǐng)域》。他們指出:“到2009年,對(duì)于美國(guó)所有的經(jīng)濟(jì)部門而言,平均每個(gè)有1,000名以上員工的公司所存儲(chǔ)的數(shù)據(jù)至少有200TB(是美國(guó)零售商沃爾瑪在1999年數(shù)據(jù)倉(cāng)儲(chǔ)的兩倍)”證券和投資服務(wù)部門所存儲(chǔ)的數(shù)據(jù)處于領(lǐng)先地位??偟膩碇v,這項(xiàng)研究估計(jì)2010年所有的公司存儲(chǔ)了7.4EB新產(chǎn)生的數(shù)據(jù),消費(fèi)者存儲(chǔ)了6.8EB新數(shù)據(jù)。
2012年4月
《國(guó)際通信學(xué)報(bào)》出版了“信息計(jì)量”專題,這是多種測(cè)量信息量的研究方法與研究結(jié)果的專題。在《追蹤家庭信息流》一文中,諾伊曼、帕克和潘尼克(運(yùn)用前文提到的日本郵電部和普爾的研究方法)估計(jì),為美國(guó)家庭所提供的所有媒體信息從1960年的每天50,000分鐘增長(zhǎng)到2005年的900,000分鐘。根據(jù)2005年的供需比例,他們估計(jì)美國(guó)人“1分鐘所需消費(fèi)的信息有1,000分鐘的媒體內(nèi)容可供選擇。”在《信息的國(guó)際化生產(chǎn)與傳播》一文中,邦妮和吉爾(運(yùn)用上文中萊曼和瓦里安的研究方法)估計(jì)2008年世界產(chǎn)生了14.7EB新信息,接近2003年信息總量的三倍。
注釋:我有意沒有考慮對(duì)信息價(jià)值(和成本)的討論,及用金融術(shù)語(yǔ)和/或信息/知識(shí)工作者的數(shù)量來衡量信息經(jīng)濟(jì)(例如馬克盧普、波拉特、謝曼特)的嘗試。同樣沒有考慮的還有很多有意思的關(guān)于“信息超載”的參考文獻(xiàn),或者是相似的術(shù)語(yǔ),詹姆斯·格雷克在最近出版的《信息》(詳見第15章)一書中對(duì)這些術(shù)語(yǔ)進(jìn)行了調(diào)查。格雷克在克勞德·申農(nóng)的注釋中發(fā)現(xiàn)了申農(nóng)(1949年)試圖判定具有“比特存儲(chǔ)容量”的各種事物,如穿孔卡片、“人類遺傳學(xué)構(gòu)造”(格雷克指出,申農(nóng)是提出“基因組是一個(gè)信息庫(kù),并以比特為單位進(jìn)行衡量”的第一人)、唱片。在申農(nóng)的列表里,最大條目是擁有100萬(wàn)億兆比特的美國(guó)國(guó)會(huì)圖書館。
如果您認(rèn)為還有相關(guān)事件、里程碑、研究、或者發(fā)現(xiàn),請(qǐng)告知我。
譯者附:
字節(jié)的次方單位
十進(jìn)制前綴 (SI) |
二進(jìn)制前綴 (IEC 60027-2) |
|||||
名稱(英) |
名稱(中) |
縮寫 |
次方 |
名稱 |
縮寫 |
次方 |
kilobyte |
千字節(jié) |
KB |
103 |
kibibyte |
KiB |
210 |
megabyte |
兆字節(jié) |
MB |
106 |
mebibyte |
MiB |
220 |
gigabyte |
吉字節(jié) |
GB |
109 |
gibibyte |
GiB |
230 |
terabyte |
太字節(jié) |
TB |
1012 |
tebibyte |
TiB |
240 |
petabyte |
拍字節(jié) |
PB |
1015 |
pebibyte |
PiB |
250 |
exabyte |
艾字節(jié) |
EB |
1018 |
exbibyte |
EiB |
260 |
zettabyte |
澤字節(jié) |
ZB |
1021 |
zebibyte |
ZiB |
270 |
yottabyte |
堯字節(jié) |
YB |
1024 |
yobibyte |
YiB |
280 |