1983到2012:大數(shù)據(jù)發(fā)展演進(jìn)大事記
近幾年來(lái),大數(shù)據(jù)一直是公共領(lǐng)域的一個(gè)熱詞,但其根源其實(shí)早已深植于整部IT發(fā)展史中。回溯過(guò)去30年,我們就會(huì)發(fā)現(xiàn)一些在影響著我們收集、管理和分析數(shù)據(jù)的關(guān)鍵事件,這些事件有助于解釋為何大數(shù)據(jù)今天會(huì)如此熱門的原因。
1983
IBM發(fā)布***的關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)DB2,使用結(jié)構(gòu)化查詢語(yǔ)言,很快成為政府部門的主流產(chǎn)品。
1985
面向編程(OOP)語(yǔ)言,如Eiffel開始流行。
1990
用于互聯(lián)網(wǎng)搜索的***搜索工具Archie誕生。
1991
萬(wàn)維網(wǎng)(World Wide Web)利用超文本傳輸協(xié)議(HTTP)和超文本標(biāo)記語(yǔ)言(HTML)逐漸成為信息共享的公共服務(wù)。
而Gopher作為互聯(lián)網(wǎng)上分布、搜索和提取文檔的TCP/IP應(yīng)用層協(xié)議,可以說(shuō)是早期Web的一個(gè)替代品。Gopher的出現(xiàn)導(dǎo)致了兩個(gè)新的搜索程序,即Veronica和Jughead的出現(xiàn)。
1993
W3CCatalog發(fā)布,它是萬(wàn)維網(wǎng)上最早出現(xiàn)的搜索引擎。
1995
Sun發(fā)表Java平臺(tái),而Java語(yǔ)言則是1991年發(fā)明的。該平臺(tái)在數(shù)據(jù)治理方面獲得最廣泛使用,在Web應(yīng)用中尤其普及,逐漸取代了面對(duì)面的和書面的事務(wù)。
1972年開始運(yùn)行的全球定位系統(tǒng)(GPS)這一年實(shí)現(xiàn)了全球運(yùn)營(yíng)能力。
1997
NASA阿姆斯研究中心的Michael Cox和David Ellsworth發(fā)表了一篇論述虛擬化的論文,探討了計(jì)算資源無(wú)法即時(shí)處理的過(guò)大數(shù)據(jù)集的挑戰(zhàn)。該論文寫道:“我們稱這一問(wèn)題為大數(shù)據(jù)問(wèn)題,”這可能是***提出大數(shù)據(jù)這一術(shù)語(yǔ)。
1998
Carlo Strozzi開發(fā)出一個(gè)開源關(guān)系數(shù)據(jù)庫(kù),并稱其為NoSQL。十年后,一場(chǎng)開發(fā)NoSQL數(shù)據(jù)庫(kù)以處理大型、非結(jié)構(gòu)化數(shù)據(jù)集的運(yùn)動(dòng)開始啟動(dòng)。
谷歌公司誕生。
2001
萬(wàn)維網(wǎng)發(fā)明人Tim Berners-Lee提出“語(yǔ)義Web”這一術(shù)語(yǔ),夢(mèng)想著機(jī)器與機(jī)器交互“會(huì)讓在Web上分析所有數(shù)據(jù)成為可能。”
維基百科發(fā)布。
2002
2001年9月11日,紐約遭受恐怖襲擊。DARPA開始研制整體情報(bào)識(shí)別系統(tǒng),綜合了生物識(shí)別、語(yǔ)言處理、預(yù)測(cè)模型和數(shù)據(jù)庫(kù)技術(shù),是美國(guó)眾多情報(bào)機(jī)構(gòu)所進(jìn)行的新型數(shù)據(jù)采集和分析努力之一。
2003
根據(jù)IDC和EMC的研究,電腦和其他數(shù)據(jù)系統(tǒng)在這一年中所產(chǎn)生的數(shù)字信息量超過(guò)了2003年之前歷史上全人類所產(chǎn)生的信息總量。
2005
Apache Hadoop項(xiàng)目這一年誕生,它注定要成為治理大數(shù)據(jù)的基礎(chǔ)。
美國(guó)國(guó)家科學(xué)基金會(huì)建議為“足夠多的高質(zhì)量數(shù)據(jù)科學(xué)家”創(chuàng)建職業(yè)路徑,這些科學(xué)家主要處理日益增長(zhǎng)的數(shù)字信息集合。
2008
連接到互聯(lián)網(wǎng)上的設(shè)備數(shù)量超過(guò)了世界人口總量。
2011
IBM的沃森超級(jí)計(jì)算機(jī)每秒可掃描并分析4TB(約2億頁(yè)文字量)的數(shù)據(jù)量,并在美國(guó)著名智力競(jìng)賽電視節(jié)目“Jeopardy”上擊敗兩名人類選手而奪冠。
用于NoSQL數(shù)據(jù)庫(kù)的查詢語(yǔ)言UnQL開始研發(fā)。
2012
奧巴馬政府發(fā)布大數(shù)據(jù)研發(fā)倡議,該倡議涉及美國(guó)政府的六個(gè)部門的84項(xiàng)計(jì)劃。美國(guó)國(guó)家基金會(huì)同時(shí)發(fā)布了《推進(jìn)大數(shù)據(jù)科學(xué)和工程的核心方法及技術(shù)》。
IDC和EMC估計(jì),2012年將產(chǎn)生2.8ZB的數(shù)據(jù),但其中只有3%能夠當(dāng)做大數(shù)據(jù)來(lái)使用,能分析的數(shù)據(jù)量則更少。該報(bào)告預(yù)計(jì),到2020年的數(shù)字世界將擁有40ZB的容量,是全世界所有海灘全部沙粒數(shù)的57倍!