機(jī)器學(xué)習(xí)機(jī)制正在崛起
譯文當(dāng)量變積累到一定程度之后,就會(huì)引發(fā)顛覆性質(zhì)變。“還記得人工神經(jīng)網(wǎng)絡(luò)嗎?”Christopher Nguyen問道。“當(dāng)我們?yōu)槠渑鋫渥銐螨嫶蟮膬?nèi)存與計(jì)算資源,就會(huì)出現(xiàn)有趣的現(xiàn)象——它真正活了過來(lái)。”
作為Google Apps的前任工程技術(shù)主管,Nguyen提到的是他所建立的初創(chuàng)企業(yè)Adatao打造出的技術(shù)成果——這家公司剛剛從Andreessen Horowitz處獲得了1300萬(wàn)美元投資。Adatao的價(jià)值主張分為兩大部分:
pInsights,基于文檔的虛擬化層,旨在為終端用戶提供面向大規(guī)模數(shù)據(jù)集的簡(jiǎn)單實(shí)時(shí)化查詢機(jī)制;
pAnalytics,一套以Hadoop與Apache Spark為基礎(chǔ)的怪獸級(jí)數(shù)據(jù)處理引擎。
二者都包含有ANN(即人工神經(jīng)網(wǎng)絡(luò))組件,這一原本僅僅以構(gòu)想形式存在的技術(shù)方案如今借助龐大的內(nèi)存與處理能力最終走上了商業(yè)化正軌。
Adatao的目標(biāo)在于將大數(shù)據(jù)分析帶入規(guī)?;w系,進(jìn)而幫助用戶借助包含大型數(shù)據(jù)集圖表的Google Apps類文檔實(shí)現(xiàn)協(xié)作。我曾經(jīng)親眼見證過該方案的演示效果,在采用由Amazon Web Services托管的八核心服務(wù)器集群(每臺(tái)服務(wù)器配備30GB內(nèi)存)的情況下,面向數(shù)TB級(jí)別數(shù)據(jù)集的查詢?nèi)蝿?wù)能夠很快得以完成。為了實(shí)現(xiàn)承諾中的易用性,Adatao公司需要利用ANN識(shí)別處理當(dāng)中的數(shù)據(jù)對(duì)象、從而對(duì)通過輸入簡(jiǎn)明英文表達(dá)進(jìn)行的查詢操作作出快速響應(yīng)。根據(jù)Nguyen的說(shuō)法,該系統(tǒng)能夠識(shí)別最多20000個(gè)對(duì)象。
如果Adatao能夠獲得成功,他們將成為當(dāng)之無(wú)愧的游戲規(guī)則改變者。但最令我感到興奮的,仍然是其在人工智能方面取得的成就。
在觀看了演示實(shí)例之后,我立刻打電話給我的朋友Miko Matsumura——Hazelcast公司市場(chǎng)推廣事務(wù)副總裁,他曾經(jīng)在耶魯大學(xué)取得了計(jì)算科學(xué)碩士學(xué)位。我告訴他,根據(jù)我個(gè)人極為有限的理解,人工智能的實(shí)現(xiàn)在很大程度上已經(jīng)轉(zhuǎn)化為軟件而非硬件課題,而Adatao的ANN技術(shù)似乎為實(shí)現(xiàn)這一構(gòu)想提供了鮮活且可資借鑒的例子。
Miko旋即向我提到了Paul與Patricia Churchland得出的結(jié)論,他們?cè)?jīng)指出那些否認(rèn)人工智能可能性的反對(duì)派就像是在黑暗的房間里揮動(dòng)磁鐵、并借此宣稱磁性并不能產(chǎn)生光亮——這樣的結(jié)論非?;闹嚕瑹o(wú)法發(fā)光只不過是因?yàn)樗麄兊膿]舞速度還不夠快。時(shí)至今日,我們已經(jīng)具備了點(diǎn)亮人工智能這盞明燈的巨大內(nèi)存與計(jì)算容量,因此可以說(shuō)人類已經(jīng)站在了邁向技術(shù)新紀(jì)元的起跑線上。
事實(shí)上,這場(chǎng)競(jìng)逐早已開始,其主要實(shí)踐性應(yīng)用就是大數(shù)據(jù)分析。正如James Kobielus在今年早些時(shí)候所強(qiáng)調(diào),“機(jī)器學(xué)習(xí)的普及程度已經(jīng)如此之高,我們能夠在多數(shù)大數(shù)據(jù)應(yīng)用程序當(dāng)中看到它們的身影。”
“我們的未來(lái)既充滿光明也滲透著黑暗氣息,”Miko這樣描述***次將機(jī)器學(xué)習(xí)機(jī)制納入大數(shù)據(jù)方案所帶來(lái)的影響。換句話來(lái)說(shuō),利用人工智能分析機(jī)制處理任何可用的互聯(lián)網(wǎng)數(shù)據(jù)——其中包括收集自移動(dòng)與可穿戴設(shè)備的、更為詳盡的個(gè)人信息——網(wǎng)站與商家能夠獲取到***實(shí)用價(jià)值的分析結(jié)論。與此同時(shí),這也令我們普通用戶不寒而栗,因?yàn)檫@種個(gè)性化幫助的背后隱藏著個(gè)人信息的大量外泄。
無(wú)論如何,機(jī)器學(xué)習(xí)與大數(shù)據(jù)協(xié)作的首要目標(biāo)在于推動(dòng)客戶提高消費(fèi)額度并保持理想的忠誠(chéng)度,這其實(shí)并不令人意外。不過其潛在影響將延伸到每一個(gè)學(xué)科,從醫(yī)療保健到氣象預(yù)測(cè)。隨著計(jì)算資源的廉價(jià)化與規(guī)模化,新的智能系統(tǒng)已經(jīng)由構(gòu)想變?yōu)榍袑?shí)可行,我們也迎來(lái)了全新計(jì)算階段所帶來(lái)的一系列質(zhì)變。否認(rèn)這一點(diǎn),顯然無(wú)異于在黑暗中揮動(dòng)磁鐵。
原文鏈接:
http://www.infoworld.com/t/big-data/the-rise-of-machines-learn-248037
原文標(biāo)題:The rise of machines that learn