從1956到2011:Siri從幻想走向現(xiàn)實(shí)
人類從來就不吝于幻想未來,但就像所有的革命一樣,只有所有需要的技術(shù)都在那里的時(shí)候,Siri的出現(xiàn)才是必然。
從10月14日開始,“調(diào)戲Siri”變成了一個(gè)流行的游戲:擁有iPhone 4S的人們問它各種古怪的問題,沒有iPhone 4S的人們則以圍觀取樂。
如果有人只是把它看成一個(gè)語音搜索工具或者游戲,那就太不把Siri放在眼里了—喬布斯在收購(gòu)時(shí)就把Siri定義為“人工智能公司”。
人們已經(jīng)為此等待很久了。
回到1987年,Siri還不叫Siri,它叫Jill,長(zhǎng)了一張聰明的面孔,是一位教授的助手。這位助手—順便說一句,他生活在一本打開的平板電腦中—為教授提供了各種幫助:搜索論文的時(shí)間;提醒他回母親的電話;幫他接通電話,并在通話過程中提供搜索、提醒……
那只是一個(gè)幻想,是1980年代末期蘋果公司發(fā)布了一系列對(duì)未來展望的視頻中的一段。
在那之后的35年里,隨著計(jì)算機(jī)技術(shù)的發(fā)展,人工智能的研究從來沒有停止過:它有各種名字,有時(shí)候叫“T3”,有時(shí)候叫“深藍(lán)”……最近它又叫“沃森”—讓人興奮,但昂貴而且獨(dú)一無二。在這35年里,個(gè)人電腦已經(jīng)越來越小,iPad出現(xiàn)了;移動(dòng)設(shè)備功能越來越多,iPhone讓人們擺脫了鍵盤;移動(dòng)網(wǎng)絡(luò)的速度越來越快,3G也將成為歷史;自然語音的識(shí)別、強(qiáng)大的運(yùn)算能力、搜索已經(jīng)無處不在……一切技術(shù)都已經(jīng)準(zhǔn)備妥當(dāng)。
2010年4月,蘋果公司收購(gòu)了Siri。Siri 一位聯(lián)合創(chuàng)始人Dag Kittlaus寫下了一句話:“我們忙著搞下個(gè)大事情……很大很大。”
確實(shí)很大,Siri來了。
它讓人們第一次有機(jī)會(huì)去測(cè)試自己的個(gè)人助理到底是否能通過“普魯斯特測(cè)試問答”?,F(xiàn)在,答案是“不能”。但將來,Siri的行為是否確實(shí)符合“機(jī)器人三原則”才是真正的問題—不過,有可能那時(shí)候它的名字已經(jīng)不叫Siri了。
Siri是如何成為Siri的?
Long long ago
人類最初的幻想為后來的機(jī)器人提供了感性的基礎(chǔ)。雖然那時(shí)候它還只是一個(gè)形象,但先要有足夠的想象……
3000多年前中國(guó)偃師的“伶人”算得上是最早有記載的“機(jī)器人”。但真正能被稱為“機(jī)器人”的,還是公元前兩世紀(jì)的古希臘人發(fā)明的“自動(dòng)機(jī)”:它會(huì)自己開門,還可以借助蒸汽唱歌……18世紀(jì)時(shí),對(duì)機(jī)器人的幻想越來越常見,《木偶奇遇記》、《浮士德》中都出現(xiàn)過機(jī)器人的形象。人們希望有那么一種機(jī)械,具有人的形象,能為自己提供各種服務(wù)—但此時(shí),人類并沒有考慮過這種可以端茶、唱歌的機(jī)械是否需要思考。
#p#
1956
人工智能成為科學(xué),組成Siri的所有元素這個(gè)時(shí)候?qū)嶋H上已經(jīng)全部出現(xiàn)了。
1950年10月,圖靈發(fā)表了著名的“圖靈測(cè)試”,開創(chuàng)了計(jì)算機(jī)科學(xué)的重要分支─人工智能。但真正確定這一研究領(lǐng)域則是在1956年。這年,美國(guó)達(dá)特茅斯大學(xué)的青年助教麥卡錫、哈佛大學(xué)明斯基、貝爾實(shí)驗(yàn)室的香龍、IBM公司信息研究中心羅切斯特一起發(fā)起了一次學(xué)術(shù)研討會(huì)議,正式確定了人工智能(Artificial Intelligence)成為獨(dú)立的研究領(lǐng)域。從這天起,AI就跨越了計(jì)算機(jī)科學(xué)、哲學(xué)、心理學(xué)以及社會(huì)學(xué),成為了綜合的學(xué)科。
1983
Siri未來是什么形式是由Motorola的這次技術(shù)進(jìn)步?jīng)Q定的。
摩托羅拉Motorola DynaTAC 8000X成為世界上第一部手機(jī)。以手機(jī)為主的移動(dòng)設(shè)備開始進(jìn)入人們的日常生活。由于帶寬和硬件的限制,當(dāng)時(shí)的手機(jī)只能支持語音通話。就像摩爾定律所描繪的一樣,隨著芯片運(yùn)算能力的迅速提高,以及更多的移動(dòng)電話制造公司進(jìn)入這一領(lǐng)域,手機(jī)慢慢變小,便于攜帶。起初那個(gè)磚頭大小的手機(jī),為人工智能提供了一個(gè)硬件平臺(tái)和可能的發(fā)展方向—移動(dòng)和個(gè)人化。
1987
運(yùn)算的核心是個(gè)人電腦,PC革命是Siri的核心。
1980年代,電腦世界里最大的革命—個(gè)人電腦開始普及。在大型電腦最終進(jìn)入個(gè)人書桌成為可能后,以前人們的幻想開始成為可能。1987年,蘋果公司發(fā)布了對(duì)未來的展望視頻,平板電腦和其中的Jill—這位聰明的助理—成為人們對(duì)人工智能進(jìn)入日常生活的具體設(shè)想。隨著這種幻想變?yōu)楝F(xiàn)實(shí)的可能性的增加,人們開始探討人工智能的倫理道德問題。阿西莫夫的“機(jī)器人三大定律”正式成為AI的道德標(biāo)準(zhǔn)。
1990
數(shù)據(jù)通信,數(shù)字管理讓Siri有了具體的“工作”。
FCC批準(zhǔn)采用蜂巢網(wǎng)絡(luò)技術(shù),這使得移動(dòng)網(wǎng)絡(luò)不僅可以支持語音通話,還可以進(jìn)行數(shù)據(jù)通信。3年后,短信開始出現(xiàn)。2000年5月,國(guó)際通信聯(lián)盟發(fā)布了第三代移動(dòng)通信技術(shù)(3G)。這一標(biāo)準(zhǔn)使得移動(dòng)設(shè)備可以進(jìn)行高速數(shù)據(jù)傳輸。此后,以黑莓為代表的PDA進(jìn)入了人們的生活。這意味著人們不僅需要一個(gè)可以攜帶的電話,更需要一個(gè)可以攜帶的個(gè)人助理。1999年,Siri的創(chuàng)始人之一Adam Cheyer在SRI開始進(jìn)行與機(jī)器進(jìn)行語音交流的研究項(xiàng)目。
2003
找到Siri發(fā)展所限制的條件:如帶寬、數(shù)據(jù)通信以及處理。
美國(guó)國(guó)防部高級(jí)研究所成立了一個(gè)把人工智能轉(zhuǎn)化為生產(chǎn)助手的相關(guān)研究項(xiàng)目CALO,研發(fā)一種“人格化和有認(rèn)知能力的耐用輔助性機(jī)器”,而負(fù)責(zé)這一項(xiàng)目的是斯坦福研究院(SRI),其中“Personal Assistant that Learns”(PAL)是獨(dú)立研究認(rèn)知能力系統(tǒng)的子項(xiàng)目。2002年,當(dāng)時(shí)的研究員Adam Cheyer在一份關(guān)于“無線和移動(dòng)電腦的解決方案”的PPT中提到了移動(dòng)帶寬限制了智能搜索、網(wǎng)絡(luò)服務(wù)整合的發(fā)展。
2007
Siri已經(jīng)實(shí)現(xiàn)了。這個(gè)項(xiàng)目將以前零散的思路完整化。
CALO項(xiàng)目結(jié)束后,負(fù)責(zé)CALO項(xiàng)目的SRI研究員Adam Cheyer、Norman Winasky以及其他伙伴共同為PAL技術(shù)成立了獨(dú)立的開發(fā)公司Siri。公司成立之后,Adam Cheyer的團(tuán)隊(duì)繼續(xù)做了大量關(guān)于機(jī)器人學(xué)習(xí)能力和信息管理能力的研究。但他此時(shí)的重點(diǎn)已經(jīng)轉(zhuǎn)移到了AI在移動(dòng)設(shè)備上提供個(gè)人服務(wù)的應(yīng)用。Adam為Siri下了一個(gè)定義:它是各種技術(shù)的整合,包括對(duì)話、自然語言理解、視覺、演說、機(jī)器學(xué)習(xí)、制定計(jì)劃、理性思考等等。
2007
帶寬、處理器都還差那么一點(diǎn),但Siri的平臺(tái)搭建完畢了。
蘋果發(fā)布了第一款iPhone。它不僅使手機(jī)擺脫了鍵盤和帶寬的束縛,采取觸摸屏和3G網(wǎng)絡(luò)技術(shù),更大的意義是它具有強(qiáng)大的運(yùn)算速度,使得智能手機(jī)變?yōu)檎嬲慕K端,整合各種個(gè)人服務(wù)成為可能。App Store開創(chuàng)了一種全新的手機(jī)應(yīng)用模式,使得更多的人加入其中,為其提供更多的服務(wù)。第二年,Siri整合更多網(wǎng)絡(luò)服務(wù)并進(jìn)入了APP Store,可以運(yùn)行在3GS上。聯(lián)合創(chuàng)始人之一的Norman說:“Siri的人工智能需要使用大量的數(shù)據(jù),大量的運(yùn)算能力和網(wǎng)絡(luò)連接。”但,限于3GS的運(yùn)算速度,此時(shí)的Siri還不會(huì)說話,只能通過文字進(jìn)行回應(yīng)。
2010
一個(gè)成熟的產(chǎn)品需要強(qiáng)有力的推手,蘋果出現(xiàn)了。
4月,Siri被蘋果公司收購(gòu),隨之宣布取消在iPhone手機(jī)以外所有其他系統(tǒng)版本的研發(fā)。雖然收購(gòu)價(jià)格并沒有對(duì)外公布,但當(dāng)時(shí)Siri的估值大約在2億美元左右。在此后,蘋果公司再次擴(kuò)充了Siri能力,使其可以使用更多的系統(tǒng)基本的功能,包括使用Nuance的語音識(shí)別技術(shù)。但Norman認(rèn)為,對(duì)于Siri來說,語音只占很小的一部分,甚至并沒有那么重要,一旦有更好的語音識(shí)別技術(shù)出現(xiàn),Siri可以很容易更換一個(gè)新的。
2011
10年之后,我們看第一代Siri,可能跟看1984年的Macintosh一樣—它未免太幼稚了!但好在開始了。
美國(guó)當(dāng)?shù)貢r(shí)間10月4日,蘋果公司發(fā)布iPhone4S。在經(jīng)歷了最初的失望后,人們開始意識(shí)到,除了更快的運(yùn)算速度之外,Siri并不僅僅是一個(gè)語音系統(tǒng)或者搜索系統(tǒng),它意味著整合了網(wǎng)絡(luò)服務(wù)的人工智能開始進(jìn)入人們的日常生活。短短十天的測(cè)試后,人們意識(shí)到,現(xiàn)在的Siri還只是“弱人工智能”,并未具備“真正能夠推理和解決問題”的能力。但Siri的基礎(chǔ)是建立在iCloud,亦即云計(jì)算的支持上的。一周后,寶馬宣布將在自己的汽車上支持Siri技術(shù)。在更多公司和服務(wù)加入對(duì)Siri的支持后,Siri—這個(gè)“個(gè)人智能助理”的雛形將會(huì)成為真正的“個(gè)人智能助理”。