算法王國,中國可能實現(xiàn)彎道超車
今年年初,兩件事吸引到那些正持續(xù)關(guān)注全球人工智能發(fā)展的人們。其一是微軟的高管陸奇在 1 月表示,自行車事故之后,他將不再回到這家全球最大的軟件公司任職,而將擔任中國最大的搜索引擎公司——百度的首席運營官。而第二件則是該月末,由于 AAAI (國際人工智能協(xié)會)年會的原定日期與中國春節(jié)相沖突,最終將會議推遲。
這些跡象表明,在一些人工智能至關(guān)重要的領(lǐng)域,中國有可能實現(xiàn)彎道超車,比如語音助手、自動駕駛汽車等。陸奇解釋道,中國就是這樣的地方,而百度也是最為重要的參與者。他說:「我們有機會領(lǐng)導人工智能的未來」。事實證明他所言不虛。2016 年 10 月,白宮的一份報告指出,在人工智能的分支深度學習方面,中國發(fā)表的相關(guān)期刊文章已然超越了美國。咨詢公司普華永道預測,在 2030 年之前,與人工智能相關(guān)的發(fā)展將會促使全球 GDP 增長16億美元;據(jù)估計,近一半的財源都將累積至中國。盡管美國在絕對數(shù)量上仍然領(lǐng)先,但近幾年來,中國研究人員所提交的人工智能相關(guān)的專利申請數(shù)量增加了近 200%(如下圖表所示)。
若要了解為何中國如此得天獨厚,便應當考慮人工智能所需的投入。中國擁有豐富的兩大基本要素——計算能力以及資本。從阿里巴巴與騰訊這樣的巨頭,到 CIB FinTech 與 UCloud 這樣的初創(chuàng)公司,這些中國企業(yè)都在加快速度建立數(shù)據(jù)中心。據(jù)咨詢公司 Gartner 報道,云計算市場近年來已增長了 30% 之多,且將持續(xù)增長下去。據(jù)智囊團烏鎮(zhèn)智庫統(tǒng)計,2012 - 2016 年,中國的人工智能企業(yè)獲得了 26 億美元資金,雖然低于美國同行的 179 億美元,但總體而言仍在飛速增長。
然而,能使中國真正成為人工智能「應許之地」的還有兩種資源。其一便是研究型人才。微軟全球執(zhí)行副總裁、微軟人工智能及微軟研究事業(yè)部負責人沈向洋( Harry Shum )表示,除了數(shù)學方面的強大才能,中國還有研究語言和翻譯的傳統(tǒng)。在阿里巴巴負責管理 150 位數(shù)據(jù)科學家的閔萬里說,在中國發(fā)現(xiàn)頂尖的人工智能專家要難于美國。但他預測,由于許多大學都推出了人工智能計劃,所以未來幾年將有所改變。據(jù)估計,中國擁有超過世界五分之二的高素質(zhì)人工智能科學家。
其二是數(shù)據(jù),即人工智能最為重要的部分。軟件和數(shù)字產(chǎn)品在過去大多都遵循代碼所制定的規(guī)則,因而擁有頂尖編程人員的國家便更具優(yōu)勢。隨著深度學習算法的出現(xiàn),這些規(guī)則愈發(fā)以從數(shù)據(jù)庫中提取出的模式為基礎(chǔ)??捎玫臄?shù)據(jù)越多,能夠?qū)W習的算法也會更多,人工智能產(chǎn)品也會因此而更加智能。
中國的人口等規(guī)模及數(shù)據(jù)多樣性為這一循環(huán)提供了有力的燃料。僅靠日常生活,全國近 1.4 億人口所產(chǎn)生的數(shù)據(jù)便多于其他幾個國家之和。即便是一些罕見病,也不曾缺乏用來教算法識別這種病的病例。由于打漢字比西方國家的文字更為費力,因此中國人往往比西方人更傾向于使用語音識別服務,于是公司便擁有更多語音片段來改進語音產(chǎn)品。
數(shù)據(jù)富礦
真正能夠使中國大放異彩的是,它擁有約 7.3 億的互聯(lián)網(wǎng)用戶,超過了其他任何國家。幾乎所有人都通過智能手機上網(wǎng),而它們含有傳感器且方便攜帶,產(chǎn)生的數(shù)據(jù)遠比臺式電腦珍貴得多。例如,大型沿海城市的人們已不再使用現(xiàn)金進行小額購物,而是通過移動設(shè)備用支付寶和微信支付等完成交易。
中國人似乎并不十分重視隱私,這使數(shù)據(jù)更易于收集。例如,以迅雷不及掩耳之勢風靡大型城市的共享單車服務,不僅提供了實惠的交通工具,而且它還是一種「數(shù)據(jù)播放」。當乘客租用單車時,一些公司便可以通過車上的 GPS 裝置追蹤用戶的行動。
中國的年輕人似乎十分熱衷于以人工智能驅(qū)動的服務,對個人數(shù)據(jù)的使用也很放松。小冰是微軟開發(fā)的一個開朗樂觀的聊天機器人,如今她已擁有超過 1 億位中國用戶。他們通常會在夜晚 11 點至凌晨 3 點之間討論白天遇到的問題。她會從互動中學習,從而變得更加智能。小冰不再僅限于提供鼓勵或講笑話,而是創(chuàng)作了第一部人工智能創(chuàng)作詩集「陽光失了玻璃窗」,這引發(fā)了中國文學界對于是否存在人工智能詩的激烈討論。
在中國,人工智能的另一個重要支持者便是政府,這項技術(shù)在其目前的五年計劃中地位顯赫。技術(shù)公司正與政府機構(gòu)進行密切合作,如百度已響應號召,領(lǐng)導國家深度學習實驗室。但政府用清規(guī)戒律對人工智能公司加壓的可能性微乎其微,中國包含個人資料保護相關(guān)規(guī)定的法律有 40 多條,但它們鮮少得以執(zhí)行。
企業(yè)家正在利用中國的人才與數(shù)據(jù)優(yōu)勢。許多人工智能公司僅建立兩年時間,但與西方的同行相比進展神速。李開復是 21 世紀初的谷歌中國區(qū)總裁,如今是風投基金創(chuàng)新工場的創(chuàng)始人,他解釋道:「中國的人工智能初創(chuàng)公司通常會更快地進行迭代與執(zhí)行」。
于是,中國已然擁有了一批人工智能獨角獸,這些初創(chuàng)公司的價值超過了 10 億美元。位于北京的新聞聚合平臺今日頭條采用了機器學習,通過使用諸如讀者興趣及位置等信息來進行文章推薦;它還使用人工智能進行虛假信息過濾(在中國,主要是指可疑的醫(yī)療廣告)。而另一家初創(chuàng)公司 iFlytek 則開發(fā)了一個語音助手,它能將普通話翻譯為包括英語和德語在內(nèi)的幾種語言,即便是發(fā)言者使用俚語,或是存在背景噪音可能夠正常工作。另外,曠視科技的人臉識別軟件 Face ++幾乎能夠立即識別人臉。
「天網(wǎng)」生活
在曠視的總部,參觀者往往像是在體驗一場技術(shù)示范。大廳的攝像機并不顯示 ID :員工進出不必出示徽章。整個辦公室的設(shè)備都是類似的,而反饋則顯示在視頻墻上。當墻上出現(xiàn)人臉時,會立即被一個白色矩形框起來,同時顯示這個人的相關(guān)信息。屏幕的右上角則鮮明地標示出「 Skynet 」,這是終結(jié)者系列電影中消滅人類的人工智能系統(tǒng)名稱。這家公司已經(jīng)授權(quán)支付寶和叫車服務公司滴滴來檢查新客戶的身份——將他們的面部與政府的登記圖片作對比。
為應對這些初創(chuàng)公司的成功,中國的科技巨頭也開始大力投資人工智能。百度、阿里巴巴和騰訊(統(tǒng)稱為 BAT )正在開展許多相同服務,包括語言及人臉識別。但他們也試圖憑借自身優(yōu)勢,在人工智能的特定領(lǐng)域占領(lǐng)主導地位。
迄今為止,騰訊保持著最低配置,幾個月前才建立人工智能實驗室。但它勢必在人工智能領(lǐng)域一鳴驚人:與另外兩家互聯(lián)網(wǎng)界巨頭相比,它擁有更多數(shù)據(jù)。其微信的通訊服務擁有近 10 億賬戶,并且它也是從付款、新聞到城市指南與法律幫助等數(shù)千服務的平臺。騰訊在游戲方面同樣是世界領(lǐng)先,其風靡一時的游戲,如英雄聯(lián)盟與部落沖突在全球擁有超過 1 億的玩家。
中國電子商務領(lǐng)域的巨頭阿里巴巴,憑借數(shù)十億美元的投入使其云服務業(yè)務在國內(nèi)云計算領(lǐng)域做到排名第一。6 月,在上海舉行的一次會議中,阿里巴巴展示了一個名為「 ET 工業(yè)大腦」的人工智能服務,它能夠通過視頻識別來實時優(yōu)化交通,比如利用路邊的攝像頭預測汽車的行為,進行交通信號燈的調(diào)控。阿里巴巴稱,這個系統(tǒng)已將其家鄉(xiāng)杭州的平均交通速度提升了 11%。該公司還計劃強化「 ET 醫(yī)療大腦」,它基于人工智能服務進行藥物發(fā)現(xiàn)及醫(yī)學影像的診斷,并已簽署 10 余家醫(yī)院來獲得所需數(shù)據(jù)。
但百度的命運與人工智能連接最為緊密,部分原因在于也許技術(shù)便是追上阿里巴巴和騰訊的最大機遇。它將大部分資源都投入到了自動駕駛領(lǐng)域,希望能在 2018 年之前使自動駕駛汽車上市,并在2020 年之前為全自動汽車提供技術(shù)支持。7 月 5 日,百度在北京的 AI 開發(fā)者大會上發(fā)布了第一版本的自駕車系統(tǒng),稱為阿波羅。
阿波羅計劃不僅要實現(xiàn)汽車在街道上的安全航行,同時也是一個向外開放項目。谷歌子公司 Waymo 、電動汽車公司特斯拉等競爭對手正在小心翼翼地守著自己的軟件與收集的數(shù)據(jù)。而百度不僅計劃開源其系統(tǒng)平臺,而且還會進行數(shù)據(jù)共享。他們的想法是,使用百度技術(shù)的汽車制造商會做出同樣的舉動,從而為自動駕駛汽車的數(shù)據(jù)創(chuàng)造一個開放平臺,用陸奇的話來說,便是「創(chuàng)建自動駕駛汽車的 Android 系統(tǒng)」。
像北京人一樣開車
中國企業(yè)將人工智能產(chǎn)品推向海外能否成功還未可知,因為如今只有極少數(shù)公司這么做。它們理應發(fā)展很順利:那些在中國熙熙攘攘的街道上進行了大量訓練的自動駕駛汽車,在歐洲更為有序的交通道路上進行導航時理應該更不在話下;相反,在德國訓練的汽車可能連北京的第一個路口都不大可能通過。西方消費者在使用時仍有所猶豫,因為自動駕駛汽車是在對事故耐受度更高、寬松而又安全的環(huán)境中進行培訓。據(jù)稱,北京市政府正在千方百計使其能成為自動駕駛汽車的試驗城市。
還存在另一個風險。目前,數(shù)據(jù)是人工智能最珍貴的輸入,但其重要性可能會降低。人工智能公司已經(jīng)開始使用包括來自視頻游戲的模擬數(shù)據(jù),新型的算法則可能得以通過更少樣本來實現(xiàn)同樣的智能化效果。馭勢科技是一家正在開發(fā)自動駕駛技術(shù)的北京初創(chuàng)公司,其首席執(zhí)行官吳甘沙警告稱:「其中的危機在于我們滿足于數(shù)據(jù)上的優(yōu)勢從而停止了算法創(chuàng)新」。盡管目前為止,中國還正處于剛剛起步階段,但在人工智能領(lǐng)先地位的角逐中,它在步步逼近美國。
本文由轉(zhuǎn)自機器之能(微信公眾號:almosthuman2017)。