強人工智能還有多遠?先用10到20年突破這5個數(shù)學(xué)問題
7月30日,在成都高新區(qū)菁蓉匯舉辦的2019全球人工智能峰會上,中國科學(xué)院院士、西安交通大學(xué)教授徐宗本探討了人工智能與數(shù)學(xué)之間的關(guān)系。
從博弈論的角度來看一看,數(shù)學(xué)研究的問題和人工智能研究的問題是一致的。”他說,目前弱人工智能在邁向強、超人工智能所面臨的一些基礎(chǔ)問題,其本質(zhì)是來自數(shù)學(xué)的挑戰(zhàn)。
當(dāng)前人工智能變現(xiàn)
最核心技術(shù)在于機器學(xué)習(xí)
徐宗本表示,目前人工智能拿來“變現(xiàn)”最核心的技術(shù)是機器學(xué)習(xí)。而人工智能本身的基石是數(shù)學(xué)。
什么是機器學(xué)習(xí)?“人或者是智能體,通過與環(huán)境的交互來提升自己行為的這種智能叫機器學(xué)習(xí)。”他說,機器學(xué)習(xí)是把這種智能形式化為數(shù)學(xué)公式,轉(zhuǎn)換成計算機可以操作的算法和軟件。
而這一波人工智能的興起是由于:深度學(xué)習(xí)的應(yīng)用。通過與環(huán)境交互,調(diào)節(jié)參數(shù)來解決問題的任務(wù)求解器,可以被視作智能體。智能體可能反映為深度網(wǎng)絡(luò)、機器人或是無人系統(tǒng)。
深度學(xué)習(xí)所起的作用可以類比為:總結(jié)經(jīng)驗。徐宗本說:“人工智能做的絕大部分的事情是把重復(fù)性的、有規(guī)律的東西總結(jié)出來,然后用來預(yù)測預(yù)報。”因此人工智能深度學(xué)習(xí)的環(huán)境非常重要,需要大量有標簽的數(shù)據(jù),以判斷在一定準則下推測出的結(jié)果是否適合過去的經(jīng)驗。這件事情構(gòu)成的技術(shù)就叫深度學(xué)習(xí)技術(shù)。
“人工智能一個最重要的場景就是指把智能體放在一個特定的環(huán)境之中,智能體完成任務(wù),然后在環(huán)境約束之下與環(huán)境交互改正智能體的行為,這就是機器學(xué)習(xí)。”徐宗本說。
目前,由于人工智能三大驅(qū)動力——大數(shù)據(jù)、大模型、大算力技術(shù)的發(fā)展,使得現(xiàn)在的人工智能技術(shù)已經(jīng)突破了由“不能用”到“可以用”的技術(shù)拐點。“但是要說可以‘很好用’,還有很長的路要走。”徐宗本指出。
自動化、自主化
將是人工智能發(fā)展未來十年趨勢
徐宗本認為,人類距離研制出自主智能,即強人工智能還需幾十年的努力。
當(dāng)前人工智能用應(yīng)用形態(tài)處在數(shù)據(jù)加算法形成產(chǎn)品的時期,這也是目前人工智能賺錢的基本形態(tài)。而現(xiàn)在我們依然需要人工去采集數(shù)據(jù)、標注數(shù)據(jù),做推廣泛化都還是要靠人。
即使是先進的深度學(xué)習(xí)技術(shù),其每一層有多少個元素,每一個元素用什么非線性機制等等,都要人事先預(yù)設(shè)。“所以那些公司要養(yǎng)很多‘碼農(nóng)’去調(diào)試。還有用什么方法去訓(xùn)練它(人工智能)也是人為給定。”他說。
在應(yīng)用層面上,目前還只能實現(xiàn)一個神經(jīng)網(wǎng)絡(luò)智能解決一個問題,不能對問題自動切換。徐宗本預(yù)測,未來十年,人工智能研制焦點會在機器學(xué)習(xí)的自動化層面:自動生成數(shù)據(jù)、選擇數(shù)據(jù)、自動搭建神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)、自動設(shè)計訓(xùn)練算法,對任務(wù)能夠自切換、自適應(yīng)。
“現(xiàn)在是處于人工帶來智能的階段,正在走向自動化,朝著自主化。”他說。
人工智能發(fā)展本質(zhì)是5個數(shù)學(xué)挑戰(zhàn)
需持續(xù)10到20年研究去搞清楚
既然人工智能的核心在數(shù)學(xué),那么到底核心問題在哪?就此,徐宗本提出五個問題,而這五個問題可能將會持續(xù)10到20年的研究才能搞清楚。
第一是大數(shù)據(jù)的統(tǒng)計學(xué)基礎(chǔ)問題。
當(dāng)前,大數(shù)據(jù)破壞了傳統(tǒng)統(tǒng)計學(xué)基礎(chǔ)與分析方法,支持大數(shù)據(jù)分析的數(shù)學(xué)基礎(chǔ)卻尚未完全建立。
第二是人工智能算法的基石——大數(shù)據(jù)計算基礎(chǔ)算法,必須在大數(shù)據(jù)環(huán)境中重建起來,無法使用既有的計算方法。
第三也是更為關(guān)鍵的,新一輪的人工智能以深度學(xué)習(xí)為基本模型,然而現(xiàn)狀是缺少深度學(xué)習(xí)理論,這就是造成當(dāng)下“人工智能=人工+智能”的緣由。
第四個問題是非常規(guī)約束下的輸運問題。
簡單來說,就是“舉一反三”。這項人的基本智能,涉及到兩個不同分布數(shù)據(jù)間規(guī)律的轉(zhuǎn)移問題,人工智能要實現(xiàn)起來,尚有極大困難。
第五個問題是關(guān)于學(xué)習(xí)方法論的建模與函數(shù)空間上的學(xué)習(xí)理論。
“我們在本科學(xué)到的機器學(xué)習(xí)理論,要變到一個叫學(xué)習(xí)方法論的階段。從數(shù)學(xué)上說,就是函數(shù)空間上的學(xué)習(xí)理論怎么建立,本質(zhì)是要適應(yīng)不同的任務(wù)。由于任務(wù)本身是函數(shù),是無窮的,那么就需要把過去機器學(xué)習(xí)中對樣本、數(shù)據(jù)的選擇、泛化,推廣到對任務(wù)的泛化上去。
“由弱人工智能邁向超人工智能的基礎(chǔ)科學(xué)問題,讓大家意識到人工智能機會就在眼前。但是人工智能要做得好,要靠數(shù)學(xué)問題的解決。”徐宗本強調(diào)到,從業(yè)人員不應(yīng)僅把數(shù)學(xué)作為一個輔導(dǎo)答疑的“老師”,而應(yīng)把它作為人工智能技術(shù)的核心提供者或參與者來對待。