想幫數(shù)學(xué)家,人工智能算老幾?
對于AI,有的人幻想,有的人偏見。
AI作為工具,計算方法,可以有效學(xué)習(xí)現(xiàn)實(shí)世界的內(nèi)在規(guī)律,并快速推理獲得結(jié)果,兼顧精度和性能,對當(dāng)今科學(xué)計算領(lǐng)域的研究范式已經(jīng)產(chǎn)生了影響,逐漸形成了AI for Science這個新興研究領(lǐng)域,并正在改變科學(xué)探索的范式。 那么,AI能否幫到數(shù)學(xué)家?
也許這樣提問會更好:“AI能否輔助數(shù)學(xué)探索?
物理是科學(xué)的基礎(chǔ),數(shù)學(xué)是物理的基礎(chǔ)。物理學(xué)里面各種各樣方程,其中相當(dāng)一部分是微分方程。
理論上,物質(zhì)在宏觀上的性質(zhì)是可以被算出來的。假如能夠求解所有微分方程,基本上就可以去模擬整個物理世界。
比如,解薛定諤方程。這個方程在100年前就有了,但求解這個方程很難。
傳統(tǒng)方法搞不定高維非線性的復(fù)雜函數(shù)。
搞不定,不行。算得很慢,也不行。
正好,深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)可以來幫忙。它的優(yōu)勢在哪里?
神經(jīng)網(wǎng)絡(luò)能力在于探索出一個非常有效地逼近高維函數(shù)的解。
或者說,神經(jīng)網(wǎng)絡(luò)可以擬合高維復(fù)雜的函數(shù),快速推斷,去計算這個函數(shù)的值。
神經(jīng)網(wǎng)絡(luò)不僅可以快速推斷(Fast Inference),而且推斷精度“還好”。注意,這里的“精度還好”,不是“精度準(zhǔn)確”。
或者說,神經(jīng)網(wǎng)絡(luò)恰好是精度“剛剛好(Above Right Accuracy)”,足夠解決要解決的問題。這是神經(jīng)網(wǎng)絡(luò)成功的一個核心。
很多時候,沒有必要算到非常高的精度。有時候識別一張圖片,是貓,還是狗。在圖片里面加上一大把噪聲,或者把一半的像素丟掉,還是能識別出是貓,或者是狗。 所以,精度是要基于任務(wù)的,而不是把“精度”單獨(dú)拎出來談。
總結(jié)一下AI這三個“戰(zhàn)斗力”,也是AI在科學(xué)應(yīng)用里面能如此有影響的關(guān)鍵三點(diǎn)。
第一,逼近高維函數(shù)。
第二,做快速推斷(Fast Inference)。
第三,精度剛剛好夠(Above Right Accuracy),或者說精度“夠了就行了”。
那么AI for Science發(fā)展中,AI最合適的定位是什么?
答案是輔助創(chuàng)新。
AI輔助數(shù)學(xué)探索是個好方向。
用AI這個工具,分析數(shù)據(jù),提煉潛在規(guī)律,但這里面有可能大量是“謬誤(spurious)”規(guī)律。
這時候,人類“介入”,人類從中篩選出真正有意義的規(guī)律,從而來推動科學(xué)的發(fā)展。
你看,人工智能用來預(yù)測蛋白質(zhì)三維結(jié)構(gòu)的Alphafold2模型經(jīng)常也會推斷出一些令人困惑的結(jié)構(gòu),又或者推斷出一些不準(zhǔn)確結(jié)果。
但是,它推斷得快,可以給科學(xué)家很多選項。最后,再由科學(xué)家拿主意。
再舉一個,神經(jīng)網(wǎng)絡(luò)尋找抗生素的例子。
世界衛(wèi)生組織(WHO)有個“通緝令”,通緝名單上都是最危險的病原體。
2019年,《細(xì)胞》雜志封面報道:
人類首次用AI發(fā)現(xiàn)“新抗生素”,從超過一億多種分子中識別出了強(qiáng)大的新型抗生素分子,并且在小老鼠身上做了驗(yàn)證,發(fā)現(xiàn)確實(shí)是有效。
既然如此,何不就利用AI可以快速從海量數(shù)據(jù)中去提煉出一些有可能潛在的規(guī)律的這個特長,再由人來進(jìn)行篩選。
谷歌子公司DeepMind幫助數(shù)學(xué)家猜測函數(shù)關(guān)系,輔助證明定理這個例子,是典型的AI for Science。
對此,北京大學(xué)北京國際數(shù)學(xué)研究中心董彬教授告訴“親愛的數(shù)據(jù)”:
數(shù)學(xué)家的緊密參與和與機(jī)器學(xué)習(xí)積極互動尤為重要,機(jī)器學(xué)習(xí)僅僅提供底層支撐,這種工作模式未來能夠產(chǎn)生的影響有可能是巨大的。
數(shù)學(xué)家還要注意哪三個點(diǎn)?
1. 可能只有一小部分問題可以用這種方式解決。
2. 數(shù)學(xué)家和機(jī)器學(xué)習(xí)(數(shù)據(jù)采集、建模、歸因)之間的密切互動至關(guān)重要。
3. 數(shù)學(xué)家和機(jī)器學(xué)習(xí)之間的分工可能嚴(yán)重依賴于手頭的數(shù)學(xué)問題和數(shù)學(xué)家本人。
為什么說是“機(jī)器學(xué)習(xí)輔助探索”,而不是“機(jī)器學(xué)習(xí)探索”?
因?yàn)闄C(jī)器學(xué)習(xí)只能提供輔助,包括輔助數(shù)學(xué)家去提出猜想。
回顧應(yīng)用數(shù)學(xué)的發(fā)展,從第二次世界大戰(zhàn),尤其是從曼哈頓計劃開始,那個時候的應(yīng)用數(shù)學(xué),或者說科學(xué)計算基于模型的(或者說解方程)。
從2010年往前數(shù)三十年,出現(xiàn)了基于數(shù)據(jù)的應(yīng)用數(shù)學(xué),有代表性的就是小波,壓縮感知,圖像處理。
國際數(shù)學(xué)聯(lián)合會(International Math Union,IMU)有一個高斯獎,國際數(shù)學(xué)界為應(yīng)用數(shù)學(xué)設(shè)立的一個極高榮譽(yù),從創(chuàng)立到目前一共頒獎四次,其中有三次都是基于數(shù)據(jù)的應(yīng)用數(shù)學(xué)。
這三位高斯獎獲得者分別是:2010年,數(shù)學(xué)家伊夫·邁耶(Yves Meyer),他是小波理論的先驅(qū)之一。2014年,數(shù)學(xué)家斯坦利·奧舍(Stanley Osher)。2018年,數(shù)學(xué)家大衛(wèi)·多諾霍(David Dohono),他是壓縮感知奠基人。
應(yīng)用數(shù)學(xué)發(fā)展的未來,是新范式的未來,即數(shù)據(jù)+模型的范式,不是純數(shù)據(jù)驅(qū)動,或者純模型驅(qū)動的范式。
AI for Science最核心的一點(diǎn)就是利用深度學(xué)習(xí)這個工具,通過分析數(shù)據(jù),使得AI輔助科學(xué)家進(jìn)行科學(xué)探索的新范式,為科學(xué)帶來了模型與數(shù)據(jù)雙驅(qū)動的新的研究范式。
即便是人工智能,不合理運(yùn)用機(jī)理,不把領(lǐng)域知識嵌入人工智能算法的設(shè)計,是很難有生命力的。