角速度、線速度之外,描述宇宙還有另一種方式?AI發(fā)現(xiàn)新變量登Nature子刊
讓 AI 發(fā)現(xiàn)物理規(guī)律已經(jīng)不是什么新鮮事,前段我們報(bào)道過(guò)「給 GNN 一堆數(shù)據(jù),它自己就能發(fā)現(xiàn)萬(wàn)有引力定律」的消息,但如果我們連變量都不給它呢?哥倫比亞大學(xué)的一項(xiàng)研究表明,AI 僅通過(guò)攝像機(jī)觀察現(xiàn)象就能自己提取出變量,而且有些變量可能是人類還沒有發(fā)現(xiàn)的。如果借助這種方式來(lái)發(fā)現(xiàn)新的變量,我們是不是可以發(fā)現(xiàn)新的物理規(guī)律?
E = mc2 是闡述能量與質(zhì)量間相互關(guān)系的質(zhì)能方程,其中 E 表示能量,m 代表質(zhì)量,而 c 則表示光速(常數(shù),c=299792458m/s,有時(shí)取 3.00×108 m/s)。質(zhì)能方程由愛因斯坦提出,主要用來(lái)解釋核變反應(yīng)中的質(zhì)量虧損和計(jì)算高能物理中粒子的能量,并促成了波動(dòng)力學(xué)的誕生。
一百多年前,愛因斯坦在提出這個(gè)方程之前顯然已經(jīng)有了能量、質(zhì)量和速度這些基本變量。如果沒有這些變量,即使是愛因斯坦,也無(wú)法發(fā)現(xiàn)相對(duì)論。但令人驚訝的是,人工智能現(xiàn)在可以自動(dòng)發(fā)現(xiàn)這些變量,而且有些變量還超出了人類已知的范圍,這將大大加快科學(xué)發(fā)現(xiàn)的速度。
這是來(lái)自哥倫比亞大學(xué)的一項(xiàng)新研究,研究者試圖讓一種人工智能程序通過(guò)攝像機(jī)觀察物理現(xiàn)象,然后嘗試搜索能夠完全描述觀察現(xiàn)象的最小基本變量集。研究論文于 7 月 25 日發(fā)表在《Nature Computational Science》雜志上。
論文地址:https://www.nature.com/articles/s43588-022-00281-6
如下圖所示,該研究讓 AI 觀察運(yùn)動(dòng)的混沌搖桿驅(qū)動(dòng)系統(tǒng)的視頻,從這些高維視頻片段中識(shí)別和提取描述此類系統(tǒng)所需的最少狀態(tài)變量。
科學(xué)家們首先向系統(tǒng)提供他們已經(jīng)知道解決方案的物理現(xiàn)象的原始視頻片段。例如,他們提供了一個(gè)擺動(dòng)雙擺的視頻,已知該雙擺具有 4 個(gè)「狀態(tài)變量」——兩個(gè)臂中每一個(gè)的角度和角速度。經(jīng)過(guò)幾個(gè)小時(shí)的分析,人工智能輸出了答案:4.7。
「我們認(rèn)為這個(gè)答案已經(jīng)足夠接近了,」論文作者之一、機(jī)械工程系創(chuàng)意機(jī)器實(shí)驗(yàn)室(Creative Machines Lab)主任 Hod Lipson 說(shuō)?!柑貏e是考慮到所有 AI 可以訪問(wèn)的都是原始視頻片段,沒有任何物理或幾何知識(shí)。但我們想知道它用的變量具體有哪些,而不僅僅是一個(gè)數(shù)字?!?/span>
然后,研究人員繼續(xù)可視化 AI 程序識(shí)別出的實(shí)際變量。提取變量本身很困難,因?yàn)槌绦驘o(wú)法以任何人類可以理解的直觀方式描述它們。經(jīng)過(guò)一番調(diào)查研究,程序選擇的兩個(gè)變量似乎與兩個(gè)擺臂的角度大致對(duì)應(yīng),但另外兩個(gè)仍然是個(gè)謎。
「我們嘗試將另外兩個(gè)變量與我們能想到的所有已知變量聯(lián)系起來(lái):角速度和線速度、動(dòng)能和勢(shì)能,以及已知量的各種組合,」論文一作、剛從哥倫比亞大學(xué)拿到博士學(xué)位的現(xiàn)杜克大學(xué)助理教授陳博源(Boyuan Chen)解釋說(shuō)?!傅坪鯖]有一個(gè)已知變量能夠完美匹配 AI 程序所識(shí)別出的那兩個(gè)變量。」該團(tuán)隊(duì)相信 AI 已經(jīng)找到了一組有效的由四個(gè)變量組成的變量集,因?yàn)樗龀隽撕芎玫念A(yù)測(cè),「但我們還無(wú)法理解它所用到的數(shù)學(xué)語(yǔ)言,」他解釋說(shuō)。
在用已知解決方案驗(yàn)證了許多其他物理系統(tǒng)后,科學(xué)家們輸入了他們不知道明確答案的系統(tǒng)的視頻。其中一個(gè)視頻展示了一個(gè)隨風(fēng)搖擺的氣球。經(jīng)過(guò)幾個(gè)小時(shí)的分析,程序返回了 8 個(gè)變量。同樣,有關(guān)熔巖燈的視頻也產(chǎn)生了 8 個(gè)變量。當(dāng)視頻換成關(guān)于壁爐的視頻時(shí),程序返回了 24 個(gè)變量。
一個(gè)特別有趣的問(wèn)題是:AI 程序?yàn)槊總€(gè)系統(tǒng)所找到的變量集是唯一的嗎?或者說(shuō),在每次重啟程序之后,它所找到的下一個(gè)變量集還和原來(lái)一樣嗎?
「我一直在想,如果我們能遇見一個(gè)特別聰明的外星物種,他們會(huì)不會(huì)也已經(jīng)發(fā)現(xiàn)了我們所發(fā)現(xiàn)的一些物理規(guī)律?或者,他們是否會(huì)以一種不同的方式描述宇宙?」Lipson 說(shuō),「或許有些現(xiàn)象之所以看起來(lái)非常復(fù)雜,是因?yàn)槲覀円恢痹噲D用錯(cuò)誤的變量集來(lái)描述它們。」
在實(shí)驗(yàn)中,AI 每次重啟時(shí)所提取的變量數(shù)量是相同的,但每次的具體變量是不同的。所以說(shuō),在常規(guī)方式之外,我們確實(shí)還有其他方式可以描述宇宙,而我們現(xiàn)在選擇的這種方式未必就是完美的。
研究人員表示,這種 AI 可以幫助科學(xué)家發(fā)現(xiàn)生物學(xué)、宇宙學(xué)等學(xué)科中復(fù)雜的現(xiàn)象,在這種現(xiàn)象的研究中,理論理解跟不上海量數(shù)據(jù)的步伐?!鸽m然我們?cè)谶@項(xiàng)工作中使用了視頻數(shù)據(jù),但其實(shí),任何類型的陣列數(shù)據(jù)源都可以使用——例如雷達(dá)陣列或 DNA 陣列,」論文合著者 Kuang Huang 解釋說(shuō)。
這項(xiàng)工作是 Lipson 和哥倫比亞大學(xué)傅氏基金會(huì)應(yīng)用數(shù)學(xué)講席教授杜強(qiáng)(Qiang Du)幾十年來(lái)研究興趣的一部分,他們致力于創(chuàng)造可以將數(shù)據(jù)提煉成科學(xué)規(guī)律的算法。過(guò)去的軟件系統(tǒng),如 Lipson 和 Michael Schmidt 的 Eureqa 軟件,可以從實(shí)驗(yàn)數(shù)據(jù)中提取任意的物理定律,但前提是預(yù)先確定變量。但如果我們連變量都還不知道呢?
Lipson 認(rèn)為,科學(xué)家們有時(shí)候誤解或無(wú)法理解某種現(xiàn)象可能僅僅是因?yàn)樗麄儧]有一組很好的變量來(lái)描述這種現(xiàn)象?!笌浊陙?lái),人們一直都有物體運(yùn)動(dòng)快慢的概念,但直到速度和加速度的概念被正式量化后,牛頓才發(fā)現(xiàn)了著名的牛頓第二定律:F=MA,」Lipson 說(shuō)。這些變量是理論得以形成的前置條件?;谶@一點(diǎn),杜強(qiáng)想知道,「還有哪些定律是因?yàn)槿狈ψ兞慷鴽]被我們發(fā)現(xiàn)呢?」
作者介紹
論文一作陳博源現(xiàn)任杜克大學(xué)助理教授,負(fù)責(zé)領(lǐng)導(dǎo)通用機(jī)器人實(shí)驗(yàn)室(General Robotics Lab)。他博士畢業(yè)于哥倫比亞大學(xué)計(jì)算機(jī)科學(xué)專業(yè),主修計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)和機(jī)器人專業(yè),師從世界機(jī)器人、數(shù)據(jù)科學(xué)、3D 打印先驅(qū) Hod Lipson 教授。他曾在國(guó)際人工智能和機(jī)器人領(lǐng)域頂級(jí)會(huì)議(NeurIPS、IROS、GECCO、Humanoids 等)發(fā)表多篇論文,擔(dān)任多個(gè)國(guó)際會(huì)議審稿人(CVPR、ICML、ICLR、PRCV 等)。此外,他還曾獲 ACM GECCO 學(xué)生獎(jiǎng)學(xué)金、中國(guó)政府獎(jiǎng)學(xué)金、中國(guó)科學(xué)院空間科技創(chuàng)新獎(jiǎng)學(xué)金等。