自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<em id="rezsk"><dfn id="rezsk"></dfn></em>

^{<thead id="rezsk"></thead>}

<sub id="rezsk"><p id="rezsk"></p></sub><sub id="rezsk"></sub>

<sub id="rezsk"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

秘密打造「AI陶哲軒」震驚數(shù)學(xué)圈！谷歌IMO夢之隊(duì)首曝光，菲爾茲獎(jiǎng)得主深度點(diǎn)評

作者：新智元 2024-07-29 13:28:52

人工智能新聞

19秒破解幾何難題，谷歌AI奪得IMO銀牌在業(yè)界掀起了巨震。就連菲爾茲獎(jiǎng)得主陶哲軒，前IMO美國隊(duì)負(fù)責(zé)人羅博深都對此大加贊賞。更有AI大佬高調(diào)預(yù)測，若谷歌繼續(xù)加碼研究，應(yīng)該可以造出一個(gè)「AI陶哲軒」。

谷歌DeepMind正在做的，是要打造出世界上最強(qiáng)的AI數(shù)學(xué)家。

Perplexity AI的CEO對此做出了大膽預(yù)測——DeepMind繼續(xù)研究下去的話，應(yīng)該可以搞出一個(gè)「AI陶哲軒」了！

這個(gè)預(yù)測可謂相當(dāng)大膽。

要知道，陶哲軒在IMO競賽圈，乃至整個(gè)數(shù)學(xué)界，都是傳奇般的存在。

「天才出少年」、「數(shù)學(xué)界莫扎特」，各種溢美之詞放到他身上都不為過，畢竟人家首次參加IMO競賽時(shí)只有10歲，是迄今為止最年輕的參賽者。

10歲銅牌、11歲銀牌、12歲金牌，一路高歌猛進(jìn)，他又成為了IMO史上最年輕的金牌得主。

AI大佬能夠做出此類預(yù)測，正是基于谷歌DeepMind兩大AI——AlphaProof+AlphaGeometry 2，上周在IMO 2024競賽中取得了卓越的成績。

6道題目中，它們一同做對4道，距金牌僅有一分之差（獲得28分）。

AlphaGeometry 2效果愈加炸裂，竟可以在短短19秒里，破解了一道幾何題目。

然而，這個(gè)消息至今余波未平。許多AI界和數(shù)學(xué)界的大佬們，紛紛給出了自己的思考和感悟。

數(shù)學(xué)大佬怎么看？

這邊隔空被cue的陶哲軒發(fā)表了自己的看法。

但人家并不在意所謂的「AI陶哲軒」，而是延續(xù)了自己以往的關(guān)注點(diǎn)——分析AI和數(shù)學(xué)將怎樣共同發(fā)展。

過去幾周我一直在旅行，還沒有時(shí)間完全消化這個(gè)消息……但可以在此記錄一些初步印象

陶哲軒首先承認(rèn)，DeepMind做出了一項(xiàng)偉大的工作，拓寬了AI輔助/全自動(dòng)化方法在基準(zhǔn)挑戰(zhàn)上的能力邊界，再次顛覆了我們的預(yù)期。

具體而言，IMO級(jí)別的幾何問題，對專門的AI工具來說已經(jīng)是實(shí)際可解的問題。

現(xiàn)在看來，能夠形式化的，且可以用強(qiáng)化學(xué)習(xí)過程找到形式化證明的IMO問題，至少在某種程度上都可以被AI攻克（盡管目前每個(gè)問題都需要相當(dāng)程度的算力，以及形式化過程中的人類協(xié)助）。

這種方法帶來的好處，就是讓形式數(shù)學(xué)更容易自動(dòng)化，從而有助于包含形式化成分（formal components）的數(shù)學(xué)研究。

特別是，如果用這種方式創(chuàng)建一個(gè)含有形式化證明過程的數(shù)據(jù)庫，并將其公開共享，將成為非常有用的資源。

DeepMind這次的研發(fā)路徑很聰明，而且事后看來也很合理。他們更多基于強(qiáng)化學(xué)習(xí)而非大語言模型，有些秉承了AlphaGo的精神，并且非常強(qiáng)調(diào)形式化方法。

根據(jù)「AI效應(yīng)」，一旦解釋清楚其中的原理，AI就不再像是「類人智慧」的展現(xiàn)，但這依舊擴(kuò)展了AI輔助工具的能力。

「AI效應(yīng)」描述一種現(xiàn)象：一旦AI項(xiàng)目取得了某些成功或進(jìn)展，相關(guān)任務(wù)就不再被視為AI領(lǐng)域的一部分。類似的還有Tesler定理：「AI是指尚未完成的事情」

值得注意的是，AlphaProof/AlphaGeometry 2與最近獲得AIMO冠軍的NuminaMath模型，二者不能直接比較。

NuminaMath是完全自動(dòng)化的，資源效率相比DeepMind模型高了搞幾個(gè)數(shù)量級(jí)，而且采用了完全不同的思路，即通過LLM生成Python代碼，對數(shù)字答案進(jìn)行暴力破解。

由于AIMO所有問題答案都是范圍為0～999的整數(shù)，因此暴力破解是可行的，但對開放式的IMO賽題就完全不適用了。

NuminaMath也是一項(xiàng)非常好的工作，在數(shù)學(xué)解題的不同部分中嘗試用AI協(xié)助或自動(dòng)化，向我們展示了這個(gè)挑戰(zhàn)本身的多維性質(zhì)。

目前，NuminaMath這個(gè)冠軍模型已經(jīng)在HuggingFace上開源了7B版本。

倉庫地址：https://huggingface.co/AI-MO/NuminaMath-7B-TIR

與IMO打過多年交道的CMU數(shù)學(xué)教授羅博深（Po-Shen Loh）也發(fā)推表達(dá)了自己的震撼。用他的話說，這種感受和當(dāng)年人們看到蘇聯(lián)第一顆人造衛(wèi)星Sputnik的感覺是類似的。

他甚至表示，「人類文明需要進(jìn)入高度戒備狀態(tài)」。羅博深本人雖然一直期待這種水平的AI能夠到來，但他曾經(jīng)認(rèn)為，至少還需要幾年時(shí)間才能達(dá)到。

羅博深教授的「震撼」，不僅來自于他數(shù)學(xué)家的身份，更來自于他對IMO競賽的多年了解。

1999年，時(shí)年17歲的他首次參與IMO競賽獲得銀牌，2002年就進(jìn)入美國IMO國家隊(duì)訓(xùn)練營擔(dān)任助理教練，開啟了自己長達(dá)21年的IMO執(zhí)教生涯。

2014年，羅博深被正式任命為總教練，隨后帶領(lǐng)美國隊(duì)分別在2015年、2016年、2018年和2019年贏得比賽，讓1994年后將近20年沒有冠軍的美國IMO國家隊(duì)「重回巔峰」。

由于多年執(zhí)教，羅博深對競賽的出題流程非常熟悉——IMO會(huì)專門選擇非標(biāo)準(zhǔn)化問題。

出題小組的重要任務(wù)之一就是避免任何類似題目。教練們甚至?xí)鲆恍┕爬嫌植粸槿酥臄?shù)學(xué)競賽，然后否決掉已經(jīng)提出的類似題目。

這種題目的創(chuàng)新性讓很多人類學(xué)生都很難上手，因?yàn)閷W(xué)生們也習(xí)慣于從例題中學(xué)習(xí)，記住解題步驟，用來解決相似題目。

以本屆IMO的6道題目為例，它們遠(yuǎn)遠(yuǎn)超出了任何課程標(biāo)準(zhǔn)。

解決這些題目最困難的部分不在于計(jì)算，而是需要找到一條解題路徑。很多人即使有一整年的時(shí)間思考也只能拿到零分。

因此，DeepMind模型在IMO上的勝利和GPT-4在標(biāo)準(zhǔn)化測試上通過「模式匹配」拿到的高分有完全不同的意義。

盡管AI花費(fèi)的時(shí)間遠(yuǎn)遠(yuǎn)超出比賽規(guī)定，但實(shí)現(xiàn)軟硬件的加速只是時(shí)間問題，模型能夠解決這些問題本身就是一個(gè)重大進(jìn)步。

羅博深教授長期致力于數(shù)學(xué)教育，因此他也會(huì)進(jìn)一步思考——AI具有如此強(qiáng)大的數(shù)學(xué)能力，這對我們意味著什么？我們能做些什么？

他認(rèn)為，AI越強(qiáng)大，大幅提升人類智慧就越為重要。

首先就是對就業(yè)動(dòng)態(tài)產(chǎn)生的影響。

AI出現(xiàn)以前，個(gè)別有非凡能力的人不會(huì)真正損害你的就業(yè)，因?yàn)檫@樣的人終究只是少數(shù)。即使這些天之驕子會(huì)占據(jù)一些職位，余下的工作依舊很多。

然而，一旦AI的能力超越人類，它就可以通過大規(guī)模復(fù)制，從而奪走所有工作。這與之前的邏輯完全不同。

AlphaProof/AlphaGeometry 2在IMO中的表現(xiàn)已經(jīng)告訴我們，AI具備了發(fā)現(xiàn)新事物的能力（這是最有價(jià)值的技能之一），因此整個(gè)教育方法都需要快速變革。

無法否認(rèn)的是，當(dāng)前的教育結(jié)構(gòu)很大程度上受到考試的影響，為了測試學(xué)生在預(yù)定義標(biāo)準(zhǔn)上的熟練程度。

然而，現(xiàn)在的每個(gè)人都必須學(xué)會(huì)如何解決從未見過的新問題，否則就無法跟上AI的步伐。

此外，技術(shù)越強(qiáng)大，我們就越需要努力保持人類文明中的人性。

這意味著，我們需要建立一個(gè)讓人們共同合作、互相支持的社區(qū)，而不是在「叢林競爭」中互相爭斗。分裂則亡。

對我來說，這與構(gòu)建人類的分析性才能密切相關(guān)，因?yàn)榕囵B(yǎng)一個(gè)試圖擊敗他人而非幫助他人的天才，很可能是有害的。

以上這些觀點(diǎn)并非羅博深教授的「紙上談兵」，也不僅僅停留在提出問題或理念的層面。基于數(shù)學(xué)教育領(lǐng)域十多年的工作經(jīng)驗(yàn)，他對此有深入的思考，并試圖提出了啟發(fā)性的解決方案。

在谷歌DeepMind倫敦總部的實(shí)驗(yàn)室，研究團(tuán)隊(duì)在慶祝每次AI里程碑時(shí)，內(nèi)部承襲著一個(gè)傳統(tǒng)——敲響大鑼。

2016年，AlphaGo在圍棋比賽中表現(xiàn)優(yōu)異，鑼聲響起；2017年，當(dāng)AlphaZero征服國際象棋時(shí)，鑼聲再次回蕩。

每次一敲鑼，都代表著算法擊敗了人類冠軍。

就在AlphaProof+AlphaGeometry 2奪得了奧賽IMO 2024銀牌的那天，倫敦總部再次敲響了銅鑼。

紐約時(shí)報(bào)的這篇報(bào)道深入團(tuán)隊(duì)內(nèi)部，讓我們對這位AI數(shù)學(xué)家有了更深一層的了解。

文章表示，AI越來越擅長數(shù)學(xué)，并且很快就會(huì)成為人類最值得合作的伙伴。

DeepMind數(shù)學(xué)計(jì)劃負(fù)責(zé)人之一Alex Davies表示，這是AI在數(shù)學(xué)推理方面，取得的重大突破。

7月11日-22日，IMO 2024在倫敦以西約100英里的巴斯大學(xué)舉行，被公認(rèn)為是世界上「最聰明的數(shù)學(xué)天才」參加的頂級(jí)數(shù)學(xué)競賽。

人類選手（來自108個(gè)國家的609名高中生）贏得了58枚金牌、123枚銀牌和145枚銅牌。

谷歌AI在答題的過程中，解決了6個(gè)問題中的四個(gè)，總得分28分，與金牌僅差一分。

對此，谷歌DeepMind研究副總裁Pushmeet Kohli在接受采訪時(shí)表示，「這并不完美，我們沒有解決所有問題。我們的目標(biāo)是做到完美」。

盡管如此，Kohli博士將這一結(jié)果描述為一種「相變」（phase transition），一種革命性的變化，即在數(shù)學(xué)中使用AI，以及AI系統(tǒng)進(jìn)行數(shù)學(xué)運(yùn)算的能力。

DeepMind實(shí)驗(yàn)室邀請了2位獨(dú)立專家，來評判AI的表現(xiàn)——?jiǎng)虼髮W(xué)數(shù)學(xué)家、菲爾茲獎(jiǎng)得主Timothy Gowers，以及軟件開發(fā)人員Joseph Myers。

他們都曾是IMO競賽獲獎(jiǎng)?wù)?，紛紛表示對這次AI的表現(xiàn)印象深刻。

過去25年來，Gowers一直對AI與數(shù)學(xué)結(jié)合感興趣，他認(rèn)為，「AI已經(jīng)找到了解決問題的神奇鑰匙」。

銅鑼敲響

每年IMO，人類選手們都要經(jīng)過幾個(gè)月的嚴(yán)格訓(xùn)練，去參加兩場奧數(shù)考試（共9小時(shí)）。

每天僅需做答三題，涉及了代數(shù)、組合學(xué)、幾何和數(shù)論。

與此同時(shí)，AI數(shù)學(xué)家也在倫敦實(shí)驗(yàn)室里，埋頭苦干。

研究科學(xué)家David Silver說，「每次系統(tǒng)解決一個(gè)問題，我們就敲鑼慶?！?。

IMO結(jié)果公布那天，中國隊(duì)中的Haojia Shi是唯一一位獲得滿分（42分）的參賽者，6道題目分別拿了7分滿分成績。

總榜成績中，美國隊(duì)以192分獲得第一名，中國以190分獲得第二名。

這邊，谷歌AI成功破解了4道題——2道代數(shù)題、1道幾何題和1道數(shù)論題，得分28分。它在另外兩個(gè)組合學(xué)問題上，失敗了。

與人類選手不同的是，AI答題完全不限時(shí)間。

對于某些問題，AI需要長達(dá)三天的時(shí)間，而學(xué)生在每場考試中僅有4.5小時(shí)。

Silver博士解釋道，「對于谷歌DeepMind團(tuán)隊(duì)來說，速度是整體成功的次要因素。因?yàn)檫@實(shí)際上只是取決于算力的投入」。

他繼續(xù)稱，「我們能夠達(dá)到這個(gè)閾值，能夠解決這些問題，這代表了數(shù)學(xué)史上的一個(gè)重大變化。但也希望能成為一個(gè)轉(zhuǎn)折點(diǎn)，讓計(jì)算機(jī)從只能證明簡單問題，到證明人類無法證明的問題」。

兩大團(tuán)隊(duì)，兩個(gè)AI數(shù)學(xué)家

幾年來，將AI應(yīng)用于數(shù)學(xué)一直是DeepMind使命的一部分，而且通常是與世界級(jí)的研究數(shù)學(xué)家合作。

Davies博士表示，數(shù)學(xué)需要抽象、精確和創(chuàng)造性推理的有趣結(jié)合。

他指出，部分原因是這種能力組合，使數(shù)學(xué)成為達(dá)到所謂的AGI這一最終目標(biāo)的良好試金石，而且這也是OpenAI、Meta AI、Xai等公司一直在追逐的目標(biāo)。

因此，奧林匹克數(shù)學(xué)題已成為公認(rèn)的一個(gè)基準(zhǔn)。

今年年初，谷歌DeepMind首次發(fā)布AlphaGeometry，解決了奧林匹克抽樣的幾何問題，水平相當(dāng)于人類金牌獲獎(jiǎng)?wù)摺?/span>

論文地址：https://www.nature.com/articles/s41586-023-06747-5

首席研究員Thang Luong在電子郵件中表示，AlphaGeometry2在解決IMO問題上已經(jīng)超過了金牌得主。

借著這股勢頭，谷歌DeepMind為這項(xiàng)挑戰(zhàn)組建了兩個(gè)團(tuán)隊(duì)：

一個(gè)由倫敦的研究工程師Thomas Hubert領(lǐng)導(dǎo)，另一個(gè)團(tuán)隊(duì)由位于美國Mountain View實(shí)驗(yàn)室的Luong博士和Quoc Le領(lǐng)導(dǎo)，每個(gè)團(tuán)隊(duì)約有20名研究人員。

Luong博士領(lǐng)導(dǎo)的團(tuán)隊(duì)名為「超人類推理團(tuán)隊(duì)」，目前為止招募了十幾名IMO獎(jiǎng)牌獲得者。

谷歌DeepMind超人類推理團(tuán)隊(duì)（superhuman reasoning team）

他自豪地表示，這是目前為止，谷歌內(nèi)部「IMO密度最高」的團(tuán)隊(duì)。

大約20年前，我全身心投入奧數(shù)競賽，在全國獲得銀牌（當(dāng)時(shí)排名第8），但我沒能進(jìn)入2005年的 IMO比賽.....，時(shí)光荏苒，我非常高興谷歌最新的AI系統(tǒng)（AlphaGeometry2+AlphaProof）幫我實(shí)現(xiàn)了「贏得」IMO獎(jiǎng)牌的夢想！

時(shí)隔半年，谷歌推出迭代后的AlphaGeometry 2，僅用了19秒，解決了IMO 2024的幾何問題。

另一波在倫敦總部的團(tuán)隊(duì)，由Hubert領(lǐng)隊(duì)，開發(fā)了全新模型AlphaProof。它具有可比性，更加通用，目標(biāo)是為了解決更廣泛的數(shù)學(xué)問題。

背后算法揭秘

簡言之，AlphaGeometry和AlphaProof利用了多種不同的AI技術(shù)。

非形式推理系統(tǒng)

AlphaProof是用自然語言表達(dá)的非形式推理系統(tǒng)（informal reasoning system）。

它基于谷歌Gemini打造，使用已公開的問題、證明等英文語料庫作為訓(xùn)練數(shù)據(jù)。

非形式系統(tǒng)擅長識(shí)別模式，以及提出下一步建議。而且它富有創(chuàng)造性，以一種自然語言可以理解的方式談?wù)撓敕ā?/span>

當(dāng)然，LLM傾向于編造內(nèi)容，這對詩歌可能行得通（也可能不是），但對數(shù)學(xué)肯定不行。

在數(shù)學(xué)這種情況下，大模型似乎表現(xiàn)出了克制。但這并不是說，它完全免疫于「幻覺」，但頻率有所降低。

形式推理系統(tǒng)

AlphaGeometry是基于邏輯并用代碼表達(dá)的形式推理系統(tǒng)。

它使用了名為Lean的定理證明器和證明助手軟件。該軟件可以確保，如果AI認(rèn)為證明是正確的，那么它確實(shí)是正確的。

Hubert表示，「我們可以準(zhǔn)確地檢查證明是否正確，因?yàn)槊恳徊蕉急ＷC在邏輯上是合理的」。

而另一個(gè)關(guān)鍵組件是，AlphaGo和AlphaZero譜系中的強(qiáng)化學(xué)習(xí)算法。

谷歌DeepMind負(fù)責(zé)強(qiáng)化學(xué)習(xí)的副總裁Silver博士說，「AI可以自主學(xué)習(xí)，無限擴(kuò)展」。

「由于RL算法不需要要老師，所以它可以不斷地學(xué)習(xí)，一直學(xué)習(xí)，直到最終它能夠解決人類可以解決的最困難的問題」。

這也是AlphaZero所經(jīng)歷的現(xiàn)實(shí)，從0開始學(xué)習(xí)，僅通過玩游戲，在不到一天時(shí)間內(nèi)，就能重新發(fā)現(xiàn)國際象棋中的所有知識(shí)。
在大約一周的時(shí)間，它便發(fā)現(xiàn)了圍棋的所有知識(shí)。所以我們想，把這個(gè)AI能力應(yīng)用到數(shù)學(xué)中。

數(shù)學(xué)家，會(huì)被AI取代嗎？

菲爾茲獎(jiǎng)得主Gowers并不擔(dān)心AI數(shù)學(xué)家，帶來的長期后果。

我們可以假想這樣一種情況，數(shù)學(xué)家基本上沒有什么可做的了。如果計(jì)算機(jī)在數(shù)學(xué)家目前做的所有事情上都變得更好、更快，那就會(huì)是這種情況。

不過，在AI能夠進(jìn)行研究級(jí)數(shù)學(xué)之前，似乎還有很長的路要。

他補(bǔ)充道，「如果谷歌DeepMind能至少解決一些棘手的IMO問題，那么一個(gè)有用的研究工具就不會(huì)太遙遠(yuǎn)」。

而一個(gè)真正熟練的AI工具，可能會(huì)讓數(shù)學(xué)更容易上手，加速研究過程，還能讓數(shù)學(xué)家跳出固有思維。

最終，它甚至可能提出引起共鳴的新奇想法。

責(zé)任編輯：張燕妮來源：新智元

模型數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="jsac2"><rt id="jsac2"></rt></sub>

<cite id="jsac2"><track id="jsac2"></track></cite>