陶哲軒支持!AI數(shù)學(xué)奧林匹克競(jìng)賽進(jìn)步獎(jiǎng)公布,獎(jiǎng)金100多萬(wàn)美元
「AI 數(shù)學(xué)奧林匹克競(jìng)賽(AIMO 進(jìn)步獎(jiǎng))的初步成績(jī)已公布。根據(jù)排行榜的數(shù)據(jù),目前看來(lái),獲勝的程序在私人測(cè)試中正確回答了 29/50 道題,這一成績(jī)比預(yù)期的要高?!箘倓偅照苘幵趥€(gè)人博客中公布了這一消息。
AIMO 最初由一家搞機(jī)器學(xué)習(xí)量化交易的非銀行金融機(jī)構(gòu) XTX Markets 發(fā)起,主要是讓參與者使用 AI 模型解決國(guó)際數(shù)學(xué)難題,而本次進(jìn)步獎(jiǎng)的目標(biāo)是創(chuàng)建能夠解決用 LaTeX 格式編寫的復(fù)雜數(shù)學(xué)問(wèn)題的算法和模型。這將有助于推動(dòng)人工智能模型的數(shù)學(xué)推理能力,并推動(dòng)前沿知識(shí)的發(fā)展。
值得一提的是,此次進(jìn)步獎(jiǎng)是首次頒發(fā),獲獎(jiǎng)隊(duì)伍將角逐 104.8 萬(wàn)美元的獎(jiǎng)金。
參賽題目包括中級(jí)高中數(shù)學(xué)競(jìng)賽的題目,但難度沒(méi)有達(dá)到國(guó)際數(shù)學(xué)奧林匹克(IMO)的水平。
獲獎(jiǎng)資格要求團(tuán)隊(duì)公開(kāi)發(fā)布其代碼、方法、數(shù)據(jù)和模型參數(shù)。
根據(jù)排名,我們可以看出,獲得第一名的是 Numina 的團(tuán)隊(duì),CMU_MATH 位列第二,after exams 暫居第三,codeinter、Conor #2 團(tuán)隊(duì)分別拿到第四、第五的成績(jī)。
根據(jù)規(guī)則,參賽小組最多 5 人,排名前五的就有兩位是單人作戰(zhàn)。
大家使用的模型也是各不相同,包括 Mixtral?8x7b、Gemma、Llama 3 等。
一直以來(lái),IMO 國(guó)際奧林匹克數(shù)學(xué)競(jìng)賽都是由專門研究數(shù)學(xué)的愛(ài)好者們直接參與,但隨著大模型能力的不斷提升,其在數(shù)學(xué)中的表現(xiàn)受到越來(lái)越多的關(guān)注。
大家測(cè)試的重點(diǎn)也逐漸從類似的高考題轉(zhuǎn)戰(zhàn)到奧林匹克競(jìng)技場(chǎng)上,此前,來(lái)自 Google DeepMind 的 AlphaGeometry 登上 Nature,該研究解決了 30 個(gè)奧林匹克級(jí)別問(wèn)題中的 25 個(gè),接近國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽金牌選手的平均表現(xiàn)。
在大模型爆發(fā)的當(dāng)下,已經(jīng)不止一家開(kāi)始挑戰(zhàn)奧賽難題,讓他們之間一較高下結(jié)果會(huì)怎樣呢?
去年 11 月,專門為 AI 設(shè)立的數(shù)學(xué)比賽來(lái)了,獎(jiǎng)金為 1000 萬(wàn)美元,旨在激勵(lì)開(kāi)放式的人工智能模型開(kāi)發(fā),使其能夠在國(guó)際數(shù)學(xué)奧林匹克(IMO)中表現(xiàn)得與頂尖人類參賽者一樣出色。此次進(jìn)步獎(jiǎng)是作為 AIMO 大獎(jiǎng)的一部分進(jìn)行評(píng)選。
AIMO 顧問(wèn)委員都是數(shù)學(xué)界的大牛,包括菲爾茲獎(jiǎng)得主 Timothy Gowers 和陶哲軒(Terence Tao),與他們一同任職的還有 Po-Shen Loh、Dan Roberts 和 Geoff Smith。