陶哲軒支持！AI數(shù)學(xué)奧林匹克競(jìng)賽進(jìn)步獎(jiǎng)公布，獎(jiǎng)金100多萬(wàn)美元

作者：機(jī)器之心 2024-07-04 15:28:11

大模型做數(shù)學(xué)題到底如何，不妨讓它參與一下這種級(jí)別的比賽。

「AI 數(shù)學(xué)奧林匹克競(jìng)賽（AIMO 進(jìn)步獎(jiǎng)）的初步成績(jī)已公布。根據(jù)排行榜的數(shù)據(jù)，目前看來(lái)，獲勝的程序在私人測(cè)試中正確回答了 29/50 道題，這一成績(jī)比預(yù)期的要高?！箘倓偅照苘幵趥€(gè)人博客中公布了這一消息。

AIMO 最初由一家搞機(jī)器學(xué)習(xí)量化交易的非銀行金融機(jī)構(gòu) XTX Markets 發(fā)起，主要是讓參與者使用 AI 模型解決國(guó)際數(shù)學(xué)難題，而本次進(jìn)步獎(jiǎng)的目標(biāo)是創(chuàng)建能夠解決用 LaTeX 格式編寫的復(fù)雜數(shù)學(xué)問(wèn)題的算法和模型。這將有助于推動(dòng)人工智能模型的數(shù)學(xué)推理能力，并推動(dòng)前沿知識(shí)的發(fā)展。

值得一提的是，此次進(jìn)步獎(jiǎng)是首次頒發(fā)，獲獎(jiǎng)隊(duì)伍將角逐 104.8 萬(wàn)美元的獎(jiǎng)金。

參賽題目包括中級(jí)高中數(shù)學(xué)競(jìng)賽的題目，但難度沒(méi)有達(dá)到國(guó)際數(shù)學(xué)奧林匹克（IMO）的水平。

獲獎(jiǎng)資格要求團(tuán)隊(duì)公開(kāi)發(fā)布其代碼、方法、數(shù)據(jù)和模型參數(shù)。

根據(jù)排名，我們可以看出，獲得第一名的是 Numina 的團(tuán)隊(duì)，CMU_MATH 位列第二，after exams 暫居第三，codeinter、Conor #2 團(tuán)隊(duì)分別拿到第四、第五的成績(jī)。

根據(jù)規(guī)則，參賽小組最多 5 人，排名前五的就有兩位是單人作戰(zhàn)。

大家使用的模型也是各不相同，包括 Mixtral?8x7b、Gemma、Llama 3 等。

一直以來(lái)，IMO 國(guó)際奧林匹克數(shù)學(xué)競(jìng)賽都是由專門研究數(shù)學(xué)的愛(ài)好者們直接參與，但隨著大模型能力的不斷提升，其在數(shù)學(xué)中的表現(xiàn)受到越來(lái)越多的關(guān)注。

大家測(cè)試的重點(diǎn)也逐漸從類似的高考題轉(zhuǎn)戰(zhàn)到奧林匹克競(jìng)技場(chǎng)上，此前，來(lái)自 Google DeepMind 的 AlphaGeometry 登上 Nature，該研究解決了 30 個(gè)奧林匹克級(jí)別問(wèn)題中的 25 個(gè)，接近國(guó)際數(shù)學(xué)奧林匹克競(jìng)賽金牌選手的平均表現(xiàn)。

在大模型爆發(fā)的當(dāng)下，已經(jīng)不止一家開(kāi)始挑戰(zhàn)奧賽難題，讓他們之間一較高下結(jié)果會(huì)怎樣呢？

去年 11 月，專門為 AI 設(shè)立的數(shù)學(xué)比賽來(lái)了，獎(jiǎng)金為 1000 萬(wàn)美元，旨在激勵(lì)開(kāi)放式的人工智能模型開(kāi)發(fā)，使其能夠在國(guó)際數(shù)學(xué)奧林匹克（IMO）中表現(xiàn)得與頂尖人類參賽者一樣出色。此次進(jìn)步獎(jiǎng)是作為 AIMO 大獎(jiǎng)的一部分進(jìn)行評(píng)選。

AIMO 顧問(wèn)委員都是數(shù)學(xué)界的大牛，包括菲爾茲獎(jiǎng)得主 Timothy Gowers 和陶哲軒（Terence Tao），與他們一同任職的還有 Po-Shen Loh、Dan Roberts 和 Geoff Smith。

責(zé)任編輯：張燕妮來(lái)源：機(jī)器之心

AI 數(shù)據(jù)

自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

陶哲軒支持！AI數(shù)學(xué)奧林匹克競(jìng)賽進(jìn)步獎(jiǎng)公布，獎(jiǎng)金100多萬(wàn)美元

陶哲軒支持！AI數(shù)學(xué)奧林匹克競(jìng)賽進(jìn)步獎(jiǎng)公布，獎(jiǎng)金100多萬(wàn)美元