「數(shù)學(xué)天才」陶哲軒:GPT-4無法攻克一個未解決的數(shù)學(xué)問題,但對工作有幫助
當(dāng)紅炸子雞ChatGPT,也成為數(shù)學(xué)天才陶哲軒的研究工具了。
近日,他在網(wǎng)上稱自己發(fā)現(xiàn)了一些ChatGPT的小用例。
首先,它很擅長解析代碼格式的文檔(在這種情況下是#arXiv搜索的API),然后返回一個正確格式的代碼查詢(后來它還提供了一些工作的python代碼,以我要求的方式調(diào)用這個API,盡管我不得不手動安裝一個包來使它運(yùn)行)。其次,我讓它想出一些,聰明的學(xué)生在本科線性代數(shù)課上可能會問的問題(為此我提供了一些樣本題目),它給出了一些很好的例子,讓我對課程可能方向,以及潛在的作業(yè)問題有所啟發(fā)。
總之,我發(fā)現(xiàn)ChatGPT等AI工具雖然不能幫我攻克一個未解決的數(shù)學(xué)問題,但對其他工作相關(guān)的問題很有用,盡管事后經(jīng)常需要進(jìn)行一些手動調(diào)整。
GPT-4和GPT-3.5差別不大
GPT-4是怎樣擅長解析代碼格式的文檔?
陶哲軒讓GPT-4對所有的arXiv文章進(jìn)行搜索查詢,這些文章的元數(shù)據(jù)是一個給定的關(guān)鍵詞(比如,「Collatz」),并且是在一定的日期范圍內(nèi)提交的(比如,在2011-2016之間)。根據(jù)下面的文檔,這樣的查詢的格式是什么?
對此,GPT-4不僅給出了代碼,還列出了查詢的分類。
網(wǎng)友問,作為一個閱讀工具,給定一篇論文,讓它提出審稿人或演講者可能會問哪些問題?在這一方面GPT-4做得如何?
對此,陶哲軒拿去測評了一番,大贊「確實(shí)不錯」。
「這里是最近一篇論文的前幾頁。你能提出一些聽眾在聽關(guān)于這篇論文的講座時可能提出的問題嗎?」
ChatGPT回答「當(dāng)然,這里有一些數(shù)學(xué)家在聽了關(guān)于這篇論文的講座后可能會問的問題」。然后,巴拉巴拉列出了7個問題。
細(xì)心網(wǎng)友發(fā)現(xiàn)陶哲軒發(fā)帖的截圖是GPT-4。
便問道,「你認(rèn)為以前的ChatGPT和基于GPT-4模型的新助手之間有什么區(qū)別?」
陶哲軒稱,「到目前為止,GPT-4的答復(fù)稍微有用一些,而且符合我的要求,但我沒有看到質(zhì)量上的重大差別。」
ChatGPT加入工作流
ChatGPT的誕生,許多人都在驚呼自己的工作要被AI替代了。
就連天才數(shù)學(xué)家陶哲軒也上手ChatGPT了。
3月5日,陶哲軒在網(wǎng)上稱自己決定嘗試以不同的方式將AI工具納入我的工作流程。其中就包括GPT-4、DeepL等工具。
在此期間,ChatGPT隱藏功能都被他挖掘了出來,比如尋找公式、解析代碼格式的文檔、改寫論文語句等等。
比如,ChatGPT有時可以在數(shù)學(xué)中做一個半成品的語義檢索,也就是用它來生成一些提示。
比如,陶哲軒讓ChatGPT從描述中識別庫默爾定理,它沒能給出正確答案,但根據(jù)它給出的近似答案(Legendre 公式)。
對此,陶哲軒稱,人工智能在數(shù)學(xué)中的作用是提供一個初步的近似答案,然后可以結(jié)合傳統(tǒng)搜索引擎輕松找到正確答案。
陶哲軒還發(fā)現(xiàn)了ChatGPT在處理數(shù)學(xué)問題時的亮點(diǎn),能夠識別不同語言的數(shù)學(xué)概念音譯版。
另外,可以要求ChatGPT轉(zhuǎn)換從MathSciNet獲得的一堆參考文獻(xiàn),并在LaTeX書目環(huán)境下將其格式化為\bibitems。
然而ChatGPT 就沒有犯錯的時候嗎?
在一個關(guān)于「素?cái)?shù)是否無窮多」的證明問題中,陶哲軒發(fā)現(xiàn)ChatGPT給出的答案并不是完全正確的。
從另一面看,他發(fā)現(xiàn)ChatGPT給出的論證思路是可以被固定下來的,并且這個思路他之前都從未見過。
復(fù)制、粘貼、一鍵完成!
挖掘GPT-4的用例,網(wǎng)友們也是花了不少功夫。
讓GPT-4評審論文不僅合理,而且還能擊中要點(diǎn)。
「作為一個學(xué)者,我不知道如何看待這個問題:我把我的一篇舊論文放到GPT-4中(分成兩部分),要求一個經(jīng)濟(jì)社會學(xué)家進(jìn)行嚴(yán)厲但公平的同行評審。」
它創(chuàng)造了一個完全合理的同行評審,踩中了我的評審員提出的許多要點(diǎn)。
對許多人來講,想要做什么,直接問GPT-4,「復(fù)制、粘貼、一鍵完成!」
就比如用GPT-4做一個復(fù)雜的游戲。
網(wǎng)友把GPT-4、Replit、MidJourney、Claude組建成一個人工智能助手團(tuán)隊(duì),從頭開始創(chuàng)建了一個3D太空跑酷游戲。
然鵝,自己竟對Javascript或3D游戲編程一無所知。