ChatGPT死活不認(rèn)27能被3整除,網(wǎng)友:不是說(shuō)AI要統(tǒng)治世界了嗎?
讓眾人瘋狂的網(wǎng)紅AI ChatGPT,原來(lái)也有明顯的短板?
一段“網(wǎng)友調(diào)教這只AI”的聊天記錄,在網(wǎng)上傳開(kāi)了。
可以看到,AI起初居然說(shuō)27是個(gè)質(zhì)數(shù)。
在網(wǎng)友向其提出質(zhì)疑后,AI仍嘴硬稱“27不能被3整除”。
網(wǎng)友不得不和AI“大戰(zhàn)幾百回合”,最后在人類鍥而不舍的教導(dǎo)下,AI才終于終于低頭認(rèn)錯(cuò)。
有一說(shuō)一,AI的認(rèn)錯(cuò)態(tài)度倒是很好。
有圍觀者看完后調(diào)侃:AI不是都要統(tǒng)治世界了嗎,怎么會(huì)輸給一道簡(jiǎn)單的數(shù)學(xué)題?
不過(guò),也有很多人為ChatGPT說(shuō)話:這么坦誠(chéng)的認(rèn)錯(cuò)態(tài)度,不比某些人強(qiáng)多了。
數(shù)學(xué)水平拉胯,還賊固執(zhí)
具體事情是這樣的:
網(wǎng)友在和ChatGPT互動(dòng)的過(guò)程中發(fā)現(xiàn),這只AI數(shù)學(xué)水平過(guò)于拉胯,連27是不是質(zhì)數(shù)這種簡(jiǎn)單問(wèn)題都能搞錯(cuò)——而且還是在知道質(zhì)數(shù)定義的情況下……
于是網(wǎng)友讓ChatGPT證明它給出的結(jié)論,沒(méi)想到,AI居然說(shuō)27不能被3整除。
網(wǎng)友表示無(wú)語(yǔ),但還是耐著性子又問(wèn)了一遍,結(jié)果AI依然嘴硬,偏把9說(shuō)成是9.0。
無(wú)奈,網(wǎng)友只能搬出代碼,試著用Python來(lái)教會(huì)AI。
結(jié)果AI還真學(xué)會(huì)了!而且人家還主動(dòng)承認(rèn)了剛才的錯(cuò)誤。
有意思的是,我們剛才也去問(wèn)了ChatGPT“27是不是質(zhì)數(shù)”,發(fā)現(xiàn)它已經(jīng)改過(guò)來(lái)了。
然后我們又拿了幾個(gè)數(shù)字去問(wèn)AI,結(jié)果在這一回合中,它都正確地判斷了一個(gè)數(shù)到底是不是質(zhì)數(shù)。
不過(guò)仔細(xì)一看,AI并沒(méi)提到35能被7整除,于是我們又專門(mén)問(wèn)了一遍。然鵝……
這豈不是一本正經(jīng)地胡說(shuō)八道嘛?
于是我們也只好搬出Python教教它,但這回,連python似乎也沒(méi)能讓AI承認(rèn)自己的錯(cuò)誤……
所以這只AI為啥算術(shù)水平如此堪憂,而且還如此固執(zhí)?
其中一個(gè)重要的原因就是,ChatGPT是個(gè)語(yǔ)言大模型,根據(jù)Open AI的GPT-3.5的模型微調(diào)而成,它擅長(zhǎng)邏輯推理,但并不能執(zhí)行標(biāo)準(zhǔn)的計(jì)算機(jī)算法。
而且與搜索引擎不同,它目前也沒(méi)有網(wǎng)頁(yè)瀏覽功能,無(wú)法調(diào)用在線計(jì)算器。
此前,ChatGPT其實(shí)已經(jīng)向用戶坦言,它不懂算術(shù)。兩位數(shù)的乘法或許還湊乎,但遇到三位數(shù)的乘法,人家直接不干了。
我們也去問(wèn)了一遍,現(xiàn)在AI到是直接給了個(gè)答案,不過(guò)是錯(cuò)的。(正確答案為186524)
另外,ChatGPT一般不會(huì)根據(jù)用戶的反饋來(lái)糾正自己的答案,但如果用戶提出了額外的信息,有時(shí)也能輔助AI優(yōu)化答案。
所以,我們暫時(shí)沒(méi)有成功地“教育”AI,大概也許可能是運(yùn)氣不太好……
除了數(shù)學(xué)其他都很全能
盡管ChatGPT有時(shí)會(huì)展現(xiàn)出“人工智障”的一面,但不得不說(shuō),大多數(shù)時(shí)候它的表現(xiàn)還是很優(yōu)秀的。
比如,哥倫比亞大學(xué)教授、谷歌工程師Kenneth Goodman就分享,ChatGPT已經(jīng)做好成為律師的準(zhǔn)備了!
在律師執(zhí)業(yè)考試中,ChatGPT的正確率高達(dá)70%(35/50)。
?不僅是法律方面,Goodman還讓ChatGPT參加了其他不同領(lǐng)域的各種考試,都取得了很高的成績(jī)。
包括美國(guó)醫(yī)師執(zhí)照考試(USMLE),拿掉其中的圖像選擇題后,ChatGPT同樣做到了70%的正確率。?
為了防止ChatGPT的訓(xùn)練數(shù)據(jù)中包含這些題目,Goodman還特意選取了紐約州2022年8月最新化學(xué)注冊(cè)考試:
去除5個(gè)圖片選擇題,ChatGPT的正確率為77.7%(35/45)。
同樣批次的英語(yǔ)考試中,ChatGPT的正確率甚至達(dá)到了91.6%(22/24)
有網(wǎng)友已經(jīng)開(kāi)始預(yù)測(cè),或許我們每個(gè)人都將擁有自己的律師AI了,咨詢律師的費(fèi)用也會(huì)大大下降。接下來(lái)就是醫(yī)生AI、營(yíng)養(yǎng)師AI……
怎么樣,你看好ChatGPT的未來(lái)應(yīng)用嗎?(或者你有讓它學(xué)好數(shù)學(xué)的建議嗎?)
參考鏈接:
[1]https://weibo.com/7095186006/Mj6LVF0zS#comment
[2]https://twitter.com/TonyZador/status/1601316732689604608
[3]https://twitter.com/pythonprimes/status/1601664776194912256