自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位

發(fā)布于 2024-4-15 09:51
瀏覽
0收藏

啥?


新版GPT-4是在Q*的輸出上微調(diào)的?

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

在競(jìng)技場(chǎng)重回榜一的新版GPT-4 Turbo,成功再次踩中大家嗨點(diǎn)。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

它此次的性能提升體現(xiàn)在數(shù)學(xué)、推理、代碼上,而且輸出內(nèi)容廢話更少。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

最讓大家感到興奮的是其數(shù)學(xué)/推理能力,現(xiàn)在可以在一些問(wèn)題上完勝其他大模型。

比如“求y=x^4-5x^2-x+4和y=x^2-3x交點(diǎn)的y坐標(biāo)之和。”只有最新版GPT-4 Turbo能測(cè)出來(lái)。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

這條推特被公開(kāi)承認(rèn)自己參與過(guò)Q*的Lukasz Kaiser轉(zhuǎn)發(fā)。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

Noam Brown也發(fā)推表示新版GPT-4 Turbo在推理能力上大幅提升——要知道,這位OpenAI科學(xué)家一直被外界認(rèn)為正在研究Q*。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

各方信息匯總后,網(wǎng)友們一拍腦袋反應(yīng)過(guò)來(lái),這其中會(huì)不會(huì)就引入了Q*啊?


數(shù)學(xué)方面的提升意味著其中可能包含了一個(gè)數(shù)學(xué)模型,可能是Q*。


(以及他的數(shù)學(xué)題測(cè)試推特被OpenAI的人轉(zhuǎn)發(fā)了)

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

好家伙,難道OpenAI在悄悄搞大事?

新GPT-4的“新馬腳”?

OpenAI官方公告表示,最新版本的GPT-4 Turbo全方位大提升,現(xiàn)在ChatGPT用戶可直接體驗(yàn)。


網(wǎng)友立馬沖去實(shí)測(cè),有人給出評(píng)估結(jié)果,特別是數(shù)學(xué)/推理能力有了重大提升。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

實(shí)際問(wèn)題測(cè)試中,在多個(gè)數(shù)學(xué)推理題上,GPT-4 Turbo都沒(méi)有翻車(chē),但是如Command-R plus、Clauede-3 Opus等都有失誤。


比如一道乘電梯的推理題。陷阱在于這部神奇電梯無(wú)論坐幾層,最后都會(huì)停在一層。GPT-4 Turbo理解了這層邏輯,最后給出了正確答案。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

還有在修改二叉樹(shù)問(wèn)題上,GPT-4 Turbo不僅回答正確,而且過(guò)程清晰完整。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)


GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

同時(shí)在“大海撈針”能力上,與之前版本對(duì)比,最新GPT-4 Turbo已經(jīng)是出版GPT-4能力的4.3倍

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

競(jìng)技場(chǎng)的結(jié)果表明,在代碼能力方面,GPT-4 Turbo也更強(qiáng)了。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

文本輸出方面變得更加簡(jiǎn)潔。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

生成代碼也少了很多廢話(下圖右側(cè)為新版本)。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

有人補(bǔ)充說(shuō),生成速度上也更快了。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

神秘Q*:OpenAI的最大秘密?

現(xiàn)在Q*已經(jīng)成了OpenAI的流量密碼了,只要出現(xiàn)這個(gè)關(guān)鍵字,網(wǎng)友們都會(huì)興奮不已。


畢竟當(dāng)初奧特曼宮斗大戲就和它有關(guān)聯(lián),還有人發(fā)出警告,Q*預(yù)示著AGI即將出現(xiàn)。


不過(guò)官方一直沒(méi)有公開(kāi)承認(rèn)過(guò)這個(gè)項(xiàng)目的存在,奧特曼拒絕回答,Transformer作者公開(kāi)承認(rèn)參與Q*也被OpenAI公關(guān)跳起來(lái)捂嘴。


從目前各方透露的信息來(lái)看,Q*專(zhuān)注于邏輯和數(shù)學(xué)推理能力,數(shù)學(xué)能力突出。


Transformer作者之一Lukasz Kaiser承認(rèn)自己參與了這個(gè)項(xiàng)目。


德?lián)銩I之父、前FAIR(Meta)研究科學(xué)家Noam Brown也被視為是Q*項(xiàng)目的重要成員(推測(cè)來(lái)自LeCun)。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

他加入OpenAI的動(dòng)作也被外界視為分析Q*的一個(gè)線索,“有理由懷疑Q是將LLM和AlphaGo結(jié)合起來(lái),并用強(qiáng)化學(xué)習(xí)進(jìn)行訓(xùn)練”。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

Noam Brown開(kāi)發(fā)出了第一個(gè)在打撲克牌上超越人類(lèi)的AI,后來(lái)加入Meta致力于讓AI學(xué)會(huì)玩Diplomacy(外交游戲)。


目前,關(guān)于Q*的準(zhǔn)確信息還是非常少。


可能奧特曼還在等一個(gè)合適的時(shí)機(jī)來(lái)回應(yīng)外界。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

One More Thing

btw,網(wǎng)友們意外捉到總裁Brockman轉(zhuǎn)發(fā)的一個(gè)視頻演示里的提示詞是:


創(chuàng)建一個(gè)python腳本,使用pytube庫(kù)從YouTube下載視頻。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

看來(lái)大家拿GPT-4干的事也都差不多嘛(doge)。

GPT-4升級(jí)被曝引入Q*,推理/數(shù)學(xué)更強(qiáng)廢話更少,競(jìng)技場(chǎng)重奪王位-AI.x社區(qū)

本文轉(zhuǎn)自 量子位 ,作者:量子位


原文鏈接:??https://mp.weixin.qq.com/s/THsEr_Lhd_gFE0G-KiYFeA??

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦