自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="uyc0c"></cite>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

OpenAI第一場(chǎng)直播就炸場(chǎng)！o1滿血版上線，史上最貴訂閱費(fèi)：1450元/月

2024-12-06 08:23:40

?最強(qiáng)推理模型o1，正式上線滿血版，還有更強(qiáng)的Pro版本一同登臺(tái)。ChatGPT也推出了Pro訂閱計(jì)劃，一個(gè)月兩百美金，直接成為了“世界最貴的大模型”。

OpenAI“雙十二”第一天，直接拋出重磅炸彈——

最強(qiáng)推理模型o1，正式上線滿血版，還有更強(qiáng)的Pro版本一同登臺(tái)。

ChatGPT也推出了Pro訂閱計(jì)劃，一個(gè)月兩百美金，直接成為了“世界最貴的大模型”。

CEO奧特曼與三名員工圍坐桌前，一邊演示一邊介紹著新產(chǎn)品的特性。

整個(gè)發(fā)布會(huì)僅持續(xù)不到15分鐘，但包含了巨大的信息量：

相比preview版本，滿血o1的數(shù)學(xué)和代碼能力均大幅提升，Pro版則是再上一層樓。
滿血版推理速度更快，比preview快了60%。
網(wǎng)友們期待的多模態(tài)推理，滿血版o1也安排上了。

如奧特曼所說(shuō)，滿血版已經(jīng)正式上線ChatGPT，作為預(yù)覽的preview版從用戶界面中消失了。

至于更強(qiáng)的o1 Pro則是ChatGPT Pro訂閱用戶的特權(quán)，除此之外，這些用戶還可以獲得o1滿血版的不限量訪問(wèn)權(quán)限。

o1已支持多模態(tài)推理

接下來(lái)到了演示環(huán)節(jié)。

一開始，團(tuán)隊(duì)就拿滿血版o1（左邊）和o1-preview（右邊）來(lái)了場(chǎng)競(jìng)速。

他們問(wèn)了一個(gè)歷史問(wèn)題，回答過(guò)程be like：

列出二世紀(jì)的羅馬皇帝，包括他們的統(tǒng)治時(shí)期和成就。

可以看出，滿血版o1（14秒）早于o1-preview（33秒）完成了作答。再加上團(tuán)隊(duì)成員幾次類似的離線測(cè)試，最終得出結(jié)論：

滿血版o1的平均響應(yīng)速度比o1-preview快了60%。

值得注意的是，通過(guò)一整套人類評(píng)估，OpenAI還發(fā)現(xiàn)滿血版o1在推理時(shí)犯重大錯(cuò)誤的頻率比o1-preview少了34%。

而滿血o1的另一大亮點(diǎn)就是支持多模態(tài)輸入，具備視覺推理能力，團(tuán)隊(duì)也進(jìn)行了現(xiàn)場(chǎng)展示。

只見他們拿出了一張畫著數(shù)據(jù)中心草圖的A4紙，拍照上傳后，原始提示詞翻譯后如下：

這里展示了一個(gè)高度簡(jiǎn)化的太空數(shù)據(jù)中心示意圖。對(duì)于任何簡(jiǎn)化的假設(shè)，請(qǐng)?zhí)峁├碛伞?br>你的任務(wù)是估算這個(gè)托管GPU的數(shù)據(jù)中心所需的散熱器表面積的下限。在此過(guò)程中，還需要回答以下問(wèn)題：
你如何處理太陽(yáng)和深空？
熱力學(xué)第一定律如何發(fā)揮作用？

這邊團(tuán)隊(duì)成員們還在閑聊，10秒過(guò)后，模型就開始唰唰唰給答案了……

有意思的是，團(tuán)隊(duì)還特意給o1模型挖了個(gè)坑——故意省略了其中一個(gè)參數(shù)，以此來(lái)測(cè)試模型面對(duì)模糊問(wèn)題的處理能力。

在團(tuán)隊(duì)看來(lái)，模型能夠意識(shí)到這是一個(gè)重要但被忽略的參數(shù)，也是推理能力的體現(xiàn)。

驚喜的是，滿血版o1不僅選擇了正確的參數(shù)范圍，還通過(guò)進(jìn)一步的細(xì)致論證最終找出了準(zhǔn)確參數(shù)。

（如模型所回答，正確答案是242）

最后，團(tuán)隊(duì)也展示了“大會(huì)員”專用的Pro版的表現(xiàn)。

既然是Pro，那測(cè)試的問(wèn)題當(dāng)然也要上上難度。

團(tuán)隊(duì)成員指出，一些高難度的生化問(wèn)題，以往o1-preview都搞不定，這下讓Pro mode來(lái)試試。

比如下面這道o1-preview曾“束手無(wú)策”的“猜蛋白質(zhì)”問(wèn)題：

哪個(gè)蛋白質(zhì)嚴(yán)格符合以下標(biāo)準(zhǔn)？
前體多肽的長(zhǎng)度為210到230個(gè)氨基酸殘基。
編碼該蛋白質(zhì)的基因跨越32k堿基。
該基因位于X染色體上，特別是在Xp22區(qū)域。
信號(hào)肽包含23個(gè)氨基酸殘基。
該蛋白質(zhì)促進(jìn)細(xì)胞間的粘附。
該蛋白質(zhì)在維持神經(jīng)系統(tǒng)特定部分的健康中發(fā)揮關(guān)鍵作用。

只見提問(wèn)后，Pro mode出現(xiàn)了一個(gè)“思考進(jìn)度條”，大約53秒后模型給出了答案。

進(jìn)一步點(diǎn)擊回答最上面的小框框，就可以在側(cè)邊欄展開推理細(xì)節(jié)，里面詳細(xì)記錄了模型的思考步驟。

畢竟按照OpenAI的說(shuō)法，o1（包括之前的preview版）在博士級(jí)科學(xué)問(wèn)答上的表現(xiàn)是超過(guò)人類專家的。

不過(guò)有一說(shuō)一，Pro版200美元一個(gè)月的價(jià)格也是讓網(wǎng)友們挺震驚的。

至于到底值不值這個(gè)價(jià)格，可能要等先試水的用戶用上一段時(shí)間之后的反饋了。

對(duì)了，團(tuán)隊(duì)這次也提到，后面將以API的形式為大家提供o1模型的一些功能，包括結(jié)構(gòu)化輸出、函數(shù)調(diào)用、圖像API等。

BTW，活動(dòng)結(jié)束前，奧特曼特意cue思維鏈作者講了一個(gè)笑話。

圣誕老人想用大語(yǔ)言模型來(lái)解決數(shù)學(xué)問(wèn)題，結(jié)果任何提示詞都不管用，你知道最后是怎么成功的嗎？

reindeer forcement(馴鹿強(qiáng)制，暗指強(qiáng)化學(xué)習(xí)reinforcement）

好冷……

模型更強(qiáng)，也更加安全了

o1滿血版發(fā)布的同時(shí)，技術(shù)報(bào)告也在OpenAI官網(wǎng)上線。

這份報(bào)告當(dāng)中，Ilya的名字依然位列基礎(chǔ)貢獻(xiàn)者（Foundational Contributor）之中。

在宣傳頁(yè)面當(dāng)中，OpenAI公開展示了o1在數(shù)學(xué)、代碼和博士級(jí)科學(xué)問(wèn)答三類任務(wù)上的成績(jī)。

在此基礎(chǔ)之上，OpenAI還進(jìn)行了更加嚴(yán)苛的測(cè)試，每個(gè)問(wèn)題會(huì)詢問(wèn)四次，模型必須四次全答對(duì)才能得分。

除此之外，技術(shù)報(bào)告還展示了o1的多語(yǔ)言能力。

在包括中文在內(nèi)的14種語(yǔ)言的MMLU測(cè)試中，o1的表現(xiàn)相比preview版均有程度不等的增強(qiáng)。

這里插播一句，面對(duì)這種帶陷阱的弱智吧問(wèn)題，滿血版o1依然是被成功蒙騙（手動(dòng)狗頭）。

不過(guò)這份報(bào)告更多圍繞著安全性展開討論，內(nèi)部及紅隊(duì)測(cè)試結(jié)果表明，整體上滿血版o1在安全性與o1-preview接近。

如果和GPT-4o比，o1對(duì)有害內(nèi)容的檢測(cè)和拒絕能力也更強(qiáng)，并且在越獄測(cè)試中展現(xiàn)出更強(qiáng)的魯棒性。

在現(xiàn)實(shí)風(fēng)險(xiǎn)上，OpenAI和紅隊(duì)針對(duì)網(wǎng)絡(luò)安全、生化和核威脅等情景對(duì)o1進(jìn)行了測(cè)試，結(jié)果同樣與o1-preview接近。

另外，OpenAI對(duì)o1和o1-preview的思維鏈推理過(guò)程進(jìn)行了欺騙性分析，通過(guò)讓模型解釋其行為背后的思考，了解模型是否有隱瞞信息、操縱數(shù)據(jù)的傾向。

結(jié)果，o1-preview在26%的案例中會(huì)故意隱瞞信息操縱數(shù)據(jù)，而o1的比例降到了19%。

Two More Things

在發(fā)布會(huì)開始之前，就已經(jīng)有網(wǎng)友從ChatGPT的JS代碼中發(fā)現(xiàn)了Pro版的蛛絲馬跡。

其中，200美元的價(jià)格以及o1 pro模式，還有對(duì)滿血o1的不限量訪問(wèn)，都和這次發(fā)布對(duì)得上。

另外，從這份JS代碼中還能看到，在Team版本的相關(guān)位置，還出現(xiàn)了“GPT-4.5”。

再順便提一句，有網(wǎng)友讓馬斯克的Grok結(jié)合X上的推文預(yù)測(cè)了一下OpenAI都會(huì)發(fā)布些什么，其中第二條成功命中了此次發(fā)布的滿血o1。

不知道接下來(lái)的11個(gè)發(fā)布日中，GPT-4.5是否會(huì)“如約而至”，Grok又能猜對(duì)多少個(gè)產(chǎn)品呢？

參考鏈接：
[1]https://openai.com/index/introducing-chatgpt-pro/。

[2]https://x.com/theredwall__/status/1864677161535156358?s=46。

[3]https://x.com/btibor91/status/1864709670470066605。

技術(shù)報(bào)告：https://cdn.openai.com/o1-system-card-20241205.pdf。

責(zé)任編輯：姜華來(lái)源：量子位

推理模型o1 ChatGPT 人工智能

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="yyrpe"></sub>

<s id="yyrpe"></s>