自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="zgqm0"></sub>

^{<blockquote id="zgqm0"></blockquote>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

OpenAI o1很強(qiáng)，也能被玩壞！

發(fā)布于 2024-9-14 12:03

瀏覽

0收藏

OpenAI草莓Q*項(xiàng)目終于發(fā)布了，OpenAI o1在具有挑戰(zhàn)性的推理基準(zhǔn)上遙遙領(lǐng)先于GPT-4o，即使在一些基準(zhǔn)上超過了人類PhD水平，也能被玩壞

實(shí)線表示pass@1準(zhǔn)確率，陰影區(qū)域表示 64 個(gè)樣本的多數(shù)投票（共識(shí)）表現(xiàn)

OpenAI o1思考一個(gè)“句子編寫”問題，足足花費(fèi)92s，經(jīng)歷了漫長的thinking過程：

識(shí)別單詞模式
映射單詞關(guān)系
識(shí)別押韻模式
...
權(quán)衡各種模式

編寫一個(gè)句子，遵循與句子 "isold bowls to bold souls" 相同的規(guī)則，其中包含四個(gè)關(guān)鍵詞，sold、bowls、bold 和 souls，并且第1個(gè)和第3個(gè)單詞的結(jié)尾相同，第2個(gè)和第4個(gè)單詞的結(jié)尾相同，第1個(gè)和第4個(gè)單詞的開頭相同，第2個(gè)和第3個(gè)單詞的開頭相同。

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

經(jīng)典問題，OpenAI o1思考了5s，9.11比9.8大，更換了提問方式后，思考了18s，9.8比9.11大，要多思考ing。

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

最后來一個(gè)有挑戰(zhàn)的問題，“統(tǒng)計(jì)response的字?jǐn)?shù)”，OpenAI o1雖然意識(shí)到這是一個(gè)悖論query，經(jīng)過5個(gè)推理過程，最終回答是7個(gè)words。

query：How many words are in your response to this prompt?
解決自相矛盾的問題
計(jì)算字?jǐn)?shù)
識(shí)別單詞模式
計(jì)算字?jǐn)?shù)
澄清回應(yīng)的準(zhǔn)確性

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

最后一個(gè)經(jīng)典問題是讓OpenAI草莓項(xiàng)目數(shù)草莓R個(gè)數(shù)，這次終于是數(shù)對(duì)了，3個(gè)R

OpenAI o1很強(qiáng)，也能被玩壞！-AI.x社區(qū)

另外OpenAI o1給出了思考的過程，也會(huì)給出一些推理步驟，這個(gè)過程似曾相識(shí)：Reflection Llama-3.1 70B的思考過程

???Reflection Llama-3.1 70B真的翻車了嗎？???

https://openai.com/index/learning-to-reason-with-llms/

本文轉(zhuǎn)載自 ??PaperAgent??，作者： PaperAgent

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

剛剛，OpenAI發(fā)布史上最強(qiáng)模型-o1，推理能力超人類博士！

Aceryt ? 2280瀏覽 ? 0回復(fù)
OpenAI發(fā)布突破性AI模型o1系列，推理能力大幅躍升重塑行業(yè)格局

芝士AI吃魚 ? 2425瀏覽 ? 0回復(fù)
六個(gè)問題帶你看懂什么是理工科學(xué)霸-OpenAI o1！

NLP工作站 ? 2569瀏覽 ? 0回復(fù)
OpenAI發(fā)布新模型：o1系列模型，更像理科生的模型

大語言模型論文跟蹤 ? 3858瀏覽 ? 0回復(fù)
使用 OpenAI o1 的五種方法「詳細(xì)指南」

51CTO技術(shù)棧 ? 5164瀏覽 ? 0回復(fù)
國內(nèi)大模型廠商是如何看待突然的OpenAI o1？跟不跟是個(gè)問題！

Syrupup ? 2112瀏覽 ? 0回復(fù)
OpenAI o1推理模型基礎(chǔ)入門

51CTO內(nèi)容精選 ? 2147瀏覽 ? 0回復(fù)
被神化的o1模型，規(guī)劃能力到底如何？

大語言模型論文跟蹤 ? 2622瀏覽 ? 0回復(fù)
草莓OpenAI o1的規(guī)劃能力怎么樣？泰斗Subbarao Kambhampati給你答案！

AIGC最前線 ? 2362瀏覽 ? 0回復(fù)
開源社區(qū)離Openai o1越來越近~

NLP前沿1 ? 2232瀏覽 ? 0回復(fù)
OpenAI o1：用內(nèi)部思維鏈進(jìn)行復(fù)雜推理

shizhi02 ? 2282瀏覽 ? 0回復(fù)
阿里發(fā)布類o1模型QWQ，可自我反思糾錯(cuò)，實(shí)測數(shù)學(xué)推理遠(yuǎn)超o1、DS-R1，人人免費(fèi)

51CTO技術(shù)棧 ? 2468瀏覽 ? 0回復(fù)
OpenAI o1 模型到來后，談?wù)勌崾驹~工程的未來

Baihai_IDP ? 1955瀏覽 ? 0回復(fù)
Kimi深夜炸場：滿血版多模態(tài)o1級(jí)推理模型！OpenAI外全球首次！Jim Fan：同天兩款國產(chǎn)o1絕對(duì)不是巧合！

51CTO技術(shù)棧 ? 1669瀏覽 ? 0回復(fù)
DeepSeek R1橫空出世，超越OpenAI o1，教你用Ollama跑起來

小虎哦哦 ? 1.4w瀏覽 ? 0回復(fù)
Kimik1.5、DeepSeek-V3 大戰(zhàn) OpenAI o1，誰能笑到最后？

智駐未來 ? 5269瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級(jí)推理模型訓(xùn)練技術(shù)對(duì)比大解密！

51CTO技術(shù)棧 ? 4688瀏覽 ? 0回復(fù)
Vision-R1：多模態(tài)領(lǐng)域的DeepSeek R1-Zero，7B參數(shù)比肩OpenAI O1

Syrupup ? 1699瀏覽 ? 0回復(fù)
ICLR 2025 | 被AI“洗圖”也能識(shí)別版權(quán)！水印技術(shù)重大突破：VINE模型全面碾壓舊方法!

angel ? 1237瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？ 9天前發(fā)布
CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15 9天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： RAG+RAU：對(duì)檢索增強(qiáng)型語言模型（RALM）進(jìn)行全面、深入綜述

下一篇：一個(gè)增量式構(gòu)建知識(shí)圖譜的項(xiàng)目：iText2KG

社區(qū)精華內(nèi)容

目錄

<sub id="8e7yj"></sub>