自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<em id="kv31c"><rt id="kv31c"><li id="kv31c"></li></rt></em>

<sub id="kv31c"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？

發(fā)布于 2025-4-21 00:48

瀏覽

0收藏

OpenAI大佬姚順雨發(fā)表一篇名為“The Second Half”博客，核心觀點(diǎn)是人工智能（AI）的發(fā)展已經(jīng)進(jìn)入了一個(gè)新的階段，即“下半場”：

從現(xiàn)在開始，將把重點(diǎn)從解決問題轉(zhuǎn)移到定義問題上；
評估將比訓(xùn)練更為重要，不再只是問：“我們能否訓(xùn)練一個(gè)模型來解決X問題？”而是要問：“我們應(yīng)該訓(xùn)練人工智能去做什么，以及我們?nèi)绾魏饬空嬲倪M(jìn)步？”；
為了在AI的下半場取得成功，需要及時(shí)轉(zhuǎn)變思維方式和技能組合，這些思維方式和技能組合或許更接近產(chǎn)品經(jīng)理的思維和技能。

OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？-AI.x社區(qū)

1. AI的“上半場”回顧

重點(diǎn)：在過去的幾十年中，AI的研究主要集中在開發(fā)新的訓(xùn)練方法和模型，如深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)（RL）等。這些方法取得了顯著的成果，例如DeepBlue、AlphaGo、GPT-4等。
成果：這些模型在各種任務(wù)上表現(xiàn)出色，包括棋類游戲、語言模型、數(shù)學(xué)競賽等，推動(dòng)了AI的快速發(fā)展。
評價(jià)方式：AI的評價(jià)主要依賴于基準(zhǔn)測試（benchmarks），例如ImageNet、WMT’14等。這些基準(zhǔn)測試為模型的性能提供了量化指標(biāo)，但往往被視為次要角色。

2. 強(qiáng)化學(xué)習(xí)（RL）的突破

關(guān)鍵轉(zhuǎn)折點(diǎn)：強(qiáng)化學(xué)習(xí)（RL）在過去一直未能很好地泛化，但最近取得了重大突破。通過語言和推理，RL現(xiàn)在可以解決一系列廣泛的任務(wù)，如軟件工程、創(chuàng)意寫作、數(shù)學(xué)競賽等。
在強(qiáng)化學(xué)習(xí)（RL）中，有三個(gè)關(guān)鍵組成部分：算法、環(huán)境和先驗(yàn)知識
事實(shí)證明，強(qiáng)化學(xué)習(xí)中最重要的部分可能根本不是強(qiáng)化學(xué)習(xí)算法或環(huán)境，而是先驗(yàn)知識，而這些先驗(yàn)知識可以通過與強(qiáng)化學(xué)習(xí)完全無關(guān)的方式獲得。

OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？-AI.x社區(qū)

核心要素：這種突破的實(shí)現(xiàn)依賴于三個(gè)關(guān)鍵要素：
大規(guī)模語言預(yù)訓(xùn)練：通過預(yù)訓(xùn)練模型（如GPT-3）獲取通用的常識和語言知識。
規(guī)模（數(shù)據(jù)和計(jì)算）：大規(guī)模的數(shù)據(jù)和計(jì)算能力是實(shí)現(xiàn)這種泛化能力的基礎(chǔ)。
推理和行動(dòng)：將推理作為RL環(huán)境中的行動(dòng)，利用語言預(yù)訓(xùn)練的先驗(yàn)知識來實(shí)現(xiàn)泛化。

3. AI的“下半場”展望：

新的焦點(diǎn)：AI的下半場將從“解決問題”轉(zhuǎn)向“定義問題”。這意味著評價(jià)將比訓(xùn)練更重要，研究者需要思考“我們應(yīng)該訓(xùn)練AI做什么，以及如何衡量真正的進(jìn)步”。
評價(jià)的重要性：過去，AI的研究側(cè)重于開發(fā)新的模型和方法，以在基準(zhǔn)測試中取得更好的成績。但在下半場，研究者需要重新思考評價(jià)機(jī)制，創(chuàng)造新的任務(wù)和評價(jià)標(biāo)準(zhǔn)，以推動(dòng)AI在現(xiàn)實(shí)世界中的應(yīng)用。
現(xiàn)實(shí)世界的應(yīng)用：盡管AI在各種基準(zhǔn)測試中取得了巨大成功，但這些成功尚未對經(jīng)濟(jì)和GDP產(chǎn)生顯著影響。這是因?yàn)楝F(xiàn)有的評價(jià)機(jī)制與現(xiàn)實(shí)世界的實(shí)際應(yīng)用存在差異。例如，現(xiàn)實(shí)中的任務(wù)往往需要與人類互動(dòng)，而不是完全自動(dòng)化的。

OpenAI大佬：AI上半場忙著開發(fā)新訓(xùn)練方法和模型GPT-4/o1/o3，下半場呢？-AI.x社區(qū)

4. 新的評價(jià)機(jī)制

互動(dòng)性：現(xiàn)實(shí)世界中的任務(wù)往往需要與人類互動(dòng)，而不是完全自動(dòng)化的。新的評價(jià)機(jī)制需要考慮這種互動(dòng)性，例如通過引入真實(shí)的人類用戶（如Chatbot Arena）或用戶模擬（如tau-bench）。
非獨(dú)立同分布（non-i.i.d.）：現(xiàn)實(shí)世界中的任務(wù)往往是順序解決的，而不是獨(dú)立同分布的。新的評價(jià)機(jī)制需要考慮這種順序性，例如通過引入長期記憶方法。

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

無界AI算法總監(jiān)鄒國平:Midjourney領(lǐng)跑，沒有標(biāo)準(zhǔn)答案的文生圖，下半場還能怎么卷？

51CTO技術(shù)棧 ? 2764瀏覽 ? 0回復(fù)
8B尺寸達(dá)到GPT-4級性能！北大等提出醫(yī)療專家模型訓(xùn)練方法

duhorse ? 2027瀏覽 ? 0回復(fù)
OpenAI草莓o1深夜炸場，一眾大佬博主熬夜實(shí)測：有坑，很難說

51CTO技術(shù)棧 ? 2900瀏覽 ? 0回復(fù)
OpenAI o1很強(qiáng)，也能被玩壞！

PaperAgent ? 2200瀏覽 ? 0回復(fù)
OpenAI發(fā)布新模型：o1系列模型，更像理科生的模型

大語言模型論文跟蹤 ? 3866瀏覽 ? 0回復(fù)
使用 OpenAI o1 的五種方法「詳細(xì)指南」

51CTO技術(shù)棧 ? 5171瀏覽 ? 0回復(fù)
OpenAI o1推理模型基礎(chǔ)入門

51CTO內(nèi)容精選 ? 2152瀏覽 ? 0回復(fù)
奧特曼準(zhǔn)備用o1來訓(xùn)練AI了？OpenAI最新論文驗(yàn)證該方法可行性！

51CTO技術(shù)棧 ? 2060瀏覽 ? 0回復(fù)
擊敗GPT-4o、僅次于o1！英偉達(dá)重磅開源超強(qiáng)大模型--Nemotron

Aceryt ? 2997瀏覽 ? 0回復(fù)
重磅開源Nemotron大模型：擊敗GPT-4o、僅次于o1！

51CTO技術(shù)棧 ? 1884瀏覽 ? 0回復(fù)
o1的風(fēng)又吹到多模態(tài)，直接吹翻了GPT-4o-mini

PaperAgent ? 2074瀏覽 ? 0回復(fù)
DeepSeek R1 Vs OpenAI o1！全球頂級推理模型訓(xùn)練技術(shù)對比大解密！

51CTO技術(shù)棧 ? 4720瀏覽 ? 0回復(fù)
AI領(lǐng)域的“新王”誕生! 馬斯克發(fā)布Grok 3，趕超OpenAI o1和Deepseek R1！

AI博物院 ? 1529瀏覽 ? 0回復(fù)
媲美OpenAI-o3，剛剛開源模型DeepCoder，訓(xùn)練方法、數(shù)據(jù)集大公開

Aceryt ? 963瀏覽 ? 0回復(fù)
o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！

51CTO技術(shù)棧 ? 1768瀏覽 ? 1回復(fù)
OpenAI 發(fā)布兩款新 AI 推理模型 o3 與 o4-mini，圖像推理及自主工具使用成最大亮點(diǎn)

Syrupup ? 1034瀏覽 ? 0回復(fù)
OpenAI 最強(qiáng)推理模型 o3 / o4-mini 震撼發(fā)布！AI 從此能“看圖思考”？

AI博物院 ? 631瀏覽 ? 0回復(fù)
最先進(jìn)推理模型！ OpenAI 推出o3 和 o4-mini模型

51CTO內(nèi)容精選 ? 571瀏覽 ? 0回復(fù)
人工智能進(jìn)入 “下半場”，未來將走向何方？

十一月雨_55 ? 658瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15 9天前發(fā)布
Llama4 剛開源就要被網(wǎng)友玩壞了！ 2025-04-08 07:20:33發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： CPU推理僅29ms，微軟開源第一個(gè)原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15

社區(qū)精華內(nèi)容

目錄

<big id="j6cxa"></big>

<style id="j6cxa"><rp id="j6cxa"></rp></style>

<sub id="j6cxa"></sub>

<style id="j6cxa"></style>