推理和RL加速GPT-5.5到來?奧特曼公開GPT-4.5已就緒,年底發(fā)布全自主智能體
DeepSeek 以低成本模型攪動全球 AI 格局之際,OpenAI CEO Sam Altman 正在進行他的東京之旅。
與軟銀創(chuàng)始人孫正義敲定 5000 億美元的巨額投資之前,Sam Altman 和 OpenAI CPO Kevin Weil 到訪了東京大學(xué),在師生問答環(huán)節(jié)中透露了更勁爆的消息:
「在 OpenAI 內(nèi)部,我們已經(jīng)達到了 GPT-4.5,而達到 GPT-5.5 并不需要 100 倍以上的計算能力?!?/span>
「推理模型和強化學(xué)習技術(shù)的進步極大地提高了計算效率 —— 它允許較小的模型實現(xiàn) GPT-6 級別的性能,而不需要 100 倍以上的計算能力?!?/span>
「我們會把所有模態(tài)整合在一起,你可以在畫布上看到,它一邊和你語音,一邊為你編寫和編譯代碼。它將能夠瀏覽互聯(lián)網(wǎng)?!?/span>
「o 模型將能支持視覺識別功能,比如某個硬件需要檢修,拍一張照片,o 系列模型將能提供技術(shù)支持?!?/span>
「o3-mini 預(yù)示了未來六到十二個月的研究方向...... 我希望到今年年底,我們能開發(fā)出一個除了科學(xué)發(fā)現(xiàn),其他高難度任務(wù)都被它能解決的智能體模型,它可能需要幾個小時來思考,甚至可能需要調(diào)用一堆工具,但它最終能夠為你完成任務(wù)。」
雖然這兩位 OpenAI 的高管說著自己是來聽 bug 和功能需求反饋的,但 Sam Altman 還是在不經(jīng)意間就透露了 GPT 系列的產(chǎn)品規(guī)劃以及 DeepSeek 會讓 OpenAI 重新考慮是否開源的回應(yīng)。尤其值得注意的是,OpenAI 接下來的重點將是高能力的推理模型、多模態(tài)以及智能體。
- 視頻鏈接:https://www.youtube.com/watch?v=8LmfkUb2uIY
機器之心在不改變對談原意的基礎(chǔ)上劃好了這場訪談的重點:
GPT 系列模型未來的發(fā)布計劃
Q:如果 ChatGPT 獲得了 100 倍的算力,它會出現(xiàn)什么新的涌現(xiàn)特性?會出現(xiàn)什么質(zhì)的飛躍嗎?
奧特曼:我們正在尋找這個問題的確切答案,「星際之門」項目正在推進,它擁有我們當前的計算集群大約 100 倍的計算能力。
我們過去的范式是只做預(yù)訓(xùn)練,每一代 GPT,第 1、2、3、4 代,每一代的算力都是之前的大約 100 倍,雖然不是精確的 100 倍,但非常接近。每一次迭代,模型都會出現(xiàn)重要的新涌現(xiàn)特性。
我們已經(jīng)發(fā)展到大約 4.5 代。所以如果想達到 5.5 代,還需要再增加 100 倍。然而,去年出現(xiàn)了一件最重要的事,那就是能夠進行推理的新模型。它們在計算效率上有了驚人的提升。通過強化學(xué)習,模型可以在很多基準測試上表現(xiàn)出色。這些成果在以前的思路中要擴張到 GPT-6 才能實現(xiàn),而現(xiàn)在用更小的模型就能做到。
所以,我們現(xiàn)在有了一些新的認識。關(guān)鍵在于,新方法并不是在所有方面都比舊方法更好,只是在某些特定方面有所提升。不過,我們現(xiàn)在可以更清楚地知道,如果我們用這個新方法去訓(xùn)練一個更大的模型,大概會達到什么樣的效果。
基于這種跳躍式進展,我所期待的是 AI 自主發(fā)現(xiàn)科學(xué)知識,特別是新的物理學(xué)或新的生物學(xué)知識的能力。
近期推理模型的發(fā)展確實令人驚嘆。我們的第一個推理模型的水平僅相當于世界排名百萬開外的競賽程序員,但隨后我們開發(fā)的模型已經(jīng)能夠躋身世界排名前一萬名。到了 12 月公開發(fā)布的 o3 模型,它已經(jīng)達到了世界第 175 名競賽程序員的水平。
目前,我們內(nèi)部的基準測試顯示,模型水平大約在世界前 50 名左右,我相信到今年年底,我們有望沖擊世界第一的寶座。
新的技術(shù)范式展現(xiàn)了驚人的提升速度,并且目前還沒有任何放緩的跡象。
Q:能否分享一下你們未來的各個研究領(lǐng)域的研究計劃,以及你們目前認為什么是可實現(xiàn)的,什么是特別具有挑戰(zhàn)性的?
奧特曼:我們上周五發(fā)布了 o3-mini,我認為這預(yù)示了未來六到十二個月的研究方向。
我們會盡可能推進小型的、令人難以置信的高能力、超快速的推理模型?,F(xiàn)在這些模型主要擅長 STEM 領(lǐng)域,但它們最終會在所有方面都變得出色。
我們會把所有模態(tài)整合在一起。所以在同一個模型中,你可以在畫布上看到,它一邊和你語音,一邊為你編寫和編譯代碼。它將能夠瀏覽互聯(lián)網(wǎng),然后我們會繼續(xù)擴大模型規(guī)模。所以,你知道,希望能達到 GPT-5、6,或者更多。
今天,我們推出了一個叫做 Deep Research 的新功能。這個功能在專業(yè)版計劃中。它有限地進入 Plus 版本,但目前在專業(yè)版計劃中。這是我們推出的第二個智能體產(chǎn)品。它真的很棒,我認為這是我們推出過的最好的產(chǎn)品之一。
你可以給它一個任務(wù),這個任務(wù)原本需要你花費很多小時或幾天在互聯(lián)網(wǎng)上研究、思考尋找資料,它會給你返回一份報告。它的研究報告確實做得非常好。
比如我很喜歡 90 年代的日本國產(chǎn)車。這個周末我想找一輛特定的車,我找得很困難,于是我想那不如試試用 deep research 來找吧。開始我覺得它不可能找到,結(jié)果它找到了整個日本僅有的 3 輛在售車輛,還附帶了現(xiàn)成的聯(lián)系信息。這是一次令人驚嘆的體驗!
所以 OpenAI 會開發(fā)更多這樣的智能體,會繼續(xù)推進能夠自主完成有用工作的智能體。我們討論過如何實現(xiàn)編程智能體的夢想,要達到這個目標還需要大量研究,但我認為 Deep Research 將是一個真正重要的里程碑。
總的來說,我希望到今年年底,我們能開發(fā)出一個你可以使用的模型。如果你使用的是專業(yè)版,你可以將計算能力調(diào)到最大,然后向它提出一個非常難的問題 —— 雖然不是那種需要發(fā)現(xiàn)新科學(xué)的問題,但除此之外的大多數(shù)復(fù)雜問題都可以。它會開始工作,可能需要幾個小時來思考,甚至可能需要調(diào)用一堆工具,但它最終能夠為你完成任務(wù)。
不過,要實現(xiàn)這個目標,我們還有很長的路要走。這需要巨大的計算規(guī)模,也需要更多的算法進步。但我相信,這是可以實現(xiàn)的。
ChatGPT 對高等教育的影響
Q:生成式 AI 在未來 10 年、30 年、100 年將如何改變教育?
奧特曼:我認為世界上的每個學(xué)生、每個人都能獲得比當下最頂尖的教育還要優(yōu)質(zhì)的教育。有些初創(chuàng)的教育公司正在基于 OpenAI 的技術(shù),為每個人提供量身定制的學(xué)習方案,針對他們的薄弱點助力他們終身學(xué)習。
我認為這大有前景。學(xué)生是 ChatGPT 最大的用戶群之一,它天然適合教育,我鼓勵大家都去開發(fā)這類教學(xué)應(yīng)用。
談到 100 年后,那將會非常精彩。我還想象不到 100 年后 AI 的能力會如何。先看 10 年后,我認為 AI 仍將極大地改變世??茖W(xué)進步和科學(xué)發(fā)現(xiàn)的速度可能比現(xiàn)在快 10 倍,也許是 100 倍。
這將極大地提高生活質(zhì)量,比如太空探測器將超越太陽系,但與此同時,人們?nèi)詴^著一如既往的生活,仍然會有很強的動力去和朋友聚會、建立家庭、發(fā)展興趣愛好。但從另一種意義上說,人之為人的本質(zhì)不會改變。我一點也不擔心人類會失業(yè),只是環(huán)境會改變,工作會不同,但人類社會的運作方式還將如常。
Q:全世界如何公平地獲取這些 AI 工具?
奧特曼:我們在辦公室經(jīng)常說「智能變得如此便宜,以至于不值得去計較成本了」。我們的目標是努力把智能的成本降到盡可能接近零,讓全世界的人都能免費使用。
為了證明我們是認真的,現(xiàn)在的模型比兩年前推出的 GPT-3 智能得多,而價格只有 GPT-3 最初的 1%。所以成本已大幅下降,我們想要繼續(xù)保持這個趨勢。
Q:你認為在 AI 時代,亞洲會更看重什么樣的人才和技能?給學(xué)生們一些建議,你認為什么樣的才能和技能最寶貴、最重要?
奧特曼:我們是否會比 AI 更擅長數(shù)學(xué),或者比 AI 更會編程?答案是否定的。你不會在這些方面比 AI 更好。
就像當剛計算器發(fā)明時,有人會覺得無論計算器有多厲害,自己還是會在算數(shù)方面強過計算器,但我們現(xiàn)在已經(jīng)知道了,沒有人能在算數(shù)的方面比過計算器。
所以在 AI 時代所需的具體技能方面,你要能借助 AI 做一些以前沒人能做到的事情。以經(jīng)營一家公司的方法來用 AI,你提出想法,讓 AI 執(zhí)行,再進行協(xié)調(diào)。
在這個世界里你需要的技能是:找到人們的需求、具有創(chuàng)造性的愿景、快速適應(yīng)能力、在一切都在變化時保持韌性,以及學(xué)會如何使用這些工具去提效,而不是試圖做到「我要算得比計算器還快」。
Kevin Weil:對我來說,其中的教訓(xùn)和現(xiàn)在要記住的是:開始使用 AI 工具,開始將它們?nèi)谌肽愕墓ぷ鞣绞?,融入你的學(xué)習方式。當你在做事時,先問問自己:「AI 是否能幫我更快完成?這件事一定要我自己來做嗎?還是可以把它外包給 AI?
奧特曼:有一種錯誤的觀點是,AI 會在所有方面打敗人類,人類社會將被 AI 結(jié)束,其實不然,作為人類,我們也在適應(yīng)新技術(shù)。這是一種共同進化,我們將在 AI 的助力下獲得無法想象的能量,應(yīng)該這么想。
Kevin Weil:順便說一下,有一本沃頓商學(xué)院教授 Ethan Malik 寫的書叫《Co Intelligence》。這本書很短,大約 100 頁,但它包含了很多關(guān)于他如何用 AI 教學(xué)以及學(xué)生如何思考與 AI 合作的深刻見解。我認為很值得一讀。
「DeepSeek 開源影響你們了嗎?」
Q:早些時候,你提到要讓智能對每個人都可獲取。隨著中國 DeepSeek AI 的最近發(fā)布以及公開權(quán)重和架構(gòu),OpenAI 遠離開源的有效性受到了質(zhì)疑。你們是否有計劃重新考慮這個立場?理由是什么?
奧特曼:是的,我們會這樣做。我不知道具體要開源什么或者具體什么時候,但對我們來說,發(fā)展方向似乎是朝著更多開放模型的方向發(fā)展,而社會愿意接受隨之而來的權(quán)衡,至少目前是這樣。我認為我們在讓這些模型在開源使用中普遍安全和穩(wěn)健方面取得了良好進展。它們不會都被這樣使用,但大多數(shù)時候還會是這樣的。
Q:1)過去兩年我一直在使用 OpenAI 作為我的個人助理,非常有幫助。我想知道隨著腦機接口的發(fā)展,你認為它將如何影響人們的意識在未來的存在方式?2)我正在學(xué)習小型衛(wèi)星工程,我在制造用于太空的小型衛(wèi)星。我有一個關(guān)于衛(wèi)星和 AI 的問題,因為通常來說,將 AI 用于新技術(shù)比如衛(wèi)星、太空這樣的領(lǐng)域是非常困難的。所以你對 AI 和空間工程的發(fā)展前景有什么看法?3)你能分享一下關(guān)于 10 年后 AI 會是什么樣子的想法嗎?
奧特曼:讓我們快速回答這些問題。關(guān)于腦機接口,現(xiàn)在是追求這個的絕佳時機。顯然,我們會找到一些解決方案,獲得某種直接訪問的方式。這可能需要一段時間,但正如你所想的,AI 將會非常驚人。我對許多具有破壞性的方法持懷疑態(tài)度,但我認為有一些較輕量級的方法,你可以學(xué)習如何使用接口,而且可以逐漸輸入到你的大腦中,對吧,我們會找到解決方案的。我認為在過去六個月里,很多有趣的新公司都在朝這個方向發(fā)展。Kevin 你要回答太空那個問題嗎?
Kevin Weil:好的。在我來 OpenAI 之前,我在一家叫做 Planet 的公司工作,該公司制造衛(wèi)星并每天對整個世界進行成像。我們最近發(fā)射的衛(wèi)星裝有 GPU,目的是在太空中運行 AI 模型,為了更快地傳送結(jié)果等。我同意你的看法,這很有挑戰(zhàn)性。我們現(xiàn)在每三個月發(fā)布一個新模型,而太空項目時間線要長得多。
但隨著模型發(fā)展,我的意思是,我們在向太空輸送更多能量方面做得越來越好?;鸺兊酶?,所以你可以發(fā)射更大的衛(wèi)星,更大的太陽能電池板,而模型變得更小,你可以更高效地運行它們。
我的答案是,一切都在朝著太空中有更多 AI 的方向發(fā)展,這是一個相當酷的結(jié)果。
奧特曼:第三個問題是要做一個具體的預(yù)測。如果我們談?wù)?2025 年地球上的總智能,所有人、協(xié)作、AI,就是地球上的總智力容量。我認為到 2035 年,如果進步的趨勢繼續(xù)下去,那么一個單獨的數(shù)據(jù)中心就會比地球當前的總智力容量更強大。
Q:我們知道訓(xùn)練 AI 模型需要大規(guī)模數(shù)據(jù)集,但是對于當時非常稀缺的數(shù)據(jù)集,OpenAI 推薦什么樣的策略來訓(xùn)練這樣的模型?
Kevin Weil:我們看到的一個有趣的現(xiàn)象是,隨著模型變得更智能,你需要更少的樣本來微調(diào)它們、讓它們學(xué)習新東西。這個趨勢正朝著正確的方向發(fā)展,非常智能的模型能夠通過更少的數(shù)據(jù)點來學(xué)習新領(lǐng)域。
創(chuàng)業(yè)、機器人和技術(shù)追趕
Q:我想創(chuàng)業(yè)。最重要的事情是什么?
奧特曼:在開始創(chuàng)業(yè)之前,我曾經(jīng)運營一個叫做 Y Combinator 的項目來幫助人們創(chuàng)業(yè)。我認為早期團隊成員最重要的是那些充滿能量、非常堅定的人。有一句 Paul Graham 的話叫做「be relentlessly resourceful」,這就是你需要尋找的特質(zhì)。初始團隊成員比任何具體專業(yè)知識都重要。新業(yè)務(wù)的早期階段非常困難,所以你需要有這種能量的人。
Kevin Weil:我同意這個觀點。我認為你會遇到各種各樣的事情,你需要那些靈活的人、那些不會放棄的人、很好的學(xué)習者,因為你會遇到你從未預(yù)料到的事情。所以你需要那些會說「哦,我能搞定這個,讓我去試試」的人。
Q:我們?nèi)绾文芙⒁唤M機器人,讓它們開發(fā)自己的語言來相互交流并培養(yǎng)屬于自己的文化?
奧特曼:我認為關(guān)鍵因素之一可能是將眼睛和耳朵整合到抽象思維框架中。現(xiàn)在第一批智能體開始上線,你開始看到人們在構(gòu)建一些東西,有些人稱之為群體,有些人稱之為團隊、智能體文明等。我預(yù)計它們會發(fā)展出新的交流和共享信息的方式。
它可能不會像科幻電影讓我們相信的那樣戲劇性和令人興奮,但它會發(fā)生,而且會起作用。我認為你不需要物理的眼睛和耳朵,但你確實需要良好的輸入輸出。我認為我們開始看到這一點了。這些多智能體的事情非常令人興奮。
Q:我主修電氣和電子工程,我正在準備與出版商合作開發(fā) AI 驅(qū)動的圖書搜索引擎??紤]到技術(shù)進步如此之快,感覺像 AI 或 LLM 這樣,我如何建立和保持競爭優(yōu)勢?
奧特曼:正常的商業(yè)規(guī)則仍然適用,你仍然需要找到能建立一些具有持久價值、粘性和差異化的東西。有很多創(chuàng)業(yè)公司說,好吧,我在使用 AI,所以這些規(guī)則不適用。但它總是適用的。否則,你將無法建立差異化。我認為關(guān)于創(chuàng)業(yè)最好的書仍然是 Peter Thiel 寫的《從 0 到 1》,現(xiàn)在可能已經(jīng)有 10 年了,但它在書中詳細討論了什么是長期競爭優(yōu)勢。
Kevin Weil:我引用 Sam 之前說過的話,就是當你談?wù)撊绾吾槍υ絹碓胶玫?AI 進行構(gòu)建時。你要建立的東西應(yīng)該處于前沿,真正推動模型能力的邊界。
如果你在建造某個東西,而你對我們的下一個模型發(fā)布感到緊張,因為它可能能夠做你正在做的事情,那說明不是一個好的位置。但如果你正在構(gòu)建某個東西,而你迫不及待地等待我們的下一個模型發(fā)布,因為你正處于能力的邊緣,我們下一個更智能的模型發(fā)布會讓你的產(chǎn)品變得更棒,那就是一個好位置。