AI大神Andrej Karpathy:OpenAI Operator預(yù)示著AI智能體的未來(lái),但仍需突破!
各位小伙伴,最近 OpenAI 發(fā)布了 Operator 的研究預(yù)覽版,這是一個(gè)可以使用自己的瀏覽器為你執(zhí)行任務(wù)的 AI 代理,引起了廣泛關(guān)注。今天,我們來(lái)聽(tīng)聽(tīng) AI 大神 Andrej Karpathy 對(duì)此的看法。他不僅深度參與了 OpenAI 的早期項(xiàng)目,還對(duì) AI 的發(fā)展有著深刻的見(jiàn)解。
文章要點(diǎn)總結(jié):
- ?Operator 的類比:Karpathy 將 OpenAI 的 Operator 比作數(shù)字世界的人形機(jī)器人,兩者都是通用的系統(tǒng),能夠通過(guò)接口(鍵盤鼠標(biāo)或人體)執(zhí)行各種任務(wù)。
- ?混合自主的未來(lái):這類 AI 的出現(xiàn)將導(dǎo)致一個(gè)混合自主的世界,人類將扮演高級(jí)監(jiān)督者的角色,而 AI 則負(fù)責(zé)低級(jí)自動(dòng)化。
- ?數(shù)字世界的優(yōu)勢(shì):由于數(shù)字世界的操作成本遠(yuǎn)低于物理世界,這種變革在數(shù)字世界發(fā)生的速度會(huì)更快。
- ?技術(shù)挑戰(zhàn):雖然前景廣闊,但目前技術(shù)仍存在挑戰(zhàn),特別是多模態(tài)信息處理和長(zhǎng)期任務(wù)規(guī)劃。
- ?長(zhǎng)期愿景:Karpathy 認(rèn)為未來(lái)是智能體的時(shí)代,我們可以通過(guò)智能體完成各種復(fù)雜的任務(wù),甚至運(yùn)營(yíng)整個(gè)公司。
- ?長(zhǎng)期發(fā)展:他預(yù)測(cè) 2025-2035 年將是智能體的十年,雖然目前仍有許多工作要做,但未來(lái)可期。
以下為 Karpathy 評(píng)論的中文翻譯:
像 OpenAI 的 Operator 這樣的項(xiàng)目之于數(shù)字世界,正如人形機(jī)器人之于物理世界。一個(gè)通用的設(shè)置(監(jiān)控鍵盤和鼠標(biāo),或人體),原則上可以通過(guò)最初為人類設(shè)計(jì)的 I/O 接口,逐步執(zhí)行任意通用的任務(wù)。在這兩種情況下,都會(huì)導(dǎo)致一個(gè)逐漸混合的自主世界,人類成為低級(jí)自動(dòng)化的更高級(jí)別監(jiān)督者。有點(diǎn)像司機(jī)監(jiān)控自動(dòng)駕駛儀。這在數(shù)字世界中發(fā)生的速度會(huì)比物理世界快,因?yàn)榉D(zhuǎn)比特的成本比移動(dòng)原子的成本低大約 1000 倍。盡管物理世界的市場(chǎng)規(guī)模和機(jī)會(huì)感覺(jué)要大得多。
我們實(shí)際上在 OpenAI 的早期就研究過(guò)這個(gè)想法(參見(jiàn) Universe 和 World of Bits 項(xiàng)目),但它的順序不正確 - LLM 必須先出現(xiàn)。即使現(xiàn)在我也不敢 100% 確定它是否準(zhǔn)備好了。多模態(tài)(圖像、視頻、音頻)在過(guò)去一兩年才剛剛與 LLM 集成,通常是作為適配器附加的。更糟糕的是,我們還沒(méi)有真正涉足非常非常長(zhǎng)的任務(wù)周期。例如,視頻包含了大量信息,我不確定我們是否可以期望將所有信息都塞進(jìn)上下文窗口(目前的范式),然后期望它也能工作。我想象這里可能需要一兩個(gè)突破,舉個(gè)例子。
我時(shí)間線上的人們都在說(shuō) 2025 年是智能體之年。我個(gè)人認(rèn)為 2025-2035 年是智能體的十年。我覺(jué)得要讓它真正發(fā)揮作用,還需要在各個(gè)方面做大量工作。但它應(yīng)該能行。今天,Operator 可以幫你從 DoorDash 上找午餐,或查看酒店等,有時(shí)可以,也許可以。明天,你將為自己選擇的長(zhǎng)期任務(wù)啟動(dòng) Operators 組織(例如運(yùn)營(yíng)一家公司)。你可以像一位 CEO 一樣同時(shí)監(jiān)控 10 個(gè) Operators,有時(shí)可能會(huì)深入到具體工作中來(lái)解決一些問(wèn)題。事情將會(huì)變得非常有趣。
文章解讀:
Karpathy 的評(píng)論清晰地指出了 OpenAI Operator 的重要意義,以及它在未來(lái)可能扮演的角色。 他認(rèn)為 Operator 不僅僅是一個(gè)工具,而是一個(gè)變革的開(kāi)端,標(biāo)志著 AI 從簡(jiǎn)單的任務(wù)處理向更復(fù)雜的自主行動(dòng)轉(zhuǎn)變。 這也是一種 AI 智能體的雛形。
然而,他也強(qiáng)調(diào)了目前存在的技術(shù)挑戰(zhàn),比如如何處理多模態(tài)信息,以及如何讓 AI 理解和執(zhí)行長(zhǎng)期的復(fù)雜任務(wù)。 這些問(wèn)題都需要進(jìn)一步的研究和突破。
總結(jié):
Karpathy 的觀點(diǎn)為我們理解 OpenAI Operator 提供了一個(gè)重要的視角。它不僅揭示了這項(xiàng)技術(shù)的前景,也指出了未來(lái)發(fā)展中需要克服的挑戰(zhàn)。 雖然我們目前仍處于 AI 智能體發(fā)展的早期階段,但它未來(lái)的潛力是巨大的,值得我們期待。
本文轉(zhuǎn)載自 ??草臺(tái)AI??,作者: RangerEx
