OpenAI 最近悄無聲息地推出了另一個代理框架,說實話,這玩意兒有點酷
老實說,我們早就習慣了 OpenAI 夸大承諾、交付平平的套路。記得當年他們推出 Sora 時,夸下??诜Q這技術會讓好萊塢徹底顛覆,用戶只需對 Netflix 描述想看的內容,一部完整的電視劇便能在 11 分半鐘內生成。結果自然沒能兌現(xiàn)那些狂言。
但顯然,有什么東西在某個時刻讓 Sam Altman 真正心生畏懼。也許是因為 DeepSeek 的革命性 R1 模型——目前來看,這已經是最強的開源大規(guī)模推理模型;也可能是因為 OpenAI 的投資人對舊有的 Operator(那款基于瀏覽器的 AI 框架)早已膩味;或者,Altman 只是做了個惡夢。
不論原因如何,Sam 的內心發(fā)生了變化,對所有 AI 愛好者來說,這無疑是個福音。
因為 OpenAI 剛剛低調上線了 Deep Research。這東西,真是他媽的贊!
什么是 Deep Research?
Deep Research 是目前見過的第一個真正落地的“AI 代理”應用。你只需交給它一個復雜且費時的任務,它便會全權自主地完成調研工作,還附帶權威引用。對于個人和企業(yè)而言,這簡直是個神器。
試想一下,第一次能讓 AI 替你搞定復雜任務,你離開電腦一會兒,再回來就能拿到一份詳盡報告,里面正中你下懷的信息。
真實調研案例
以前用 OpenAI 推出的 Operator(那套瀏覽器代理框架)時,我曾給它布置過這樣的任務:
任務:尋找金融領域的意見領袖
- 收集 50 位在 YouTube 上頗有影響力的金融博主。
- 盡可能找到他們的 LinkedIn 信息、郵箱,并簡單概括各自頻道的主要內容。
- 最后將結果整理成表格。
結果呢?Operator 完全掛了:
- 它胡編亂造,給出了一些根本不存在的 LinkedIn 賬號和郵箱;
- 反應極其遲鈍;
- 整個過程毫無策略可言。
正因為這個經歷,我對 Deep Research 的期待并不高。畢竟,與 Operator 不同,Deep Research 是全自動、異步運行的。它不需要打開瀏覽器逐個點擊網站,而是通過爬蟲在網上搜索,這使得它速度更快,而且看起來也更精準。
于是決定給 Deep Research 布置一個更高難度的任務:
任務:幫我找網紅
這次不只局限于 YouTube,而是要求它同時從 LinkedIn、YouTube 和 Instagram 三個平臺中篩選。
出乎意料的是,它居然主動問了我?guī)讉€后續(xù)問題:比如我是否希望優(yōu)先某個平臺,或者對粉絲數(shù)量有何要求。說實話,我當時既驚訝又有點佩服。
接著,我給出了具體要求,但接下來卻陷入了“沉默”。
它回復說:“等準備好了再通知你?!?br>作為一個自 GPT-3 時代起就接觸 AI 的老兵,這種回應風格頗為新鮮。
于是,喝了一杯瑞幸,十分鐘后回到電腦前,看到了一份震撼的電子表格——上面列出了 100 位網紅,每個名字旁邊都帶有直達其資料頁面的鏈接。點開幾個鏈接驗證后,發(fā)現(xiàn)這些數(shù)據(jù) 100% 真實,沒有一絲幻覺。
111111111
想象一下這背后的無限可能。我已經搭建了 NexusTrade,這是一個為散戶投資者提供交易策略創(chuàng)建和金融調研的平臺。如果把 Deep Research 技術融入其中,會不會有一個專門為算法交易打造的調研神器出現(xiàn)呢?
舉個例子
設想你給 NexusTrade 的 AI 傳遞你的風險承受度、鐘愛的股票、交易頻率以及自身的交易水平,然后它靜默運行 20 分鐘后,回饋一份詳細的、利潤豐厚的交易策略清單。這種場景幾乎讓人感到未來來臨,充滿無限可能。
總結
僅僅試用了這款工具 15 分鐘,我就能感覺到 OpenAI 的實力再一次升級。他們推動智能代理工具普及的愿景,已不再是童話。雖然我仍然懷疑代理工具是否會像他們預期的那樣無處不在,但在潛在客戶挖掘這塊,Deep Research 簡直是天降神兵。
總的來說,我現(xiàn)在對它充滿期待。畢竟,不是每天都能看到全球最大 AI 巨頭發(fā)布這樣新奇的工具。我也迫不及待地想知道其他人會拿它干出什么花樣,以及像 Meta 和 DeepSeek 這樣的開源巨頭會如何將這項技術融入到他們的產品中。
如果你覺得 AI 熱潮正在退散,那 OpenAI 剛剛就給你上了一課。
已授權,原文:https://medium.com/@austin-starks/openai-just-quietly-released-another-agentic-framework-its-really-fucking-cool-241ea35b6a94