不到24小時(shí),開源版Deep Research瘋狂來襲!一月少花1400
昨日,AI 社區(qū)最大的新聞當(dāng)屬 OpenAI 發(fā)布的全新智能體 Deep Research 了!
作為一個(gè)使用推理來綜合大量在線信息并為用戶完成多步驟研究任務(wù)的智能體,Deep Research 旨在幫助用戶進(jìn)行深入、復(fù)雜的信息查詢與分析。
顯然,對(duì)于那些在金融、科學(xué)、政策和工程等領(lǐng)域從事密集知識(shí)工作并需要徹底、精確和可靠研究的用戶而言,Deep Research 稱得上研究神器了。
項(xiàng)目負(fù)責(zé)人之一 Zhiqing Sun(孫之清)本科畢業(yè)于北京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系。2019 年起在 CMU 語言技術(shù)研究所攻讀博士學(xué)位,現(xiàn)為 OpenAI 研究科學(xué)家。
遺憾的是,Deep Research 目前僅供 Pro 訂閱用戶使用,每月 200 美元著實(shí)令很多人望而卻步。
所以,在 Deep Research 發(fā)布之后,各種開源復(fù)現(xiàn)版本紛至沓來。
從 OpenAI 發(fā)布的官方博客來看,Deep Research 用到了端到端的強(qiáng)化學(xué)習(xí),并且在多個(gè)領(lǐng)域的復(fù)雜瀏覽和推理任務(wù)上進(jìn)行了訓(xùn)練,因此才有了現(xiàn)在的性能。
其實(shí),早在去年,來自字節(jié)跳動(dòng) ByteDance Research 的研究人員就提出了基于強(qiáng)化學(xué)習(xí)(Reinforcement Learning, RL)的 LLM Agent 框架 ——AGILE。該研究已被NeurIPS接收,這應(yīng)該是學(xué)術(shù)界第一個(gè)用強(qiáng)化學(xué)習(xí)做Agent的端到端訓(xùn)練的工作。了解更多內(nèi)容可以參考機(jī)器之心此前報(bào)道《端到端優(yōu)化所有能力,字節(jié)跳動(dòng)提出強(qiáng)化學(xué)習(xí)LLM Agent框架AGILE》。
接下來,我們看看在一天之內(nèi),都有哪些 Deep Research開源復(fù)現(xiàn)項(xiàng)目。
一、Open Deep Research
其中一個(gè)開源復(fù)現(xiàn)版本為「Open Deep Research」。
項(xiàng)目地址:https://github.com/nickscamara/open-deep-research
具體而言,Open Deep Research 是一個(gè) AI 智能體,可以對(duì)大量的 web 數(shù)據(jù)進(jìn)行推理,該方法沒有使用 o3 的微調(diào)版本,而是使用了爬蟲工具 Firecrawl 的提取 + 搜索功能以及推理模型來深入研究網(wǎng)絡(luò)。
項(xiàng)目主頁還放出了 demo 展示,我們可以發(fā)現(xiàn),在詢問 Open Deep Research 關(guān)于「2025 年 B2B 領(lǐng)域最大的創(chuàng)業(yè)機(jī)會(huì)」時(shí),Open Deep Research 給出了思考過程,答案也相當(dāng)完美。
根據(jù)項(xiàng)目介紹,我們可以得知 Open Deep Research 背后默認(rèn)的模型為 gpt-4o,如果你想換個(gè)其他模型使用也是可以的,只需幾行代碼即可切換為 Anthropic、Cohere 等發(fā)布的模型。
二、OpenDeepResearcher
另外一個(gè)比較熱門的復(fù)現(xiàn)項(xiàng)目為「OpenDeepResearcher」。
項(xiàng)目地址:https://github.com/mshumer/OpenDeepResearcher
作為一個(gè)開源的 AI 智能體,OpenDeepResearcher 可以提供全面的研究。用戶只需提供一個(gè)主題,該智能體就會(huì)展開研究,并返回一份綜合報(bào)告。
其工作過程非常簡單,對(duì)于給定的查詢,OpenDeepResearcher 執(zhí)行以下步驟:
- 執(zhí)行搜索,查看結(jié)果頁面,并提取重要信息;
- 如果它想深入了解,其可以重復(fù)此過程,并提出新的查詢;
- 完成后,它會(huì)使用上下文生成報(bào)告。
三、node-DeepResearch
最后一個(gè)復(fù)現(xiàn)項(xiàng)目是「node-DeepResearch」,它是由 Jina AI CEO 肖涵(Han Xiao)創(chuàng)建。
他表示,OpenAI 的 Deep Research 只是在 while 循環(huán)中進(jìn)行「搜索 + 讀取 + 推理」。他在 nodejs 運(yùn)行環(huán)境中,使用谷歌 gemini-flash 和 jina reader(Jina AI 推出的開源工具,將互聯(lián)網(wǎng)上的 HTML 網(wǎng)頁內(nèi)容轉(zhuǎn)換為適合 LLM 處理的純文本格式)進(jìn)行了復(fù)現(xiàn)。
我們來看下運(yùn)行效果。
下面是「jina ai 最新博客文章內(nèi)容是什么」(what is the latest blog post from jina ai)的 2/3 步搜索示例:首先找到 jina ai 新聞網(wǎng)站、閱讀其內(nèi)容,然后確定最新帖子內(nèi)容。
下面視頻是關(guān)于「who is the biggest, cohere, jina ai, voyage」的 13 步查詢,經(jīng)過搜索、反饋、循環(huán)之后,結(jié)果是正確的(cohere)。這里視頻 2 倍加速。
對(duì)于 node-DeepResearch,顯然缺少了微調(diào) o3 推理模型的支持。
有人認(rèn)為,這個(gè)項(xiàng)目實(shí)現(xiàn)了 OpenAI 準(zhǔn)備了半年多的東西所做到的功能。還有人呼吁,趕緊把 UI 做得漂亮一點(diǎn)。
目前,該項(xiàng)目已經(jīng)收獲了近 700 個(gè) Stars。
項(xiàng)目地址:https://github.com/jina-ai/node-DeepResearch
相信后續(xù)會(huì)有更多類似的開源智能體項(xiàng)目出來。