從DeepSeek到Manus,國產(chǎn)Agent也起飛了
昨天,一款由中國團隊研發(fā)的全球首款通用型 AI Agent,憑借其強大的自主執(zhí)行能力和廣泛的應用場景,迅速成為 AI 領(lǐng)域的焦點。
圖片
看了官網(wǎng)的演示,給我的感受是,人機交互效率又向前邁進了一大步。
比如,以前你讓AI寫某個話題的文章,一般會分幾個步驟,先生成大綱、再生成每個子標題,最后生成每個段落。
現(xiàn)在有了這樣的Agent,你把需求告訴它,它就可以自動完成上面這些步驟,生成一篇完整的長文。
你會發(fā)現(xiàn)從OpenAI的o1到DeepSeek的R1,從OpenAI的DeepResearch到Manus,他們都有一個共同特點,模型主動思考的越來越多,同樣帶來的好處是需要人類做的事情越來越少。
這次的 Manus 性能上也不甘示弱,在 GAIA 評測中超過 DeepResearch
圖片
GAIA 是評估通用人工智能助手解決現(xiàn)實世界問題的基準。
Manus 官網(wǎng)展示了很多優(yōu)秀的示例
圖片
涉及研究、購物、數(shù)據(jù)分析、旅行各種示例,點進去可以看 Manus 完整的工作流程。
為了方便大家學習這類通用Agent的工作原理,我在 GitHub 找到一個復現(xiàn) DeepResearch 的開源項目,簡單分析一下。
項目名是 nickscamara/open-deep-research
圖片
選它,是因為它的工作過程跟 Manus、DeepResearch 非常像。
圖片
它會根據(jù)給定話題聯(lián)網(wǎng)搜索(search)-> 提取搜索的網(wǎng)頁內(nèi)容(extractFromUrls)-> 將內(nèi)容發(fā)送給大模型提煉答案,并判斷結(jié)束還是生成繼續(xù)探索的話題(analyzeAndPlan)。
不斷重復(while)上述過程,知道話題結(jié)束,或者達到最大探索深度和時間。
這個開源項目已經(jīng)有 4.8k 關(guān)注,還是挺不錯的,感興趣的朋友,可以下載源碼學習。
圖片