自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里! 原創(chuàng)

發(fā)布于 2025-3-10 18:42
瀏覽
0收藏

出品 | 51CTO技術棧(微信號:blog51cto)

上周四,一款非常令人迷惑不解的現(xiàn)象級產品,只用了一天時間,就把“封神”和“打臉”兩種滋味都嘗了個遍。

這款號稱全球首個“通用代理”人工智能平臺,于上周預覽推出,其引發(fā)的關注度席卷了整個技術圈。

Hugging Face 的產品負責人稱 Manus 是“我嘗試過的最令人印象深刻的人工智能工具”。人工智能政策研究員 Dean Ball將Manus 描述為“使用人工智能的最復雜的計算機”。

不過很快就有人就質疑Manus背后的創(chuàng)新水平“實屬套殼”,懷疑其在通過一場Demo 來做饑餓營銷。據(jù)說,Manus的官方 Discord 服務器在短短幾天內就增長到超過 138,000 名成員,據(jù)報道,Manus 的邀請碼在中國閑魚上高達10萬元的的價格出售。

緊接著,很快就有年輕的中國團隊,花了3個小時就手搓出了一個簡易的“Open”版本的 Manus,贏得了業(yè)內的一致點贊。

有關 Manus 和 OpenManus,相信會有不少朋友不清楚它們各自的來歷、理念、實現(xiàn)路線和爭議點。這里為大家梳理一下,希望能有所幫助。

Manus的理念究竟是什么鬼?

打開Manus官網(wǎng),就會有個醒目的slogan: “Less Structure, More Intelligence”。


翻譯過來就是,更簡化的架構、更聰明的智能。不過大眾們似乎把這一點也看成了套殼炒作的證據(jù)之一,一度被戲稱:“Less Structure, More Hype”。

谷歌和OpenAI率先推出了基于其深度推理模型來賦能Agent的前沿工作,例如DeepResearch、Operator等。

或Claude的MCP協(xié)議對工具使用領域的革新,Manus的技術突破相對有限。

它的主要創(chuàng)新點是借助推理模型實現(xiàn)了簡化結構,同時增強智能處理能力的設計。 

這也就是媒體人楊遠騁Koji發(fā)布的據(jù)說來自Manus團隊內部的“Less Structure, More Intelligence”理念。 

Manus是縫合怪嗎?

Manus 并非完全從零開始開發(fā)。據(jù)社交媒體報道,該平臺結合使用現(xiàn)有和經過微調的 AI 模型,包括 Anthropic 的 Claude 和阿里巴巴的 Qwen,來執(zhí)行起草研究報告和分析財務文件等任務。

然而,Manus 背后給出了該平臺據(jù)稱可以實現(xiàn)的非常多的例子,從買房咨詢到編程視頻游戲。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

不過用例如此之多的“通用”Agent,在業(yè)內人士看來,不過是一個產品“縫合怪”。

功能上,Manus 可以被看成是一個整合了 Computer use、虛擬機、Multi agent 協(xié)同的產品。

而在技術實現(xiàn)上,原理也并沒有特別新鮮,據(jù)業(yè)內人士預測,Manus是基于 Claude 模型生成能力、開源模型后訓練增強的規(guī)劃能力,再結合各種預制的 Agent,按照設定好的工作流:構建 todo 清單、新建虛擬機環(huán)境、調用工具、結果整合、自我檢查、輸出結果,來解決任務。

原理沒有太多的創(chuàng)新,但Manus的能夠實現(xiàn)的功能多樣性、豐富細致的程度也是為外界所稱道的,這背后需要做極大的工程任務。

整合的工作量這么多,背后有什么通用的技術??梢宰龀蛇@件事嗎?業(yè)內專家認為Manus很有可能是基于 MCP(模型上下文協(xié)議)的聚合模式。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

不過,剛剛季逸超在X回應:Manus 并沒有使用 Claude 的 MCP,靈感更多還是來自于朋友,不過沒有完全采用 CodeAct。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

Manus的架構揭秘:運行在沙盒中的多Agent任務

有專家從Manus演示實例分析認為,Manus有效整合了DeepResearch、Artifacts和Operator三大現(xiàn)有能力。

據(jù)媒體引用但未出現(xiàn)在Manus官網(wǎng)上的官方資料稱,Manus AI 使用一套名為“Multiple Agent”的架構,運行在獨立的虛擬機中。通過規(guī)劃代理、執(zhí)行代理、驗證代理的分工協(xié)作機制,來大幅提升對復雜任務的處理效率,并通過并行計算縮短響應時間。

在這個架構中,每個代理可能基于獨立的語言模型或強化學習模型,彼此通過 API 或消息隊列通信。同時每個任務也都在沙盒中運行,避免干擾其他任務,同時支持云端擴展。每個獨立模型都能模仿人類處理任務的流程,比如先思考和規(guī)劃,理解復雜指令并拆解為可執(zhí)行的步驟,再調用合適的工具。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

據(jù)OpenManus 和 OWL 以及部分信息源得知,從當前Manus可以執(zhí)行的操作和其技術描述來看,其AI架構與工作流其實并不難實現(xiàn),很容易重構——它很有可能是三個相關功能的串聯(lián),由一個主腦做步驟調配。

當然也有可能根本不需要主腦,以規(guī)劃代理同時承擔工作協(xié)調的能力。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

在Manus的解釋中,除了瀏覽網(wǎng)頁用到了Computer Use(計算機使用)之外,它在虛擬機中的計算機應用并不多。這也是 MIT 博士 Zengyi Qin 認為它在無邊界操作系統(tǒng)級環(huán)境(open-ended OS Level environment)中未取得突破的原因。

在能力層,它只不過這個工作流當前各個節(jié)點的能力大幅增強了,而其負責規(guī)劃的主腦也進化成了可以分布拆解和發(fā)起任務的推理模型。

而其代理層及模型層架構中與DeepResearch和Artifact能力的重疊基本是100%的(圖像瀏覽用了一些Operator能力)。

因此官網(wǎng)上介紹的智能研究、高級數(shù)據(jù)分析、任務自動化三大功能其實也就是Manus的極限了。

Manus跟Operator對標科學嗎?

在 X 上的一段熱門視頻中,Manus 的研究負責人季逸超暗示該平臺優(yōu)于 OpenAI 的深度研究和Operator等代理工具。

季逸超聲稱,Manus 在通用人工智能助手的流行基準 GAIA 上的表現(xiàn)優(yōu)于深度研究,GAIA 可探測人工智能通過瀏覽網(wǎng)頁、使用軟件等方式開展工作的能力。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

論文中指出,GAIA 測試根據(jù)解決問題所需的步驟數(shù)量以及回答問題所需的工具種類被分為三個遞增的難度級別。大致使用以下定義來為問題分配難度級別:

  • 一級問題:通常不需要工具,或者最多需要一個工具,且不超過5個步驟。
  • 二級問題:通常涉及更多步驟,大約在5到10步之間,并且需要結合使用不同的工具。
  • 三級問題:是為近乎完美的通用助手設計的問題,需要執(zhí)行任意長度的動作序列,使用任意數(shù)量的工具,并且能夠訪問整個世界。

為了形象的理解問題的難度,可以看下面的這個例子:

一級問題

問題:根據(jù)美國國立衛(wèi)生研究院(NIH)網(wǎng)站列出的信息,2018年1月至5月期間針對痤瘡患者進行的幽門螺桿菌臨床試驗的實際入組人數(shù)是多少?
真實答案:90

二級問題

問題:如果這一整品脫全是冰淇淋,那么根據(jù)維基百科2020年報告的標準,其脂肪含量比美國聯(lián)邦標準高出或低了多少百分比?請以正數(shù)或負數(shù)的形式回答,并保留一位小數(shù)。
真實答案:+4.6

三級問題

問題:在2006年1月21日美國國家航空航天局(NASA)的“每日天文圖片”中,可以看到兩名宇航員,其中一名看起來比另一名小得多。截至2023年8月,在這名較小宇航員所屬的NASA宇航員團隊中,哪位宇航員在太空停留的時間最少?他在太空停留了多少分鐘(四舍五入到最近的整數(shù))?不包括那些從未進入過太空的宇航員。請給出該宇航員的姓氏,并用分號與分鐘數(shù)隔開。
真實答案:White; 5876

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)GAIA 樣例問題

不過這里需要注意的是,OpenAI 的 DeepResearch 主要用于深度研究領域的,主打一個"AI研究員"的功能,能夠自主分析復雜的專業(yè)信息,實時查找和綜合數(shù)百個在線資源,最終生成一份專業(yè)水準的完整報告。

而 Manus 則覆蓋了更廣的任務范疇,而 DeepResearch 主要用途則是報告生成。所以這本就是一場不公平的對比。

Manus的早期用戶反饋

然而在用戶實際測試使用中,即便是與DeepResearch對比,有網(wǎng)友表示 Manus 效果并不好:

Deep Research 在不到15分鐘內完成了。不幸的是,Manus AI在第18/20步時失敗了,耗時50分鐘!?? 它之前表現(xiàn)得相當不錯——我一直在查看Manus的輸出結果,看起來非常出色。然而,再次運行相同的指令時就有點令人沮喪了,因為它耗時太長!

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

當然,讓人吐槽更多的地方還有很多。

一家AI初創(chuàng)公司 Pleias 的聯(lián)合創(chuàng)始人亞歷山大·多里亞在一篇 X 帖子中表示,他在測試 Manus 時遇到了錯誤消息和無限循環(huán)。一些 X 用戶還指出,Manus 在事實問題上犯了錯誤,并且沒有始終如一地引用其工作——并且經常錯過在網(wǎng)上很容易找到的信息。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

據(jù)國內不少媒體的實測直播的反饋來看,慢、卡頓、幻覺都是普遍反映的問題。不過,正如一位媒體記者所說的:雖然性能有待提升,但 Manus 帶來的智能體產品體驗可以說是獨一份的。

OpenManus是如何實現(xiàn)復刻的

MetaGPT團隊在上周五一場直播中公開了自己當時開發(fā)OpenManus的設想。

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

“兩個月前的一次邊吃飯邊頭腦風暴的過程中,我們想到,一個極簡的 Agent 框架,應該是可插拔的 Tools 和 System Prompt 的組合,之后我們沿著這個思路,寫了一個完整的 Agent 迷你框架。

前天晚上看到 Manus 時,凌晨就和同事商量,下班后的晚上就可以搞一個,應該 3 小時夠了?!?/p>

這里,需要解釋下為什么他們會采用可插拔的 Tools 和 System Prompt,原因在于——決定一個 ReAct Agent( 結合了反應和行動規(guī)劃能力的智能體 )的效果的關鍵是 Prompt 和 Action,Prompt 控制了 Agent 整體的行為邏輯,Tools 給定了 Agent 的行動空間,二者被定義就能完整詮釋一個 ReAct Agent。

其次,可插拔的優(yōu)點是可組合,這樣就可以把幾個不同場景下的 Tools 組合到一起來創(chuàng)造一個新的 Agent,定義也很方便,不需要單獨寫內部邏輯,只需要修改動作空間( Tools )。Tools 本身就該是可組合的。

“我們的工作是把抽象做得更干凈,目前 HuggingFace 的 Smolagents 也是類似的思路了。Manus 效果上讓大家覺得很新奇,實際上主要是由于 Browser Use 和 Computer Use 的使用,所以只要給了 Agent 這兩個工具,那它就都能做到?!?/p>

OpenManus公開的技術路線

大家可以從Github上的演示視頻可以看出,OpenManus展示的結果遠不如 Manus 那么細致和豐富。

OpenManus的一位貢獻者梁新兵也坦承:OpenManus 目前功能還很初級,畢竟只花費3個小時手搓的時間,還需要很多后續(xù)的工作。不過這項不需要邀請碼的開源之作已經公開了后續(xù)的開發(fā)路線。照這個路線,基本上全面復刻 Manus 不是問題:

? 更優(yōu)的規(guī)劃系統(tǒng)

? 實時演示功能

? 運行回放

? 強化學習微調模型

? 全面的性能基準測試

智能體:通用和垂直,哪個更靠譜?

楊遠騁Koji 曾在第一時間連線參加了 Manus 的小范圍溝通會。曾透露了一些不為外人知的細節(jié):比如 Manus 打榜超過了OpenAI,季逸超 Peak 淚灑辦公室,再比如 Manus 的單任務成本,僅僅只有 2 美刀,并且還有優(yōu)化的空間。

但這里,小編認為還有一個業(yè)界的非共識需要探討:在 Manus 看來,做垂直領域的AI Agent “可能有點不靠譜”,理由是——Manus 打敗了 YC W25 幾乎 3/4 的 Agent 創(chuàng)業(yè)產品。 

通用Agent活不久?套殼與破解……關于Manus和OpenManus,這些質疑的答案及回應,在這里!-AI.x社區(qū)圖片

然而,就在上周四我們在欄目“AI實戰(zhàn)派”中與一位大廠大模型應用算法專家李明錦進行了探討。他認為,個人并不看好通用 Agent 的創(chuàng)業(yè)。

一方面,雖然市面上不乏BABY AGI、XAgent、LangChain、AUTO Gen 等類似的產品, 這些框架其實很早就提出來了,但是真正用于生產環(huán)境確實很少,所以本質上該類產品的核心還是在于對垂類任務的分解。另一方面,只有將 Agent 面相企業(yè)生產環(huán)境做到定制話,才有可能令其買單。所以說智能體的趨勢一定是垂類、定制畫的。通用 Agent 對于創(chuàng)業(yè)團隊而言,人員有限,很難有精力把所有這些任務都cover 到。

“如果我來主導 Manus 這個項目,我就把它開源!”

?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
收藏
回復
舉報
回復
相關推薦