自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="fwr5f"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

通用Agent活不久？套殼與破解……關(guān)于Manus和OpenManus，這些質(zhì)疑的答案及回應(yīng)，在這里！

原創(chuàng) 精選

2025-03-10 18:43:12

Manus 并非完全從零開始開發(fā)。據(jù)社交媒體報(bào)道，該平臺(tái)結(jié)合使用現(xiàn)有和經(jīng)過微調(diào)的 AI 模型，包括 Anthropic 的 Claude 和阿里巴巴的 Qwen，來執(zhí)行起草研究報(bào)告和分析財(cái)務(wù)文件等任務(wù)。

出品 | 51CTO技術(shù)棧（微信號(hào)：blog51cto）

上周四，一款非常令人迷惑不解的現(xiàn)象級(jí)產(chǎn)品，只用了一天時(shí)間，就把“封神”和“打臉”兩種滋味都嘗了個(gè)遍。

這款號(hào)稱全球首個(gè)“通用代理”人工智能平臺(tái)，于上周預(yù)覽推出，其引發(fā)的關(guān)注度席卷了整個(gè)技術(shù)圈。

Hugging Face 的產(chǎn)品負(fù)責(zé)人稱 Manus 是“我嘗試過的最令人印象深刻的人工智能工具”。人工智能政策研究員 Dean Ball將Manus 描述為“使用人工智能的最復(fù)雜的計(jì)算機(jī)”。

不過很快就有人就質(zhì)疑Manus背后的創(chuàng)新水平“實(shí)屬套殼”，懷疑其在通過一場(chǎng)Demo 來做饑餓營銷。據(jù)說，Manus的官方 Discord 服務(wù)器在短短幾天內(nèi)就增長到超過 138,000 名成員，據(jù)報(bào)道，Manus 的邀請(qǐng)碼在中國閑魚上高達(dá)10萬元的的價(jià)格出售。

緊接著，很快就有年輕的中國團(tuán)隊(duì)，花了3個(gè)小時(shí)就手搓出了一個(gè)簡易的“Open”版本的 Manus，贏得了業(yè)內(nèi)的一致點(diǎn)贊。

有關(guān) Manus 和 OpenManus，相信會(huì)有不少朋友不清楚它們各自的來歷、理念、實(shí)現(xiàn)路線和爭議點(diǎn)。這里為大家梳理一下，希望能有所幫助。

Manus的理念究竟是什么鬼？

打開Manus官網(wǎng)，就會(huì)有個(gè)醒目的slogan： “Less Structure, More Intelligence”。

翻譯過來就是，更簡化的架構(gòu)、更聰明的智能。不過大眾們似乎把這一點(diǎn)也看成了套殼炒作的證據(jù)之一，一度被戲稱：“Less Structure, More Hype”。

谷歌和OpenAI率先推出了基于其深度推理模型來賦能Agent的前沿工作，例如DeepResearch、Operator等。

或Claude的MCP協(xié)議對(duì)工具使用領(lǐng)域的革新，Manus的技術(shù)突破相對(duì)有限。

它的主要?jiǎng)?chuàng)新點(diǎn)是借助推理模型實(shí)現(xiàn)了簡化結(jié)構(gòu)，同時(shí)增強(qiáng)智能處理能力的設(shè)計(jì)。

這也就是媒體人楊遠(yuǎn)騁Koji發(fā)布的據(jù)說來自Manus團(tuán)隊(duì)內(nèi)部的“Less Structure, More Intelligence”理念。

Manus是縫合怪嗎？

Manus 并非完全從零開始開發(fā)。據(jù)社交媒體報(bào)道，該平臺(tái)結(jié)合使用現(xiàn)有和經(jīng)過微調(diào)的 AI 模型，包括 Anthropic 的 Claude 和阿里巴巴的 Qwen，來執(zhí)行起草研究報(bào)告和分析財(cái)務(wù)文件等任務(wù)。

然而，Manus 背后給出了該平臺(tái)據(jù)稱可以實(shí)現(xiàn)的非常多的例子，從買房咨詢到編程視頻游戲。

圖片

不過用例如此之多的“通用”Agent，在業(yè)內(nèi)人士看來，不過是一個(gè)產(chǎn)品“縫合怪”。

功能上，Manus 可以被看成是一個(gè)整合了 Computer use、虛擬機(jī)、Multi agent 協(xié)同的產(chǎn)品。

而在技術(shù)實(shí)現(xiàn)上，原理也并沒有特別新鮮，據(jù)業(yè)內(nèi)人士預(yù)測(cè)，Manus是基于 Claude 模型生成能力、開源模型后訓(xùn)練增強(qiáng)的規(guī)劃能力，再結(jié)合各種預(yù)制的 Agent，按照設(shè)定好的工作流：構(gòu)建 todo 清單、新建虛擬機(jī)環(huán)境、調(diào)用工具、結(jié)果整合、自我檢查、輸出結(jié)果，來解決任務(wù)。

原理沒有太多的創(chuàng)新，但Manus的能夠?qū)崿F(xiàn)的功能多樣性、豐富細(xì)致的程度也是為外界所稱道的，這背后需要做極大的工程任務(wù)。

整合的工作量這么多，背后有什么通用的技術(shù)?？梢宰龀蛇@件事嗎？業(yè)內(nèi)專家認(rèn)為Manus很有可能是基于 MCP（模型上下文協(xié)議）的聚合模式。

圖片

不過，剛剛季逸超在X回應(yīng)：Manus 并沒有使用 Claude 的 MCP，靈感更多還是來自于朋友，不過沒有完全采用 CodeAct。

圖片

Manus的架構(gòu)揭秘：運(yùn)行在沙盒中的多Agent任務(wù)

有專家從Manus演示實(shí)例分析認(rèn)為，Manus有效整合了DeepResearch、Artifacts和Operator三大現(xiàn)有能力。

據(jù)媒體引用但未出現(xiàn)在Manus官網(wǎng)上的官方資料稱，Manus AI 使用一套名為“Multiple Agent”的架構(gòu)，運(yùn)行在獨(dú)立的虛擬機(jī)中。通過規(guī)劃代理、執(zhí)行代理、驗(yàn)證代理的分工協(xié)作機(jī)制，來大幅提升對(duì)復(fù)雜任務(wù)的處理效率，并通過并行計(jì)算縮短響應(yīng)時(shí)間。

在這個(gè)架構(gòu)中，每個(gè)代理可能基于獨(dú)立的語言模型或強(qiáng)化學(xué)習(xí)模型，彼此通過 API 或消息隊(duì)列通信。同時(shí)每個(gè)任務(wù)也都在沙盒中運(yùn)行，避免干擾其他任務(wù)，同時(shí)支持云端擴(kuò)展。每個(gè)獨(dú)立模型都能模仿人類處理任務(wù)的流程，比如先思考和規(guī)劃，理解復(fù)雜指令并拆解為可執(zhí)行的步驟，再調(diào)用合適的工具。

圖片

據(jù)OpenManus 和 OWL 以及部分信息源得知，從當(dāng)前Manus可以執(zhí)行的操作和其技術(shù)描述來看，其AI架構(gòu)與工作流其實(shí)并不難實(shí)現(xiàn)，很容易重構(gòu)——它很有可能是三個(gè)相關(guān)功能的串聯(lián)，由一個(gè)主腦做步驟調(diào)配。

當(dāng)然也有可能根本不需要主腦，以規(guī)劃代理同時(shí)承擔(dān)工作協(xié)調(diào)的能力。

圖片

在Manus的解釋中，除了瀏覽網(wǎng)頁用到了Computer Use（計(jì)算機(jī)使用）之外，它在虛擬機(jī)中的計(jì)算機(jī)應(yīng)用并不多。這也是 MIT 博士 Zengyi Qin 認(rèn)為它在無邊界操作系統(tǒng)級(jí)環(huán)境（open-ended OS Level environment）中未取得突破的原因。

在能力層，它只不過這個(gè)工作流當(dāng)前各個(gè)節(jié)點(diǎn)的能力大幅增強(qiáng)了，而其負(fù)責(zé)規(guī)劃的主腦也進(jìn)化成了可以分布拆解和發(fā)起任務(wù)的推理模型。

而其代理層及模型層架構(gòu)中與DeepResearch和Artifact能力的重疊基本是100%的（圖像瀏覽用了一些Operator能力）。

因此官網(wǎng)上介紹的智能研究、高級(jí)數(shù)據(jù)分析、任務(wù)自動(dòng)化三大功能其實(shí)也就是Manus的極限了。

Manus跟Operator對(duì)標(biāo)科學(xué)嗎？

在 X 上的一段熱門視頻中，Manus 的研究負(fù)責(zé)人季逸超暗示該平臺(tái)優(yōu)于 OpenAI 的深度研究和Operator等代理工具。

季逸超聲稱，Manus 在通用人工智能助手的流行基準(zhǔn) GAIA 上的表現(xiàn)優(yōu)于深度研究，GAIA 可探測(cè)人工智能通過瀏覽網(wǎng)頁、使用軟件等方式開展工作的能力。

圖片

論文中指出，GAIA 測(cè)試根據(jù)解決問題所需的步驟數(shù)量以及回答問題所需的工具種類被分為三個(gè)遞增的難度級(jí)別。大致使用以下定義來為問題分配難度級(jí)別：

一級(jí)問題：通常不需要工具，或者最多需要一個(gè)工具，且不超過5個(gè)步驟。
二級(jí)問題：通常涉及更多步驟，大約在5到10步之間，并且需要結(jié)合使用不同的工具。
三級(jí)問題：是為近乎完美的通用助手設(shè)計(jì)的問題，需要執(zhí)行任意長度的動(dòng)作序列，使用任意數(shù)量的工具，并且能夠訪問整個(gè)世界。

為了形象的理解問題的難度，可以看下面的這個(gè)例子：

一級(jí)問題

問題：根據(jù)美國國立衛(wèi)生研究院（NIH）網(wǎng)站列出的信息，2018年1月至5月期間針對(duì)痤瘡患者進(jìn)行的幽門螺桿菌臨床試驗(yàn)的實(shí)際入組人數(shù)是多少？
真實(shí)答案：90

二級(jí)問題

問題：如果這一整品脫全是冰淇淋，那么根據(jù)維基百科2020年報(bào)告的標(biāo)準(zhǔn)，其脂肪含量比美國聯(lián)邦標(biāo)準(zhǔn)高出或低了多少百分比？請(qǐng)以正數(shù)或負(fù)數(shù)的形式回答，并保留一位小數(shù)。
真實(shí)答案：+4.6

三級(jí)問題

問題：在2006年1月21日美國國家航空航天局（NASA）的“每日天文圖片”中，可以看到兩名宇航員，其中一名看起來比另一名小得多。截至2023年8月，在這名較小宇航員所屬的NASA宇航員團(tuán)隊(duì)中，哪位宇航員在太空停留的時(shí)間最少？他在太空停留了多少分鐘（四舍五入到最近的整數(shù)）？不包括那些從未進(jìn)入過太空的宇航員。請(qǐng)給出該宇航員的姓氏，并用分號(hào)與分鐘數(shù)隔開。
真實(shí)答案：White; 5876

GAIA 樣例問題

不過這里需要注意的是，OpenAI 的 DeepResearch 主要用于深度研究領(lǐng)域的，主打一個(gè)"AI研究員"的功能，能夠自主分析復(fù)雜的專業(yè)信息，實(shí)時(shí)查找和綜合數(shù)百個(gè)在線資源，最終生成一份專業(yè)水準(zhǔn)的完整報(bào)告。

而 Manus 則覆蓋了更廣的任務(wù)范疇，而 DeepResearch 主要用途則是報(bào)告生成。所以這本就是一場(chǎng)不公平的對(duì)比。

Manus的早期用戶反饋

然而在用戶實(shí)際測(cè)試使用中，即便是與DeepResearch對(duì)比，有網(wǎng)友表示 Manus 效果并不好：

Deep Research 在不到15分鐘內(nèi)完成了。不幸的是，Manus AI在第18/20步時(shí)失敗了，耗時(shí)50分鐘！?? 它之前表現(xiàn)得相當(dāng)不錯(cuò)——我一直在查看Manus的輸出結(jié)果，看起來非常出色。然而，再次運(yùn)行相同的指令時(shí)就有點(diǎn)令人沮喪了，因?yàn)樗臅r(shí)太長！

圖片

當(dāng)然，讓人吐槽更多的地方還有很多。

一家AI初創(chuàng)公司 Pleias 的聯(lián)合創(chuàng)始人亞歷山大·多里亞在一篇 X 帖子中表示，他在測(cè)試 Manus 時(shí)遇到了錯(cuò)誤消息和無限循環(huán)。一些 X 用戶還指出，Manus 在事實(shí)問題上犯了錯(cuò)誤，并且沒有始終如一地引用其工作——并且經(jīng)常錯(cuò)過在網(wǎng)上很容易找到的信息。

圖片

據(jù)國內(nèi)不少媒體的實(shí)測(cè)直播的反饋來看，慢、卡頓、幻覺都是普遍反映的問題。不過，正如一位媒體記者所說的：雖然性能有待提升，但 Manus 帶來的智能體產(chǎn)品體驗(yàn)可以說是獨(dú)一份的。

OpenManus是如何實(shí)現(xiàn)復(fù)刻的

MetaGPT團(tuán)隊(duì)在上周五一場(chǎng)直播中公開了自己當(dāng)時(shí)開發(fā)OpenManus的設(shè)想。

圖片

“兩個(gè)月前的一次邊吃飯邊頭腦風(fēng)暴的過程中，我們想到，一個(gè)極簡的 Agent 框架，應(yīng)該是可插拔的 Tools 和 System Prompt 的組合，之后我們沿著這個(gè)思路，寫了一個(gè)完整的 Agent 迷你框架。

前天晚上看到 Manus 時(shí)，凌晨就和同事商量，下班后的晚上就可以搞一個(gè)，應(yīng)該 3 小時(shí)夠了。”

這里，需要解釋下為什么他們會(huì)采用可插拔的 Tools 和 System Prompt，原因在于——決定一個(gè) ReAct Agent（結(jié)合了反應(yīng)和行動(dòng)規(guī)劃能力的智能體）的效果的關(guān)鍵是 Prompt 和 Action，Prompt 控制了 Agent 整體的行為邏輯，Tools 給定了 Agent 的行動(dòng)空間，二者被定義就能完整詮釋一個(gè) ReAct Agent。

其次，可插拔的優(yōu)點(diǎn)是可組合，這樣就可以把幾個(gè)不同場(chǎng)景下的 Tools 組合到一起來創(chuàng)造一個(gè)新的 Agent，定義也很方便，不需要單獨(dú)寫內(nèi)部邏輯，只需要修改動(dòng)作空間（ Tools ）。Tools 本身就該是可組合的。

“我們的工作是把抽象做得更干凈，目前 HuggingFace 的 Smolagents 也是類似的思路了。Manus 效果上讓大家覺得很新奇，實(shí)際上主要是由于 Browser Use 和 Computer Use 的使用，所以只要給了 Agent 這兩個(gè)工具，那它就都能做到?！?/span>

OpenManus公開的技術(shù)路線

大家可以從Github上的演示視頻可以看出，OpenManus展示的結(jié)果遠(yuǎn)不如 Manus 那么細(xì)致和豐富。

OpenManus的一位貢獻(xiàn)者梁新兵也坦承：OpenManus 目前功能還很初級(jí)，畢竟只花費(fèi)3個(gè)小時(shí)手搓的時(shí)間，還需要很多后續(xù)的工作。不過這項(xiàng)不需要邀請(qǐng)碼的開源之作已經(jīng)公開了后續(xù)的開發(fā)路線。照這個(gè)路線，基本上全面復(fù)刻 Manus 不是問題：

? 更優(yōu)的規(guī)劃系統(tǒng)

? 實(shí)時(shí)演示功能

? 運(yùn)行回放

? 強(qiáng)化學(xué)習(xí)微調(diào)模型

? 全面的性能基準(zhǔn)測(cè)試

智能體：通用和垂直，哪個(gè)更靠譜？

楊遠(yuǎn)騁Koji 曾在第一時(shí)間連線參加了 Manus 的小范圍溝通會(huì)。曾透露了一些不為外人知的細(xì)節(jié)：比如 Manus 打榜超過了OpenAI，季逸超 Peak 淚灑辦公室，再比如 Manus 的單任務(wù)成本，僅僅只有 2 美刀，并且還有優(yōu)化的空間。

但這里，小編認(rèn)為還有一個(gè)業(yè)界的非共識(shí)需要探討：在 Manus 看來，做垂直領(lǐng)域的AI Agent “可能有點(diǎn)不靠譜”，理由是——Manus 打敗了 YC W25 幾乎 3/4 的 Agent 創(chuàng)業(yè)產(chǎn)品。

圖片

然而，就在上周四我們?cè)跈谀俊癆I實(shí)戰(zhàn)派”中與一位大廠大模型應(yīng)用算法專家李明錦進(jìn)行了探討。他認(rèn)為，個(gè)人并不看好通用 Agent 的創(chuàng)業(yè)。

一方面，雖然市面上不乏BABY AGI、XAgent、LangChain、AUTO Gen 等類似的產(chǎn)品，這些框架其實(shí)很早就提出來了，但是真正用于生產(chǎn)環(huán)境確實(shí)很少，所以本質(zhì)上該類產(chǎn)品的核心還是在于對(duì)垂類任務(wù)的分解。另一方面，只有將 Agent 面相企業(yè)生產(chǎn)環(huán)境做到定制話，才有可能令其買單。所以說智能體的趨勢(shì)一定是垂類、定制畫的。通用 Agent 對(duì)于創(chuàng)業(yè)團(tuán)隊(duì)而言，人員有限，很難有精力把所有這些任務(wù)都cover 到。

“如果我來主導(dǎo) Manus 這個(gè)項(xiàng)目，我就把它開源！”

責(zé)任編輯：武曉燕來源： 51CTO技術(shù)棧

Manus AI 模型

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="vpxjw"></sub>