自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

通用Agent活不久?套殼與破解……關(guān)于Manus和OpenManus,這些質(zhì)疑的答案及回應(yīng),在這里!

原創(chuàng) 精選
人工智能
Manus 并非完全從零開始開發(fā)。據(jù)社交媒體報(bào)道,該平臺(tái)結(jié)合使用現(xiàn)有和經(jīng)過微調(diào)的 AI 模型,包括 Anthropic 的 Claude 和阿里巴巴的 Qwen,來執(zhí)行起草研究報(bào)告和分析財(cái)務(wù)文件等任務(wù)。

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

上周四,一款非常令人迷惑不解的現(xiàn)象級(jí)產(chǎn)品,只用了一天時(shí)間,就把“封神”和“打臉”兩種滋味都嘗了個(gè)遍。

這款號(hào)稱全球首個(gè)“通用代理”人工智能平臺(tái),于上周預(yù)覽推出,其引發(fā)的關(guān)注度席卷了整個(gè)技術(shù)圈。

Hugging Face 的產(chǎn)品負(fù)責(zé)人稱 Manus 是“我嘗試過的最令人印象深刻的人工智能工具”。人工智能政策研究員 Dean Ball將Manus 描述為“使用人工智能的最復(fù)雜的計(jì)算機(jī)”。

不過很快就有人就質(zhì)疑Manus背后的創(chuàng)新水平“實(shí)屬套殼”,懷疑其在通過一場(chǎng)Demo 來做饑餓營銷。據(jù)說,Manus的官方 Discord 服務(wù)器在短短幾天內(nèi)就增長到超過 138,000 名成員,據(jù)報(bào)道,Manus 的邀請(qǐng)碼在中國閑魚上高達(dá)10萬元的的價(jià)格出售。

緊接著,很快就有年輕的中國團(tuán)隊(duì),花了3個(gè)小時(shí)就手搓出了一個(gè)簡易的“Open”版本的 Manus,贏得了業(yè)內(nèi)的一致點(diǎn)贊。

有關(guān) Manus 和 OpenManus,相信會(huì)有不少朋友不清楚它們各自的來歷、理念、實(shí)現(xiàn)路線和爭議點(diǎn)。這里為大家梳理一下,希望能有所幫助。

Manus的理念究竟是什么鬼?

打開Manus官網(wǎng),就會(huì)有個(gè)醒目的slogan: “Less Structure, More Intelligence”。

翻譯過來就是,更簡化的架構(gòu)、更聰明的智能。不過大眾們似乎把這一點(diǎn)也看成了套殼炒作的證據(jù)之一,一度被戲稱:“Less Structure, More Hype”。

谷歌和OpenAI率先推出了基于其深度推理模型來賦能Agent的前沿工作,例如DeepResearch、Operator等。

或Claude的MCP協(xié)議對(duì)工具使用領(lǐng)域的革新,Manus的技術(shù)突破相對(duì)有限。

它的主要?jiǎng)?chuàng)新點(diǎn)是借助推理模型實(shí)現(xiàn)了簡化結(jié)構(gòu),同時(shí)增強(qiáng)智能處理能力的設(shè)計(jì)。 

這也就是媒體人楊遠(yuǎn)騁Koji發(fā)布的據(jù)說來自Manus團(tuán)隊(duì)內(nèi)部的“Less Structure, More Intelligence”理念。 

Manus是縫合怪嗎?

Manus 并非完全從零開始開發(fā)。據(jù)社交媒體報(bào)道,該平臺(tái)結(jié)合使用現(xiàn)有和經(jīng)過微調(diào)的 AI 模型,包括 Anthropic 的 Claude 和阿里巴巴的 Qwen,來執(zhí)行起草研究報(bào)告和分析財(cái)務(wù)文件等任務(wù)。

然而,Manus 背后給出了該平臺(tái)據(jù)稱可以實(shí)現(xiàn)的非常多的例子,從買房咨詢到編程視頻游戲。

圖片圖片

不過用例如此之多的“通用”Agent,在業(yè)內(nèi)人士看來,不過是一個(gè)產(chǎn)品“縫合怪”。

功能上,Manus 可以被看成是一個(gè)整合了 Computer use、虛擬機(jī)、Multi agent 協(xié)同的產(chǎn)品。

而在技術(shù)實(shí)現(xiàn)上,原理也并沒有特別新鮮,據(jù)業(yè)內(nèi)人士預(yù)測(cè),Manus是基于 Claude 模型生成能力、開源模型后訓(xùn)練增強(qiáng)的規(guī)劃能力,再結(jié)合各種預(yù)制的 Agent,按照設(shè)定好的工作流:構(gòu)建 todo 清單、新建虛擬機(jī)環(huán)境、調(diào)用工具、結(jié)果整合、自我檢查、輸出結(jié)果,來解決任務(wù)。

原理沒有太多的創(chuàng)新,但Manus的能夠?qū)崿F(xiàn)的功能多樣性、豐富細(xì)致的程度也是為外界所稱道的,這背后需要做極大的工程任務(wù)。

整合的工作量這么多,背后有什么通用的技術(shù)??梢宰龀蛇@件事嗎?業(yè)內(nèi)專家認(rèn)為Manus很有可能是基于 MCP(模型上下文協(xié)議)的聚合模式。

圖片圖片

不過,剛剛季逸超在X回應(yīng):Manus 并沒有使用 Claude 的 MCP,靈感更多還是來自于朋友,不過沒有完全采用 CodeAct。

圖片圖片

Manus的架構(gòu)揭秘:運(yùn)行在沙盒中的多Agent任務(wù)

有專家從Manus演示實(shí)例分析認(rèn)為,Manus有效整合了DeepResearch、Artifacts和Operator三大現(xiàn)有能力。

據(jù)媒體引用但未出現(xiàn)在Manus官網(wǎng)上的官方資料稱,Manus AI 使用一套名為“Multiple Agent”的架構(gòu),運(yùn)行在獨(dú)立的虛擬機(jī)中。通過規(guī)劃代理、執(zhí)行代理、驗(yàn)證代理的分工協(xié)作機(jī)制,來大幅提升對(duì)復(fù)雜任務(wù)的處理效率,并通過并行計(jì)算縮短響應(yīng)時(shí)間。

在這個(gè)架構(gòu)中,每個(gè)代理可能基于獨(dú)立的語言模型或強(qiáng)化學(xué)習(xí)模型,彼此通過 API 或消息隊(duì)列通信。同時(shí)每個(gè)任務(wù)也都在沙盒中運(yùn)行,避免干擾其他任務(wù),同時(shí)支持云端擴(kuò)展。每個(gè)獨(dú)立模型都能模仿人類處理任務(wù)的流程,比如先思考和規(guī)劃,理解復(fù)雜指令并拆解為可執(zhí)行的步驟,再調(diào)用合適的工具。

圖片圖片

據(jù)OpenManus 和 OWL 以及部分信息源得知,從當(dāng)前Manus可以執(zhí)行的操作和其技術(shù)描述來看,其AI架構(gòu)與工作流其實(shí)并不難實(shí)現(xiàn),很容易重構(gòu)——它很有可能是三個(gè)相關(guān)功能的串聯(lián),由一個(gè)主腦做步驟調(diào)配。

當(dāng)然也有可能根本不需要主腦,以規(guī)劃代理同時(shí)承擔(dān)工作協(xié)調(diào)的能力。

圖片圖片

在Manus的解釋中,除了瀏覽網(wǎng)頁用到了Computer Use(計(jì)算機(jī)使用)之外,它在虛擬機(jī)中的計(jì)算機(jī)應(yīng)用并不多。這也是 MIT 博士 Zengyi Qin 認(rèn)為它在無邊界操作系統(tǒng)級(jí)環(huán)境(open-ended OS Level environment)中未取得突破的原因。

在能力層,它只不過這個(gè)工作流當(dāng)前各個(gè)節(jié)點(diǎn)的能力大幅增強(qiáng)了,而其負(fù)責(zé)規(guī)劃的主腦也進(jìn)化成了可以分布拆解和發(fā)起任務(wù)的推理模型。

而其代理層及模型層架構(gòu)中與DeepResearch和Artifact能力的重疊基本是100%的(圖像瀏覽用了一些Operator能力)。

因此官網(wǎng)上介紹的智能研究、高級(jí)數(shù)據(jù)分析、任務(wù)自動(dòng)化三大功能其實(shí)也就是Manus的極限了。

Manus跟Operator對(duì)標(biāo)科學(xué)嗎?

在 X 上的一段熱門視頻中,Manus 的研究負(fù)責(zé)人季逸超暗示該平臺(tái)優(yōu)于 OpenAI 的深度研究和Operator等代理工具。

季逸超聲稱,Manus 在通用人工智能助手的流行基準(zhǔn) GAIA 上的表現(xiàn)優(yōu)于深度研究,GAIA 可探測(cè)人工智能通過瀏覽網(wǎng)頁、使用軟件等方式開展工作的能力。

圖片圖片

論文中指出,GAIA 測(cè)試根據(jù)解決問題所需的步驟數(shù)量以及回答問題所需的工具種類被分為三個(gè)遞增的難度級(jí)別。大致使用以下定義來為問題分配難度級(jí)別:

  • 一級(jí)問題:通常不需要工具,或者最多需要一個(gè)工具,且不超過5個(gè)步驟。
  • 二級(jí)問題:通常涉及更多步驟,大約在5到10步之間,并且需要結(jié)合使用不同的工具。
  • 三級(jí)問題:是為近乎完美的通用助手設(shè)計(jì)的問題,需要執(zhí)行任意長度的動(dòng)作序列,使用任意數(shù)量的工具,并且能夠訪問整個(gè)世界。

為了形象的理解問題的難度,可以看下面的這個(gè)例子:

一級(jí)問題

問題:根據(jù)美國國立衛(wèi)生研究院(NIH)網(wǎng)站列出的信息,2018年1月至5月期間針對(duì)痤瘡患者進(jìn)行的幽門螺桿菌臨床試驗(yàn)的實(shí)際入組人數(shù)是多少?
真實(shí)答案:90

二級(jí)問題

問題:如果這一整品脫全是冰淇淋,那么根據(jù)維基百科2020年報(bào)告的標(biāo)準(zhǔn),其脂肪含量比美國聯(lián)邦標(biāo)準(zhǔn)高出或低了多少百分比?請(qǐng)以正數(shù)或負(fù)數(shù)的形式回答,并保留一位小數(shù)。
真實(shí)答案:+4.6

三級(jí)問題

問題:在2006年1月21日美國國家航空航天局(NASA)的“每日天文圖片”中,可以看到兩名宇航員,其中一名看起來比另一名小得多。截至2023年8月,在這名較小宇航員所屬的NASA宇航員團(tuán)隊(duì)中,哪位宇航員在太空停留的時(shí)間最少?他在太空停留了多少分鐘(四舍五入到最近的整數(shù))?不包括那些從未進(jìn)入過太空的宇航員。請(qǐng)給出該宇航員的姓氏,并用分號(hào)與分鐘數(shù)隔開。
真實(shí)答案:White; 5876

GAIA 樣例問題GAIA 樣例問題

不過這里需要注意的是,OpenAI 的 DeepResearch 主要用于深度研究領(lǐng)域的,主打一個(gè)"AI研究員"的功能,能夠自主分析復(fù)雜的專業(yè)信息,實(shí)時(shí)查找和綜合數(shù)百個(gè)在線資源,最終生成一份專業(yè)水準(zhǔn)的完整報(bào)告。

而 Manus 則覆蓋了更廣的任務(wù)范疇,而 DeepResearch 主要用途則是報(bào)告生成。所以這本就是一場(chǎng)不公平的對(duì)比。

Manus的早期用戶反饋

然而在用戶實(shí)際測(cè)試使用中,即便是與DeepResearch對(duì)比,有網(wǎng)友表示 Manus 效果并不好:

Deep Research 在不到15分鐘內(nèi)完成了。不幸的是,Manus AI在第18/20步時(shí)失敗了,耗時(shí)50分鐘!?? 它之前表現(xiàn)得相當(dāng)不錯(cuò)——我一直在查看Manus的輸出結(jié)果,看起來非常出色。然而,再次運(yùn)行相同的指令時(shí)就有點(diǎn)令人沮喪了,因?yàn)樗臅r(shí)太長!

圖片圖片

當(dāng)然,讓人吐槽更多的地方還有很多。

一家AI初創(chuàng)公司 Pleias 的聯(lián)合創(chuàng)始人亞歷山大·多里亞在一篇 X 帖子中表示,他在測(cè)試 Manus 時(shí)遇到了錯(cuò)誤消息和無限循環(huán)。一些 X 用戶還指出,Manus 在事實(shí)問題上犯了錯(cuò)誤,并且沒有始終如一地引用其工作——并且經(jīng)常錯(cuò)過在網(wǎng)上很容易找到的信息。

圖片圖片

據(jù)國內(nèi)不少媒體的實(shí)測(cè)直播的反饋來看,慢、卡頓、幻覺都是普遍反映的問題。不過,正如一位媒體記者所說的:雖然性能有待提升,但 Manus 帶來的智能體產(chǎn)品體驗(yàn)可以說是獨(dú)一份的。

OpenManus是如何實(shí)現(xiàn)復(fù)刻的

MetaGPT團(tuán)隊(duì)在上周五一場(chǎng)直播中公開了自己當(dāng)時(shí)開發(fā)OpenManus的設(shè)想。

圖片圖片

“兩個(gè)月前的一次邊吃飯邊頭腦風(fēng)暴的過程中,我們想到,一個(gè)極簡的 Agent 框架,應(yīng)該是可插拔的 Tools 和 System Prompt 的組合,之后我們沿著這個(gè)思路,寫了一個(gè)完整的 Agent 迷你框架。

前天晚上看到 Manus 時(shí),凌晨就和同事商量,下班后的晚上就可以搞一個(gè),應(yīng)該 3 小時(shí)夠了。”

這里,需要解釋下為什么他們會(huì)采用可插拔的 Tools 和 System Prompt,原因在于——決定一個(gè) ReAct Agent( 結(jié)合了反應(yīng)和行動(dòng)規(guī)劃能力的智能體 )的效果的關(guān)鍵是 Prompt 和 Action,Prompt 控制了 Agent 整體的行為邏輯,Tools 給定了 Agent 的行動(dòng)空間,二者被定義就能完整詮釋一個(gè) ReAct Agent。

其次,可插拔的優(yōu)點(diǎn)是可組合,這樣就可以把幾個(gè)不同場(chǎng)景下的 Tools 組合到一起來創(chuàng)造一個(gè)新的 Agent,定義也很方便,不需要單獨(dú)寫內(nèi)部邏輯,只需要修改動(dòng)作空間( Tools )。Tools 本身就該是可組合的。

“我們的工作是把抽象做得更干凈,目前 HuggingFace 的 Smolagents 也是類似的思路了。Manus 效果上讓大家覺得很新奇,實(shí)際上主要是由于 Browser Use 和 Computer Use 的使用,所以只要給了 Agent 這兩個(gè)工具,那它就都能做到?!?/span>

OpenManus公開的技術(shù)路線

大家可以從Github上的演示視頻可以看出,OpenManus展示的結(jié)果遠(yuǎn)不如 Manus 那么細(xì)致和豐富。

OpenManus的一位貢獻(xiàn)者梁新兵也坦承:OpenManus 目前功能還很初級(jí),畢竟只花費(fèi)3個(gè)小時(shí)手搓的時(shí)間,還需要很多后續(xù)的工作。不過這項(xiàng)不需要邀請(qǐng)碼的開源之作已經(jīng)公開了后續(xù)的開發(fā)路線。照這個(gè)路線,基本上全面復(fù)刻 Manus 不是問題:

? 更優(yōu)的規(guī)劃系統(tǒng)

? 實(shí)時(shí)演示功能

? 運(yùn)行回放

? 強(qiáng)化學(xué)習(xí)微調(diào)模型

? 全面的性能基準(zhǔn)測(cè)試

智能體:通用和垂直,哪個(gè)更靠譜?

楊遠(yuǎn)騁Koji 曾在第一時(shí)間連線參加了 Manus 的小范圍溝通會(huì)。曾透露了一些不為外人知的細(xì)節(jié):比如 Manus 打榜超過了OpenAI,季逸超 Peak 淚灑辦公室,再比如 Manus 的單任務(wù)成本,僅僅只有 2 美刀,并且還有優(yōu)化的空間。

但這里,小編認(rèn)為還有一個(gè)業(yè)界的非共識(shí)需要探討:在 Manus 看來,做垂直領(lǐng)域的AI Agent “可能有點(diǎn)不靠譜”,理由是——Manus 打敗了 YC W25 幾乎 3/4 的 Agent 創(chuàng)業(yè)產(chǎn)品。 

圖片圖片

然而,就在上周四我們?cè)跈谀俊癆I實(shí)戰(zhàn)派”中與一位大廠大模型應(yīng)用算法專家李明錦進(jìn)行了探討。他認(rèn)為,個(gè)人并不看好通用 Agent 的創(chuàng)業(yè)。

一方面,雖然市面上不乏BABY AGI、XAgent、LangChain、AUTO Gen 等類似的產(chǎn)品, 這些框架其實(shí)很早就提出來了,但是真正用于生產(chǎn)環(huán)境確實(shí)很少,所以本質(zhì)上該類產(chǎn)品的核心還是在于對(duì)垂類任務(wù)的分解。另一方面,只有將 Agent 面相企業(yè)生產(chǎn)環(huán)境做到定制話,才有可能令其買單。所以說智能體的趨勢(shì)一定是垂類、定制畫的。通用 Agent 對(duì)于創(chuàng)業(yè)團(tuán)隊(duì)而言,人員有限,很難有精力把所有這些任務(wù)都cover 到。

“如果我來主導(dǎo) Manus 這個(gè)項(xiàng)目,我就把它開源!”

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2024-07-02 11:16:21

2018-04-26 16:15:02

數(shù)據(jù)庫MySQLMySQL 8.0

2009-06-24 14:10:22

2021-06-17 13:40:47

區(qū)塊鏈比特幣公有鏈

2021-02-01 08:39:26

JTAG接口Jlink

2021-12-24 10:01:55

勒索團(tuán)伙攻擊勒索軟件

2018-04-03 05:19:36

網(wǎng)速寬帶Wifi

2017-08-29 11:21:03

微軟

2018-10-09 15:20:57

CIOHRHRM

2019-05-10 10:13:10

Windows 功能系統(tǒng)

2020-06-08 17:51:28

戴爾

2021-07-19 08:33:56

時(shí)間復(fù)雜度大O

2020-12-08 11:08:55

時(shí)間復(fù)雜度軟件

2020-02-16 12:01:53

Windows 10Windows微軟

2016-05-20 11:14:55

內(nèi)容緩存 傳輸策略優(yōu)

2022-11-28 08:44:46

死鎖面試線程

2021-01-27 10:28:21

CISO升職加薪首席信息安全官

2017-10-24 14:57:58

AI人工智能機(jī)器學(xué)習(xí)

2018-03-19 14:43:28

2021-07-01 09:00:00

安全數(shù)字化轉(zhuǎn)型滲透
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)