如何看待”首個真干活”AI—Manus?
話題背景
今日凌晨,一款通用AI Agent產(chǎn)品「Manus」正式發(fā)布。GAIA評分已超越OpenAI的DeepResearch,成為GAIA評分第一。這一產(chǎn)品以“數(shù)字代理人”自居,宣稱能獨立完成復(fù)雜任務(wù)并交付完整成果,迅速成為科技圈的焦點。與 Manus 同步出圈的還有一段長達四分鐘的演示 demo。在這些案例中,Manus完全自主地完成從規(guī)劃到執(zhí)行的全流程,展示了真正的Agent能力,而非簡單的助手功能。
那么,當(dāng)AI不僅擁有強大的思考能力,還具備高效的執(zhí)行力時,將會帶來怎樣的變革?關(guān)于Manus,你怎么看?
鵝廠工程師的看法
@arsene-應(yīng)用研究員
看了官網(wǎng)的案例,manus會把任務(wù)拆解,放在一個 todo.md 里,每做完一步就勾掉一個。這種用外置文件來實現(xiàn)“工作記憶”的方式很有趣。
@vin-數(shù)據(jù)分析師
產(chǎn)品的設(shè)計思路是非常不錯的,不過缺乏很多細節(jié)推證,沒有邀請碼無法復(fù)現(xiàn)具體細節(jié)。
對任務(wù)拆解的復(fù)雜性還是顯得非常低級。另外,關(guān)于執(zhí)行任務(wù)中的資源也是一個不小的開銷,啟動資源時,是否合理評估資源大小,按任務(wù)的復(fù)雜度來分配資源大小也沒有,合理的是加上這方面的思考過程??偟膩碚f:任務(wù)拆解+資源分配+效果評估+結(jié)果輸出。才是這類型產(chǎn)品更合理的方向。
@keyi-行業(yè)應(yīng)用
看了界面的所有case感覺想象力可以完全打開,但是苦于沒有邀請碼,先申請試用等待ing。
對比年前的cua,先一波“炸裂”給到monica團隊
@匿名
說了什么不重要,做了什么做成了什么更重要!用戶并不在乎底層用了什么,如何調(diào)用各種工具,關(guān)鍵是在體驗上,是不是能做到完整融合,這方面至少看起來 Manus 做的還不錯。
這波AI 產(chǎn)品的發(fā)展有幾個特點:
- 產(chǎn)品的開發(fā)團隊,可能是大廠,可能是金融企業(yè),可能是小作坊,背景越來越不重要;
- 說得再漂亮,都沒用,就要看用戶體驗。是騾子是馬,都要拿出來溜溜;
- 大模型廠商繼續(xù)在 AGI 的道路上邁進,留下了給應(yīng)用型企業(yè)的窗口期,而應(yīng)用型產(chǎn)品的設(shè)計,需要新型的“AI 產(chǎn)品經(jīng)理”(AIPM),既對市場上 SOTA (最為先進)的 AI 模型、工具有足夠的了解(特別是國外的最新產(chǎn)品,主要觀察窗口就是 Producthunt,Manus 其實有點類似于 Deep Research),又對人性、用戶體驗、使用習(xí)慣等有互聯(lián)網(wǎng)產(chǎn)品的認知;
- 這給很多to B to A的企業(yè)(比如我們騰訊云)帶來了機會,而參考上面的趨勢,AI 好不好,光方案沒用,還是要“溜”,這需要“陪跑”。但是這樣的“陪跑”,對于to B to A企業(yè)的要求很高,既需要具備傳統(tǒng)的客戶教育、咨詢能力,又要有扎實的整合、交付和運維能力。這種新型的 AI落地咨詢、陪跑服務(wù),是市場目前需要的。
@yark-客戶端開發(fā)
看demo和Devin有點類似,訓(xùn)練一個planner來生成plan,調(diào)用其他LLM做執(zhí)行。感覺這種能力 Devin、Cursor 做的已經(jīng)比較成熟了, 他們基于 Claude 的模型一次性能調(diào)用很多的 Tool,不過主要場景是寫代碼和文件編輯。 這次 Manus 的營銷點應(yīng)該是通過 加上了 computer use 和 虛擬機的能力,把能力擴展到了更多日常辦公的場景,所以比較出圈。
@vikyfj-應(yīng)用開
給AI加上眼睛(視覺)和手(至少會控制鍵盤鼠標),能用上目前面向人的各種工具,就7788了。
@grey-前端開發(fā)
看了下幾個博主的評測視頻,確實非常牛。。。無論是報表生成、游戲開發(fā)等等從思考過程到最終的產(chǎn)出質(zhì)量都很高,目測又是一個現(xiàn)象級的AI新形態(tài)產(chǎn)品。
Manus本質(zhì)上有點像一個套殼工具,將大模型作為中央處理器,支持各種多模態(tài)數(shù)據(jù)的輸入輸出,并通過智能體工具實現(xiàn)跨應(yīng)用操作,有種集百家之長的感覺??這種設(shè)計讓Manus能夠自主完成各種復(fù)雜任務(wù)。
但個人覺得Manus最突出的亮點還是具備強大的工具調(diào)用能力,能夠自主調(diào)用瀏覽器、代碼編輯器、數(shù)據(jù)分析工具等,直接交付任務(wù)成果。比如他可以根據(jù)你的一份簡單的游戲設(shè)計思路,自己從整個游戲玩法設(shè)計出發(fā)逐漸完善,然后再自行調(diào)用各種工具如繪圖工具、代碼編輯器等等完成開發(fā),全程無需手動介入,真正意義上的從任務(wù)拆解到成果交付全程自主執(zhí)行。
很期待后續(xù)各家大廠的跟進措施。
@lawrence-應(yīng)用開發(fā)
現(xiàn)在就等團隊說的會開源的做過 post training 的模型包含會拆解任務(wù)的那個模型了,然后開始“微創(chuàng)新”
@ericj-刑事法律
朋友有拿到邀請碼,應(yīng)該體驗最好的operator了,太炸裂。
@groot-后臺開發(fā)
本條由 Manus 使用 deepseek r1 作答:
關(guān)于「Manus」的技術(shù)實現(xiàn)、工具調(diào)用和工程調(diào)優(yōu)方面,以下是一些可能的看法:
- 技術(shù)實現(xiàn):Manus作為一款通用AI Agent,可能依賴于先進的算法與模型,例如深度學(xué)習(xí)和自然語言處理。它的能力在于協(xié)調(diào)思維與行動,這意味著在理解任務(wù)的基礎(chǔ)上,它可以執(zhí)行復(fù)雜的操作。這種結(jié)合可以使得AI在多個領(lǐng)域內(nèi)更高效地工作,例如在醫(yī)療、金融或制造業(yè)等。
- 工具調(diào)用:Manus可能集成了多種API和工具,可以在不同的應(yīng)用場景下調(diào)用相應(yīng)的資源。這使得它能夠處理各種數(shù)據(jù)輸入并優(yōu)化決策過程,例如通過實時數(shù)據(jù)分析來改進工作流程。
- 工程調(diào)優(yōu):為了使Manus能夠高效穩(wěn)定地運行,工程調(diào)優(yōu)是至關(guān)重要的。這可能涉及到持續(xù)的模型訓(xùn)練、參數(shù)調(diào)整和算法優(yōu)化,以改善其性能和響應(yīng)時間。此外,通過用戶反饋和使用數(shù)據(jù)的學(xué)習(xí),Manus也可以不斷自我提升。