ManusAl合伙人張濤緊急回應!中國產(chǎn)品再次引爆全球,首個通用AI代理跑分超OpenA1!最全梳理來了! 原創(chuàng)
編輯 | 伊風
出品 | 51CTO技術棧(微信號:blog51cto)
Manus橫空出世,徹底引爆了今天的AI圈!剛剛我們在某站看了一下邀請碼,已經(jīng)被炒到5萬塊了(天吶?。?/p>
圖片
自杭州瘋狂上大分后,這潑天的AI富貴也輪到武漢了?。ü径鄶?shù)崗位base武漢,在北京也有辦公點。)
ManusAI合伙人張濤,趕緊在社交平臺回應,短期內(nèi)會專注build。并緊急澄清:1.我們從未開設任何付費獲取邀請碼的渠道;2.我們從未投入任何市場推廣預算;3.內(nèi)測期間系統(tǒng)容量有限,我們將優(yōu)先保障現(xiàn)有用戶的核心體驗,并逐步有序釋放邀請。
圖片
那么,Manus到底是啥?為什么那么火?demo出鏡的小哥是華人嗎,這是一款中國產(chǎn)品嗎?
在這篇文章里,我們想帶著好奇心,一起找到關于Manus的N個問題的答案。
Manus 體驗申請鏈接 :??https://manus.im/invitation??
1.Manus到底是啥?都能做哪些事情?
看頭銜,Manus就夠炸了:全球首個通用AI代理??!
在GAIA (評估通用人工智能助手解決實際問題的基準)上的跑分是這樣的,領跑了性能驚艷的DeepResearch!
圖片
在demo里的介紹是這樣的:
這不僅僅是另一個聊天機器人或工作流,它是一個真正自主的主體,彌合概念和執(zhí)行之間的差距,當其他人工智能只是在生產(chǎn)想法,Manus交付成果。我們把它看作是人機協(xié)作的下一代范式,并可以讓你提前一瞥AGI!
更加直觀易懂的就是:這是OpenAI DeepResearch和Claude的Computer Use的集合體!自己一個人把研究和執(zhí)行的活都包攬了!
官方demo
每次接到任務的時候,Manus都會對任務進行分析,然后給自己一個To Do List,逐一完成。
看到demo里Manus干活的樣子,還真有點AGI那味了!
官方給出的一個案例,是Manus審閱了15份候選人的簡歷,然后按照分析的結(jié)果對候選人進行了推薦的排序!
圖片
第二個案例中,Manus被要求分析紐約的房產(chǎn),然后將信息匯總成一個報告。
Manus列出的To Do List如下:
- 搜索并閱讀關于紐約最安全社區(qū)的文章。
- 研究紐約的中學情況。
- 編寫 Python 程序來計算預算。
- 基于預算,在房地產(chǎn)網(wǎng)站上篩選合適的房源。
- 整合所有信息,撰寫詳細報告并整理相關資料
圖片
第三個案例中,Manus做了一個股票相關性的分析,最后生成了一個網(wǎng)站鏈接,里面的數(shù)據(jù)表格居然都是可交互的?。?!
圖片
很多人都感嘆道,AI實習生一來,留給行業(yè)新人的機會越來越少了!
2.Manus在GAIA上的領先分量幾何?這個基準怎么定的?
2023年11 月,由Meta 人工智能研究院和Hugging Face團隊牽頭,定下了一個面向通用AI助手能力的基準評測體系,這就是GALA。
Manus的很大程度體現(xiàn)了,這是向通用智能上邁進的重大一步。
論文摘要中說:如果 AI 能夠解決 GAIA,將標志著 AI 研究的一個重要里程碑。GAIA 設計了一系列真實世界的問題,這些問題需要 AI 具備推理、多模態(tài)處理、網(wǎng)頁瀏覽以及通用工具使用等核心能力。
圖片
論文地址:??https://arxiv.org/pdf/2311.12983v1??
看這個論文作者,楊立昆大佬赫然在列。
值得一提的是:GALA基準發(fā)布時,已經(jīng)發(fā)布了半年多的GPT-4才得分15%,而人類的表現(xiàn)為 92%。
此時,距離2023年9 月的 Meta Connect 大會,所發(fā)布了一系列 AI 聊天助手,也才過去了剛剛兩個月。可以想見,Meta 可能希望通過 GAIA 評估 LLM 在實際 AI 助手任務上的差距,以指導其未來的發(fā)展方向。
為啥在數(shù)學、編程領域一騎絕塵的AI,到了GALA就玩不轉(zhuǎn)了呢?因為GAIA 的理念不是追求對人類而言越來越困難的任務,而是AI 是否能像普通人一樣,在這些問題上展現(xiàn)出類似的穩(wěn)定性和可靠性。(能看到楊立昆“寵物貓的智能遠遠超過大模型”這一觀點的影子)
GALA的題型分為三個級別,Lv.1、Lv.2、Lv.3,難度依次遞增。
圖片
3.Manus的創(chuàng)始人和團隊情況?
Manus的創(chuàng)始人肖弘,是一位90后,是一位名副其實的連續(xù)創(chuàng)業(yè)者。
2011年,肖弘進入華中科技大學軟件工程專業(yè)學習。2015年畢業(yè)后,肖弘創(chuàng)立了武漢夜鶯科技有限公司,專注于微信生態(tài)的應用研發(fā)與推廣。就是這家公司,推出了大名鼎鼎的壹伴助手(微信公眾號編輯插件)和微伴助手(企業(yè)微信SCRM產(chǎn)品),累計服務超過200萬B端用戶。
2022年,肖弘創(chuàng)立了蝴蝶效應公司,也就是Manus的母公司。
蝴蝶效應公司先推出了AI瀏覽器插件Monica。Monica是一款一站式AI助手,整合了OpenAI、Anthropic、DeepSeek等前沿AI模型,提供聊天、翻譯、寫作等功能。
而在demo視頻中出鏡的小哥是季逸超(Peak),也是一位知名的“少年極客”。
高中時期,他獨立開發(fā)了多款蘋果應用,包括獲得Macworld Asia特等獎的猛犸瀏覽器(Mammoth Web Browser),以及全球首款手勢輸入法Rasgueado。
季逸超作為AI創(chuàng)業(yè)者的經(jīng)歷也很有意思,他一直在focus通用智能的方向。他所創(chuàng)立的 Peak Labs 把全部的精力都投入了知識搜索引擎 Magi。但在體驗GPT-3 API后,他陷入了絕望,并賣掉了創(chuàng)建十年的公司另起爐灶,他現(xiàn)在是蝴蝶效應公司的CTO。
4.Manus用的什么模型?用到DeepSeek了嗎?
小編推測是很有可能。
蝴蝶效應公司應該是一家模型、應用分離的公司,類似于Cursor,只做應用層接入別人的大模型。
今年2月份,蝴蝶效應公司打造的Monica的中文版開啟內(nèi)測時。該版本就接入了DeepSeek R1 和 V3 模型,由此為產(chǎn)品配置深度推理思考能力,并支持記憶功能和實時聯(lián)網(wǎng)搜索。而其海外版本在配置DeepSeek之外,還接入了Claude 3.5等模型。
另外,蝴蝶效應的招聘崗位中,截至目前并沒有人工智能模型研發(fā)崗位,這也進一步佐證Manus接入主流大模型的可能性。
圖片
5.Manus是重大的技術突破嗎?有什么局限?
在GAIA跑分一騎絕塵的Manus,無疑在通用AI助手上邁出了重大的一步。
不過,我們可能仍需要一段時間才能觸摸到AGI。在為中國AI突破驕傲的同時,我們也想“降降溫”,不要沖動購入天價的二手邀請碼。
顯然,Manus仍然有些局限性。與季逸超同為MIT校友的Zengyi Qin,在X上發(fā)表了自己的觀點:Manus 顯然是一個好產(chǎn)品。
但想成為一個重要的技術突破,還需要一些提升,這是因為Manus:
a. 它主要遵循預定義的流程來執(zhí)行任務。這種預定義流程會顯著限制系統(tǒng)的上限性能,盡管在短期內(nèi)確實能提升系統(tǒng)的運行效果。
b. 它運行在一個相對受限的環(huán)境中, 介于僅限瀏覽器和操作系統(tǒng)級別之間。超出預定義的軟件工具范圍,它無法工作。例如,它不能控制 PowerPoint 來為你制作幻燈片。實際上,許多軟件都不在 Manus 的工具箱內(nèi)。
c. 如果 Manus 不是技術突破,那什么才是?一個真正的技術突破應該是在完全開放的操作系統(tǒng)級環(huán)境中運行,能夠執(zhí)行大多數(shù)任務,并像人類一樣操作各種軟件。
圖片
無論如何,今天的Manus取得的成功是轟動性的。
我們也希望團隊可以放出更多的邀請碼,讓我們都能上手體驗,再做出更客觀、全面的評價。
AI真的太卷了。這在我們看來,每天都是日新月異的精彩。
但看到季逸超的采訪,他從創(chuàng)業(yè)者的角度是這樣形容自己感受的:
每次睡醒之后,你發(fā)現(xiàn)海平面又上漲了。有時候一覺醒來,海水已經(jīng)淹沒了你的鼻子。
AI創(chuàng)業(yè)是一場冷酷的競技游泳比賽。衷心為中國AI創(chuàng)業(yè)者感到欽佩,祝賀Manus今天的成功,祝愿他們在這場比賽中享受到領先的樂趣,而且永不孤獨。
參考鏈接:
1.??https://www.sohu.com/a/755511127_355029??
2.https://xueqiu.com/1752519997/326216457
本文轉(zhuǎn)載自51CTO技術棧,作者:伊風
