Manus爆火的秘密武器Browser Use融資1700萬美元!讓AI「讀懂」網(wǎng)頁
AI智能體可能還沒有一個(gè)大家都認(rèn)可的定義,但這并不妨礙一大堆創(chuàng)業(yè)公司爭相打造智能體工具,來自動(dòng)化處理各種任務(wù)。
其中一家名為Browser Use的公司尤其吸引開發(fā)者與投資人的關(guān)注,因?yàn)樗麄兊墓ぞ吣苁怪悄荏w更容易地「讀懂」網(wǎng)站。
據(jù)最新報(bào)道,Browser Use剛?cè)诹艘还P1700萬美元的種子輪資金,由Felicis的Astasia Myers領(lǐng)投,Paul Graham、A Capital和Nexus Venture Partners跟投。此次融資之前還沒被報(bào)道過。
網(wǎng)站地址:https://browser-use.com
Browser Use是Y Combinator 2025冬季班的一員,最近幾個(gè)月隨著智能體的爆火而名聲大噪。
尤其是火出圈的Manus也用了Browser Use工具,一下子就把它的知名度推到了新高。
Browser Use的創(chuàng)辦人是Magnus Müller和Gregor Zunic,他們?nèi)ツ晖ㄟ^蘇黎世聯(lián)邦理工學(xué)院的創(chuàng)業(yè)加速器創(chuàng)辦了這個(gè)項(xiàng)目。
Müller多年來一直在研究網(wǎng)頁抓取工具,2024年他在讀數(shù)據(jù)科學(xué)碩士時(shí)認(rèn)識了Zunic。Müller說,他們倆一塊兒琢磨出了把網(wǎng)頁抓取和數(shù)據(jù)科學(xué)結(jié)合起來的想法,打算讓瀏覽器自己完成任務(wù)。
Müller和Zunic花了五周時(shí)間做出了個(gè)Browser Use的demo,結(jié)果一炮而紅。后來,他們干脆把Browser Use開源了。
簡單說,Browser Use是把網(wǎng)站上的按鈕和元素拆解成一種更容易理解、更像「文本」的格式給智能體用。
這能幫助AI智能體搞清楚網(wǎng)頁有哪些選項(xiàng),然后自主做出決策。
「好多智能體靠的是視覺系統(tǒng),通過截圖來瀏覽網(wǎng)站,但這過程中老出問題?!筂üller說,「我們把網(wǎng)站轉(zhuǎn)化成智能體可以理解的東西,這種方法能讓我們以更低的成本反復(fù)運(yùn)行相同的任務(wù)?!?/span>
隨著越來越多的AI公司想讓他們的智能體跟網(wǎng)站交互得更順暢,Müller覺得Browser Use能成為滿足這些需求的「底層技術(shù)」。
他還表示,現(xiàn)在Y Combinator冬季班里有20多家公司都在用Browser Use滿足自己的需求。
有些公司還跑來問他們,怎樣才能使得智能體更容易地瀏覽自己的網(wǎng)站?
Müller說,「像LinkedIn這樣的網(wǎng)站,總是改變網(wǎng)站的功能,智能體在這種情況就經(jīng)常出錯(cuò)?!?/span>
Felicis的Myers說,他們過去幾年一直在關(guān)注AI智能體領(lǐng)域,而Browser Use就是一個(gè)很好的投資機(jī)會。
她說,Browser Use的創(chuàng)始團(tuán)隊(duì)——以及他們開源為先的策略——徹底打動(dòng)了自己。
「我們覺得網(wǎng)頁AI智能體是下一個(gè)前沿技術(shù),能真正使得人類任務(wù)實(shí)現(xiàn)端到端的自動(dòng)化,」Myers對TechCrunch說,「網(wǎng)頁AI智能體就像是一座動(dòng)態(tài)橋梁,連接著靜態(tài)預(yù)訓(xùn)練模型與不斷變化的數(shù)字世界,而這些靜態(tài)模型往往只專注于文本。」
Browser Use:讓智能體簡單地瀏覽網(wǎng)頁
Browser Use可以使AI智能體簡單地瀏覽網(wǎng)頁。
它在GitHub上開源,許多項(xiàng)目都使用了它的功能,目前已經(jīng)獲得超過47k個(gè)Star了。
項(xiàng)目地址:https://github.com/browser-use/browser-use
Browser Use通過提取網(wǎng)站的交互元素(如按鈕、表單等),使AI能夠自動(dòng)化執(zhí)行瀏覽器操作,例如填寫表單、搜索信息或?qū)Ш骄W(wǎng)頁。
這對于開發(fā)AI驅(qū)動(dòng)的網(wǎng)絡(luò)智能體非常有用。
比如,它可以將商品添加到你的購物車,并完成結(jié)賬。
甚至是閱讀你的簡歷,然后幫你找工作!中途如果有需要,還會停下來等待你的指示。
它也可以幫你干活兒。
比如,讓它在Hugging Face上查找具有cc-by-sa-4.0許可證的模型,然后按點(diǎn)贊數(shù)排序,將排名前5的模型保存到文件中。
從MCP到Browser Use的爆火
Browser Use是隨著智能體的快速發(fā)展而爆火起來的。
去11月,Anthropic首次提出「模型上下文協(xié)議」,即MCP,賦予了Claude模型超級能力,一次構(gòu)建,讓AI與工作流深度集成。
用通俗的話講,MCP就像是專為AI應(yīng)用設(shè)計(jì)的通用接口,類似我們?nèi)粘J褂玫腢SB-C。
正如USB-C簡化了不同設(shè)備與計(jì)算機(jī)的連接方式,MCP簡化了AI模型與數(shù)據(jù)、工具和服務(wù)之間的交互方式。
通過MCP,AI助手不僅能夠「讀懂」代碼,還能「理解」團(tuán)隊(duì)討論、涉及文檔等外部信息,提供更加精準(zhǔn)的回答。
今年1月,OpenAI推出了Operator,能夠自主執(zhí)行網(wǎng)絡(luò)任務(wù),如規(guī)劃假期、填寫表單或預(yù)訂餐廳 (OpenAI Launches Operator)。
Operator使用名為Computer-Using Agent (CUA)的AI智能體,通過視覺界面控制網(wǎng)頁瀏覽器,模擬人類點(diǎn)擊、輸入和滾動(dòng)的操作。
這一工具展示了AI智能體在網(wǎng)絡(luò)任務(wù)自動(dòng)化中的潛力,但也需要用戶在遇到復(fù)雜界面或驗(yàn)證碼時(shí)介入。
差不多同一時(shí)間,Browser Use也開源了,它被Manus團(tuán)隊(duì)集成到了Manus智能體中。
Manus因其綜合能力和友好的用戶界面(如實(shí)時(shí)顯示思考過程)而迅速走紅,吸引了大量關(guān)注。
這直接推動(dòng)了Browser Use知名度的提升。