AI殺手級應(yīng)用有苗頭了,自主使用操作系統(tǒng)Agent智能體,開源!
最近微軟開源了一個 Agent 叫 UFO,通過自然語言指令實現(xiàn) Windows 操作系統(tǒng)上的自動化任務(wù)操作。
圖片
之前我們分享的 Agent 大多是自主使用瀏覽器,而 UFO 更進了一步,可以使用操作系統(tǒng)中的各種APP幫你完成任務(wù)。
下面是 UFO 的架構(gòu)圖:
UFO2 architecture
可以看到,它是一個多Agent系統(tǒng),中間的 HostAgent 用來解析用戶的自然語言,啟動必要的應(yīng)用程序。
下面的每個應(yīng)用程序都對應(yīng)一個Agent。
這讓我想到了前段時間谷歌提出的一個跟MCP類似協(xié)議——A2A,用于制定Agent之間通信的標(biāo)準(zhǔn)協(xié)議。
圖片
從 UFO 的架構(gòu)上看,普通A2A這類協(xié)議還是很有必要的。
假如上述應(yīng)用程序Agent都支持了A2A協(xié)議,那我們開發(fā)的Agent也就都能輕松調(diào)用Windows 系統(tǒng)的各種應(yīng)用程序,既能加快Agent開發(fā)效率,也可以大大提高Agent的能力。
最近,我們也在開發(fā)一個跟 Manus 類似的智能體,對AI時代“殺手級”應(yīng)用有一些思考。
我覺得“殺手級”應(yīng)用一定要具備的一個特點就是之前完全沒出現(xiàn)過,一定是一個全新物種。
比如,互聯(lián)網(wǎng)時代,淘寶就是一個殺手級應(yīng)用,是互聯(lián)網(wǎng)時代的全新物種。淘寶出現(xiàn)之前,不能甚至不敢想象,我們還可以完成跨時空購物。
反之,目前一些垂類Agent,比如旅游Agent,幫用戶自動規(guī)劃出行、游玩。
這類Agent雖然能解決一大部分人的旅游需求,但它成不了“殺手級”,因為即便沒有大模型,這類需求也能被滿足很好(旅行社),大模型無非解決的就是效率問題。
所以,從這個角度說,我覺得到目前為止,Manus、UFO這類智能體至少已經(jīng)有“殺手級”的苗頭。
雖然,這些產(chǎn)品現(xiàn)階段不可避免被大家吐槽智障,但起碼是一個全新物種。一句話讓一個Agent像助理一樣自動幫你干完活,這個現(xiàn)象在之前是完全沒有的。
無論如何,AI時代,我們普通人最大的機會在于擁抱AI,積極擁抱變化,在AI浪潮中找到屬于自己的位置。