忘掉 ChatBots, 智能體 (AI Agents) 將是未來
隨著AI Agents技術的不斷發(fā)展和成熟,我們可以期待在未來看到更多令人興奮的創(chuàng)新和應用。這些技術有望成為推動人類進步和提高生活質量的重要工具。
本周,一家名為Cognition AI的初創(chuàng)公司引起了轟動,他們發(fā)布了一個演示,展示了一個名為Devin的人工智能程序執(zhí)行通常由高薪軟件工程師完成的工作。像ChatGPT和Gemini這樣的聊天機器人可以生成代碼,但Devin更進一步,規(guī)劃解決問題的方法,編寫代碼,然后測試和實施。
Devin的創(chuàng)建者將其定位為“AI軟件開發(fā)人員”。當被要求測試Meta的開源語言模型Llama 2在通過不同公司主機訪問時的性能時,Devin生成了一個逐步的項目計劃,生成了訪問API并運行基準測試所需的代碼,并創(chuàng)建了一個總結結果的網站。
評估經過策劃的演示總是很困難,但Cognition展示了Devin處理各種令人印象深刻的任務。它在推特上讓投資者和工程師們贊嘆不已,獲得了許多認可,甚至激發(fā)了一些預測Devin將很快導致技術行業(yè)裁員浪潮的到來。
Devin只是我一直在追蹤的趨勢的最新、最精致的例子——即出現(xiàn)了能夠采取行動來解決問題,而不僅僅是提供人類所提出問題的答案或建議的AI Agents。幾個月前,我試駕了Auto-GPT,這是一個開源程序,試圖通過在用戶的計算機和網絡上采取行動來完成有用的任務。最近,我測試了另一個名為vimGPT的程序,以了解新的AI模型的視覺技能如何幫助這些Agents更高效地瀏覽網絡。
我對這些Agents的實驗結果印象深刻。然而,就像為它們提供動力的語言模型一樣,它們現(xiàn)在還存在相當多的錯誤。當一款軟件正在采取行動,而不僅僅是生成文本時,一個錯誤可能意味著徹底失敗——并可能帶來昂貴或危險的后果。將Agents能夠執(zhí)行的任務范圍縮小到特定的軟件工程任務集合,似乎是降低錯誤率的聰明方式,但仍然存在許多潛在的失敗方式。
不僅僅是初創(chuàng)公司在構建AI Agents。本周早些時候,我寫了一篇關于由Google DeepMind開發(fā)的名為SIMA的Agents的文章,該Agents玩的視頻游戲包括真正瘋狂的標題《Goat Simulator 3》。SIMA通過觀察人類玩家學會了如何執(zhí)行600多項相當復雜的任務,例如砍樹或擊中小行星。最重要的是,即使在陌生的游戲中,它也能成功地執(zhí)行許多這些動作。Google DeepMind稱之為“通才”。
我懷疑Google希望這些Agents最終能夠在視頻游戲之外的領域發(fā)揮作用,也許是幫助用戶代表他們使用網絡或操作軟件。但視頻游戲為開發(fā)和測試Agents提供了一個良好的沙盒環(huán)境,因為它們提供了復雜的環(huán)境,可以在其中對Agents進行測試和改進。“使它們更加精確是我們正在積極努力的事情,”Google DeepMind的研究科學家Tim Harley告訴我?!拔覀冇懈鞣N各樣的想法?!?/p>
在接下來的幾個月里,你可以期待更多關于AI Agents的新聞。Google DeepMind的CEO Demis Hassabis最近告訴我,他計劃將大型語言模型與公司先前訓練AI程序玩視頻游戲的工作相結合,以開發(fā)更具能力和可靠性的Agents?!斑@絕對是一個巨大的領域。我們正在大力投資這個方向,我想其他公司也在這樣做,”Hassabis說道?!爱斔鼈冮_始變得更像Agents時,這將是這些類型系統(tǒng)能力的一個重大飛躍?!?/p>
本文轉載自 ??MoPaaS魔泊云??,作者: Will Knight
