為什么在人工智能時代基礎設施必須是無服務器的
開發(fā)者們正從創(chuàng)建單個應用程序轉向編排由 AI 構建的應用程序集群。
譯自Why Infrastructure Must Be Serverless in the AI Age,作者 Nikita Shamgunov。
Replit 的新 AI 代理將編寫您的代碼,然后配置、調(diào)配、構建和部署該代碼,只需幾秒鐘。您可以在 VS Code 加載所有擴展程序之前,從自然語言描述到已實現(xiàn)的、可運行的應用程序。
如果一個 AI 代理可以在幾秒鐘內(nèi)構建和部署一個應用程序,那么幾分鐘的時間來啟動資源就太長了。如果一個 AI 代理每小時可以啟動和關閉數(shù)千個這樣的應用程序,那么每個數(shù)據(jù)庫 10 美元的成本就變成了極高的開銷。突然之間,我們從一個開發(fā)人員團隊部署單個應用程序變成了單個開發(fā)人員部署一組應用程序,所有應用程序都在 AI 代理的指導下工作。
這種方法改變了對開發(fā)的看法,并要求對基礎設施有新的認識。傳統(tǒng)的基礎設施對于代理工作流程來說太慢、太永久且太復雜?;A設施的未來需要即時的、無服務器的和簡化的工具——這就是必須構建的內(nèi)容。
AI 代理基礎設施的核心需求
AI 代理的運行規(guī)模和速度使得傳統(tǒng)的基礎設施管理在技術上和經(jīng)濟上都不切實際。良好的“代理體驗”將強調(diào)三個核心特性:
1. 簡易性
任何代碼和集成都需要簡單。這個世界將建立在簡單的 API 調(diào)用而不是 IAM 策略和多步驟配置之上??紤]啟動一個新的 RDS 實例:VPC、安全組、規(guī)則、子網(wǎng)組和 IAM 角色。每個步驟都需要多個 API 調(diào)用、選項的考慮和故障排除。
DevOps 工程師了解這些依賴關系,并且可以在出現(xiàn)問題時進行調(diào)試。AI 代理需要一切第一次和每次都能完美運行。這種復雜性不僅僅是進入的障礙;它是自動化的障礙。這就是在 Neon 上啟動數(shù)據(jù)庫所需的:
來自@neondatabase/toolkitSDK 的代碼示例
三行代碼即可配置數(shù)據(jù)庫,一次 API 調(diào)用,即可立即使用。這不僅僅是更好的開發(fā)者體驗——這是使 AI 代理能夠訪問基礎設施的唯一方法。這種簡易性還有助于兩個因素:
- 成本:更多步驟 = 更多成本。代理進行的每個 API 調(diào)用都會消耗令牌,而復雜的基礎設施操作可能需要數(shù)十次調(diào)用。簡單的 API 不僅僅是更易于使用;它們從根本上來說在大規(guī)模情況下更經(jīng)濟。
- 安全性:盡管 AWS RDS 設置非常安全,但您不能將您的根密鑰交給機器?,F(xiàn)代基礎設施需要進行沙盒化和自包含,并具有清晰的邊界,讓代理可以自由地進行實驗,而不會危及生產(chǎn)系統(tǒng)。
2. 即時性
上面的代碼可以在一秒鐘內(nèi)啟動一個新的數(shù)據(jù)庫,供代理使用。
在代理驅動的世界中,傳統(tǒng)的基建時間線需要修改。代碼創(chuàng)建速度曾經(jīng)是開發(fā)中的速率限制因素,但是當 AWS RDS 實例需要 10 分鐘來配置時,該基礎設施就變成了速率限制因素。
轉向即時性模型與人工智能一樣,開啟了無限可能。代理驅動開發(fā)的核心原則是可處置性。代理可能會創(chuàng)建一個應用程序,對其進行測試,并在幾分鐘內(nèi)將其丟棄。基礎設施需要匹配此生命周期——在需要時立即啟動,并在不需要時同樣快速地消失。代理應該能夠在傳統(tǒng)數(shù)據(jù)庫啟動所需的時間內(nèi)構建和銷毀一個一次性應用程序。
短暫性
這也引出了可處置應用程序的關鍵組成部分——短暫性。傳統(tǒng)方法假設應用程序是永久的,因此它需要永久的基礎設施。
并非如此。看看開發(fā)人員如何使用 Vercel 的v0,這是一個用于從文本提示生成應用程序的開發(fā)工具。您無需在線搜索“抵押貸款計算器”,而是可以要求v0為您創(chuàng)建一個:
圖片
這有效。它不需要基礎設施,但這可能是下一步。最重要的是,用戶可以在單個會話中使用 AI 構建大量內(nèi)容。絕大多數(shù)內(nèi)容會被丟棄且不再使用,但有些內(nèi)容可能會被共享并轉化為長期存在的應用程序。這是工具的未來——你使用 AI 和 AI 代理精確構建你想要的東西,并留下一串廢棄的替代方案。
這需要一個可以縮放到零的基礎設施。當資源未被使用時,其成本應降至零。有了這種能力,一次性應用程序的經(jīng)濟效益將會實現(xiàn)。想象一下,一家公司在使用 AI 構建的過程中每小時啟動數(shù)十個數(shù)據(jù)庫。誰來刪除未使用的數(shù)據(jù)庫?誰來決定哪些數(shù)據(jù)庫未使用?
當基礎設施能夠真正縮放到零時,它將啟用新的開發(fā)模式。代理可以自由地嘗試不同的方法,并行測試多個解決方案,而無需擔心清理或持續(xù)成本。這消除了開發(fā)過程中的經(jīng)濟限制——你不再需要仔細考慮每個新數(shù)據(jù)庫或服務的成本影響。
結果是一個資源真正可丟棄的開發(fā)環(huán)境。創(chuàng)建你需要的內(nèi)容,根據(jù)需要使用它,并在完成后讓它消失。這不僅僅是更高效——這是使代理驅動的開發(fā)在大規(guī)模上經(jīng)濟可行的唯一方法。
更簡單、更快、更便宜——選擇三個
在六個月內(nèi),我們已經(jīng)從Cognition AI 的 Devin AI 程序員的演示發(fā)展到 Replit 的 AI 開發(fā)人員/DevOps 代理在實際工作中運行。明年這個時候的 SOTA 會是什么樣子?
沒有人知道,但很清楚什么樣的基礎設施會讓我們到達那里。該基礎設施必須從人類開發(fā)人員轉移到作為構建者的 AI 代理。但創(chuàng)建良好的 AgentEx 也將使我們構建良好的 DevEx,因為更簡單、更快和更便宜也適用于循環(huán)中的人類。這種良性循環(huán)——AI 代理的改進為人類創(chuàng)造了更好的工具,反之亦然——將加速開發(fā)人員構建和部署軟件的方式的轉變。