用好云服務,托起GenAI:從數(shù)據(jù)準備到部署的全流程梳理 原創(chuàng)
事實證明,云已經(jīng)成為大規(guī)模AI部署的主要陣地,其提供的快速原型設計、彈性計算及存儲等AI原生API,正是攻克擴展問題的利器。本文將助你快速梳理如何在云端構建并擴展生成式AI應用程序。
云在生成式AI中的重要作用?
云在當代生成式AI應用中的核心作用,在于其能夠容納AI模型所需要的巨大處理能力、數(shù)據(jù)存儲與分布式流程需求。相比之下,傳統(tǒng)部署往往無法在靈活性和性能等方面,適應不斷變化的業(yè)務挑戰(zhàn)。
以Azure AI為例,其提供現(xiàn)成的算法和模型,同時輔以構建并擴展AI應用程序所必需的各類基礎設施工具。
此外,依托云端的生成式AI項目還將受益于以下優(yōu)勢:
- 彈性配置:根據(jù)業(yè)務需求自動或手動配置資源。?
- 成本優(yōu)級:AI工具支持多種配置項,可自動即時擴展以優(yōu)化運營成本。此外大型云服務商還支持即用即付模式與混合云選項。所有這些改進都有助于用戶將更多精力放在模型開發(fā)上,避免在硬件和基礎設施支持與管理方面耗費心神。?
- 集成AI服務:集成預訓練的模型、API及各類高級工具包,加快產(chǎn)品上市速度。?
憑借這些優(yōu)勢,云已經(jīng)成為當前生成式AI開發(fā)的核心,全面涵蓋大語言模型及多模態(tài)AI系統(tǒng)。
數(shù)據(jù)準備?
任何有效的生成式AI應用,都離不開高質(zhì)量數(shù)據(jù)的支持。在準備充分的不同數(shù)據(jù)集上訓練模型,能夠大大提升其通用性與彈性。
數(shù)據(jù)準備步驟?
- 數(shù)據(jù)收集與提?。?/strong>此功能允許大家用指定的數(shù)據(jù)存儲工具對數(shù)據(jù)集進行分類,還能在自動提取管道的幫助下自動從多個來源處傳輸數(shù)據(jù)。?
- 數(shù)據(jù)清洗與轉換:某些數(shù)據(jù)應用程序有助于清洗未經(jīng)處理的數(shù)據(jù),并將其塑造成更有意義且實用的形式。?
- 數(shù)據(jù)注釋與治理:可使用注釋工具或云服務,對某些生成式AI模型所需的特定數(shù)據(jù)集進行注釋。示例集越豐富、結構越好,也就越貼合模型的“時間周期”。?
數(shù)據(jù)準備最佳實踐?
- 數(shù)據(jù)治理:通過嚴格的數(shù)據(jù)保護、訪問及合規(guī)性以保障安全。?
- 云原生例規(guī):與你選定的技術提供商一道選定應用策略以進行用戶合規(guī)性驗證。?
- 數(shù)據(jù)保護:通過監(jiān)管數(shù)據(jù)保護措施以保護數(shù)據(jù)訪問,并確保遵守適用的法律。確保你擁有廣泛的合規(guī)性認證,包括但不限于SOC、GDPR和HIPAA。這些認證承諾改善對敏感數(shù)據(jù)的管理。?
- 云原生安全:使用你選定的工具提供商的現(xiàn)有安全方案(若有),借此通過持續(xù)監(jiān)控以確保滿足既定標準并預防高級威脅。?
微調(diào)模型?
各大云服務商還提供生成式AI模型訓練與微調(diào)所需的全部資源,包括對資源進行重新配置。
- 預訓練模型:合用已經(jīng)訓練完成的模型(例如OpenAI GPT-4或DALL-E)能夠大大節(jié)約時間和成本。云GPU或TPU,以及Hugging Face等框架,可用于對這些模型進行微調(diào)。?
- 分布式訓練:某些機器學習工具支持分布式訓練功能,可在云端多個節(jié)點間實現(xiàn)良好擴展。?
此外,在開發(fā)過程中認真考慮AI道德問題也很重要。這些工具能夠有效解決人們對于AI偏見及公平性的合理擔憂,深入理解模型行為并對偏見進行檢測與緩解。
大規(guī)模部署中的各項因素?
在評估生成式AI模型之前,我們還須分析系統(tǒng)的可擴展性、延遲與維護成本。
- 托管模型:某些OpenAI模型通過可擴展端點進行部署,旨在實現(xiàn)超低延遲的高容量推理。其先進的負載均衡器與彈性擴展資源緩沖區(qū),可確保無論動態(tài)負載如何均提供卓越服務。?
- 無服務器架構:無服務器計算可自動創(chuàng)建適應規(guī)模,消除對基礎設施單獨管理的需求和負擔。?
CI/CD(持續(xù)集成/持續(xù)部署)能夠與機器學習模型良好集成,允許模型通過自動化管道實現(xiàn)重新訓練與測試部署。內(nèi)置的監(jiān)控與回滾功能可確保快速更新且不致產(chǎn)生過多風險,因此成為管理高可用性及可靠性AI系統(tǒng)的理想選擇。
推理與實際應用?
推理結果(即由訓練后模型生成的輸出),必須在延遲、吞吐量和成本方面做兼顧考量。
實時推理的注意事項?
盡可能使用量化或模型修剪優(yōu)化技術以縮短推理時間,另外務必使用托管推理服務。
真實用例?
- 預測分析:使用分析方法了解不同模式與事實,借此大大改善財務、醫(yī)療保健與物流決策。?
- 內(nèi)容自動創(chuàng)建:使用AI生成各類不同風格的書面內(nèi)容,包括創(chuàng)意寫作、營銷或產(chǎn)品詳細信息。?
使用生成式AI的挑戰(zhàn)?
盡管生成式AI前景光明,但在云端擴展其應用仍面臨諸多困難,包括:
- 基礎設施成本:若未正確理解基礎設施需求,可能導致資源過度配置或浪費重要基礎設施。因此,負載測試與未來需求評估將至關重要。?
- 跨學科協(xié)作:即使是功能原型設計,也往往需要由技術與領域知識兼?zhèn)涞目缏毮軋F隊負責打理。?
- 業(yè)務協(xié)調(diào):每個模型都必須針對問題解法做調(diào)整,以便為實際業(yè)務提供價值。建議盡量促成數(shù)據(jù)科學家、產(chǎn)品經(jīng)理及其他利益相關方的通力配合。?
總結?
生成式AI與云技術的結合,為業(yè)務的創(chuàng)新和擴展帶來了無限的可能。組織可以動用云設施的靈活性、增強功能與成本效益克服擴展問題,真正讓生成式AI成為踐行顛覆性效能的有力武器。
原文標題:??Build Scalable GenAI Applications in the Cloud: From Data Preparation to Deployment??,作者:Aravind Nuthalapati
