自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

用好云服務(wù),托起GenAI:從數(shù)據(jù)準(zhǔn)備到部署的全流程梳理

譯文 精選
人工智能 云計(jì)算
生成式AI與云技術(shù)的結(jié)合,為業(yè)務(wù)的創(chuàng)新和擴(kuò)展帶來了無限的可能。組織可以動(dòng)用云設(shè)施的靈活性、增強(qiáng)功能與成本效益克服擴(kuò)展問題,真正讓生成式AI成為踐行顛覆性效能的有力武器。?

譯者 | 核子可樂

審校 | 重樓

事實(shí)證明,云已經(jīng)成為大規(guī)模AI部署的主要陣地,其提供的快速原型設(shè)計(jì)、彈性計(jì)算及存儲(chǔ)等AI原生API,正是攻克擴(kuò)展問題的利器。本文將助快速梳理如何在云端構(gòu)建并擴(kuò)展生成式AI應(yīng)用程序。

云在生成式AI中的重要作用

云在當(dāng)代生成式AI應(yīng)用中的核心作用,在于其能夠容納AI模型所需要的巨大處理能力、數(shù)據(jù)存儲(chǔ)與分布式流程需求。相比之下,傳統(tǒng)部署往往無法在靈活性和性能等方面,適應(yīng)不斷變化的業(yè)務(wù)挑戰(zhàn)。

以Azure AI為例,其提供現(xiàn)成的算法和模型,同時(shí)輔以構(gòu)建并擴(kuò)展AI應(yīng)用程序所必需的各類基礎(chǔ)設(shè)施工具。

此外,依托云端的生成式AI項(xiàng)目還將受益于以下優(yōu)勢(shì):

  • 彈性配置:根據(jù)業(yè)務(wù)需求自動(dòng)或手動(dòng)配置資源。
  • 成本優(yōu)級(jí):AI工具支持多種配置項(xiàng),可自動(dòng)即時(shí)擴(kuò)展以優(yōu)化運(yùn)營(yíng)成本。此外大型云服務(wù)商還支持即用即付模式與混合云選項(xiàng)。所有這些改進(jìn)都有助于用戶將更多精力放在模型開發(fā)上,避免在硬件和基礎(chǔ)設(shè)施支持與管理方面耗費(fèi)心神。
  • 集成AI服務(wù):集成預(yù)訓(xùn)練的模型、API及各類高級(jí)工具包,加快產(chǎn)品上市速度。

憑借這些優(yōu)勢(shì),云已經(jīng)成為當(dāng)前生成式AI開發(fā)的核心,全面涵蓋大語言模型及多模態(tài)AI系統(tǒng)。

數(shù)據(jù)準(zhǔn)備

任何有效的生成式AI應(yīng)用,都離不開高質(zhì)量數(shù)據(jù)的支持。在準(zhǔn)備充分的不同數(shù)據(jù)集上訓(xùn)練模型,能夠大大提升其通用性與彈性。

數(shù)據(jù)準(zhǔn)備步驟

  • 數(shù)據(jù)收集與提?。?/span>此功能允許大家用指定的數(shù)據(jù)存儲(chǔ)工具對(duì)數(shù)據(jù)集進(jìn)行分類,還能在自動(dòng)提取管道的幫助下自動(dòng)從多個(gè)來源處傳輸數(shù)據(jù)。
  • 數(shù)據(jù)清洗與轉(zhuǎn)換:某些數(shù)據(jù)應(yīng)用程序有助于清洗未經(jīng)處理的數(shù)據(jù),并將其塑造成更有意義且實(shí)用的形式。
  • 數(shù)據(jù)注釋與治理:可使用注釋工具或云服務(wù),對(duì)某些生成式AI模型所需的特定數(shù)據(jù)集進(jìn)行注釋。示例集越豐富、結(jié)構(gòu)越好,也就越貼合模型的“時(shí)間周期”。

數(shù)據(jù)準(zhǔn)備最佳實(shí)踐

  • 數(shù)據(jù)治理:通過嚴(yán)格的數(shù)據(jù)保護(hù)、訪問及合規(guī)性以保障安全。
  • 云原生例規(guī):選定的技術(shù)提供商一道選定應(yīng)用策略以進(jìn)行用戶合規(guī)性驗(yàn)證。
  • 數(shù)據(jù)保護(hù):通過監(jiān)管數(shù)據(jù)保護(hù)措施以保護(hù)數(shù)據(jù)訪問,并確保遵守適用的法律。確保擁有廣泛的合規(guī)性認(rèn)證,包括但不限于SOC、GDPR和HIPAA。這些認(rèn)證承諾改善對(duì)敏感數(shù)據(jù)的管理。
  • 云原生安全:使用選定的工具提供商的現(xiàn)有安全方案(若有),借此通過持續(xù)監(jiān)控以確保滿足既定標(biāo)準(zhǔn)并預(yù)防高級(jí)威脅。

微調(diào)模型

各大云服務(wù)商還提供生成式AI模型訓(xùn)練與微調(diào)所需的全部資源,包括對(duì)資源進(jìn)行重新配置。

  • 預(yù)訓(xùn)練模型:合用已經(jīng)訓(xùn)練完成的模型(例如OpenAI GPT-4或DALL-E)能夠大大節(jié)約時(shí)間和成本。云GPU或TPU,以及Hugging Face等框架,可用于對(duì)這些模型進(jìn)行微調(diào)。
  • 分布式訓(xùn)練:某些機(jī)器學(xué)習(xí)工具支持分布式訓(xùn)練功能,可在云端多個(gè)節(jié)點(diǎn)間實(shí)現(xiàn)良好擴(kuò)展。

此外,在開發(fā)過程中認(rèn)真考慮AI道德問題也很重要。這些工具能夠有效解決人們對(duì)于AI偏見及公平性的合理擔(dān)憂,深入理解模型行為并對(duì)偏見進(jìn)行檢測(cè)與緩解。

大規(guī)模部署中的各項(xiàng)因素

在評(píng)估生成式AI模型之前,我們還須分析系統(tǒng)的可擴(kuò)展性、延遲與維護(hù)成本。

  • 托管模型:某些OpenAI模型通過可擴(kuò)展端點(diǎn)進(jìn)行部署,旨在實(shí)現(xiàn)超低延遲的高容量推理。其先進(jìn)的負(fù)載均衡器與彈性擴(kuò)展資源緩沖區(qū),可確保無論動(dòng)態(tài)負(fù)載如何均提供卓越服務(wù)。
  • 無服務(wù)器架構(gòu):無服務(wù)器計(jì)算可自動(dòng)創(chuàng)建適應(yīng)規(guī)模,消除對(duì)基礎(chǔ)設(shè)施單獨(dú)管理的需求和負(fù)擔(dān)。

CI/CD(持續(xù)集成/持續(xù)部署)能夠與機(jī)器學(xué)習(xí)模型良好集成,允許模型通過自動(dòng)化管道實(shí)現(xiàn)重新訓(xùn)練與測(cè)試部署。內(nèi)置的監(jiān)控與回滾功能可確??焖俑虑也恢庐a(chǎn)生過多風(fēng)險(xiǎn),因此成為管理高可用性及可靠性AI系統(tǒng)的理想選擇。

推理與實(shí)際應(yīng)用

推理結(jié)果(即由訓(xùn)練后模型生成的輸出),必須在延遲、吞吐量和成本方面做兼顧考量。

實(shí)時(shí)推理的注意事項(xiàng)

盡可能使用量化或模型修剪優(yōu)化技術(shù)以縮短推理時(shí)間,另外務(wù)必使用托管推理服務(wù)。

真實(shí)用例

  • 預(yù)測(cè)分析:使用分析方法了解不同模式與事實(shí),借此大大改善財(cái)務(wù)、醫(yī)療保健與物流決策。
  • 內(nèi)容自動(dòng)創(chuàng)建:使用AI生成各類不同風(fēng)格的書面內(nèi)容,包括創(chuàng)意寫作、營(yíng)銷或產(chǎn)品詳細(xì)信息。

使用生成式AI的挑戰(zhàn)

盡管生成式AI前景光明,但在云端擴(kuò)展其應(yīng)用仍面臨諸多困難,包括:

  • 基礎(chǔ)設(shè)施成本:若未正確理解基礎(chǔ)設(shè)施需求,可能導(dǎo)致資源過度配置或浪費(fèi)重要基礎(chǔ)設(shè)施。因此,負(fù)載測(cè)試與未來需求評(píng)估將至關(guān)重要。
  • 跨學(xué)科協(xié)作:即使是功能原型設(shè)計(jì),也往往需要由技術(shù)與領(lǐng)域知識(shí)兼?zhèn)涞目缏毮軋F(tuán)隊(duì)負(fù)責(zé)打理。
  • 業(yè)務(wù)協(xié)調(diào):每個(gè)模型都必須針對(duì)問題解法做調(diào)整,以便為實(shí)際業(yè)務(wù)提供價(jià)值。建議盡量促成數(shù)據(jù)科學(xué)家、產(chǎn)品經(jīng)理及其他利益相關(guān)方的通力配合。

總結(jié)

生成式AI與云技術(shù)的結(jié)合,為業(yè)務(wù)的創(chuàng)新和擴(kuò)展帶來了無限的可能。組織可以動(dòng)用云設(shè)施的靈活性、增強(qiáng)功能與成本效益克服擴(kuò)展問題,真正讓生成式AI成為踐行顛覆性效能的有力武器。

原文標(biāo)題:Build Scalable GenAI Applications in the Cloud: From Data Preparation to Deployment,作者:Aravind Nuthalapati

責(zé)任編輯:姜華 來源: 51CTO內(nèi)容精選
相關(guān)推薦

2024-06-11 13:05:22

2018-06-05 08:36:47

內(nèi)部部署云存儲(chǔ)

2023-11-06 14:42:25

2009-08-07 09:35:17

2016-10-17 09:33:24

大數(shù)據(jù)產(chǎn)業(yè)鏈場(chǎng)景應(yīng)用

2010-08-31 17:08:51

DHCP服務(wù)器

2020-10-27 07:08:06

2024-11-01 12:39:04

2012-05-14 11:07:27

2024-07-17 09:03:56

2019-01-29 14:09:12

可信云云計(jì)算云服務(wù)

2023-11-16 17:27:07

GenAI人工智能

2021-08-07 21:51:17

服務(wù)器網(wǎng)站部署

2023-01-12 22:00:48

2018-01-16 12:31:33

Python爬蟲數(shù)據(jù)

2025-04-30 10:55:46

2021-03-16 12:08:32

Python 服務(wù)器腳本

2013-04-07 10:10:23

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)