自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

云端部署大模型的三個(gè)秘密原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-4-24 13:07

瀏覽

0收藏

編譯 | 星璇

出品 | 51CTO技術(shù)棧（微信號(hào)：blog51cto）

在過去的兩年里，我更多地參與了使用大型語言模型（LLMs）的生成式AI項(xiàng)目，而非傳統(tǒng)的系統(tǒng)。我開始懷念無服務(wù)器云計(jì)算。它們的應(yīng)用范圍廣泛，從增強(qiáng)對(duì)話式AI到為各行各業(yè)提供復(fù)雜的分析解決方案，以及其他許多功能。許多企業(yè)將這些模型部署在云平臺(tái)上，因?yàn)楣苍铺峁┥桃呀?jīng)提供了現(xiàn)成的生態(tài)系統(tǒng)，而且這是阻力最小的路徑。然而，這并不便宜。

云還提供了其他好處，如可擴(kuò)展性、效率和高級(jí)計(jì)算能力（按需提供GPU）。在公共云平臺(tái)上部署LLM的過程有一些鮮為人知的秘密，它們可能會(huì)對(duì)成功或失敗產(chǎn)生重大影響。也許是因?yàn)樘幚鞮LMs的AI專家并不多，也因?yàn)槲覀冊(cè)谶@方面還沒有太多經(jīng)驗(yàn)，我們的知識(shí)體系中存在很多空白。

讓我們探討三個(gè)在云上部署LLM時(shí)鮮為人知的“技巧”，也許你的AI工程師們也不知道?？紤]到這些工程師的年薪往往超過30萬美元，也許現(xiàn)在是時(shí)候考考他們做這些事情的細(xì)節(jié)了。我看到每個(gè)人都像頭發(fā)著火一樣奔向生成式AI，但犯的錯(cuò)誤比以往任何時(shí)候都多。

1.管理成本效益和可擴(kuò)展性

使用云平臺(tái)部署LLMs的主要吸引力之一是能夠按需擴(kuò)展資源。我們不必成為優(yōu)秀的容量規(guī)劃師，因?yàn)樵破脚_(tái)擁有我們只需點(diǎn)擊鼠標(biāo)或自動(dòng)分配的資源。

但是，等等，我們即將犯下當(dāng)初使用云計(jì)算時(shí)犯下的同樣錯(cuò)誤。在擴(kuò)展的同時(shí)管理成本是一項(xiàng)技能，許多人需要在這方面獲得幫助以進(jìn)行有效導(dǎo)航。請(qǐng)記住，云服務(wù)通常根據(jù)消耗的計(jì)算資源收費(fèi)；它們就像公共事業(yè)一樣運(yùn)作。處理得越多，付費(fèi)就越多。考慮到GPU的成本更高（且耗電量更大），這是使用公共云提供商的LLMs時(shí)的核心關(guān)注點(diǎn)。

請(qǐng)確保您使用成本管理工具，包括云平臺(tái)提供的工具和可靠的第三方成本治理和監(jiān)控服務(wù)商（finops）提供的工具。例如，實(shí)施自動(dòng)擴(kuò)展和調(diào)度、選擇合適的實(shí)例類型或使用搶占式實(shí)例來優(yōu)化成本。此外，請(qǐng)記得持續(xù)監(jiān)控部署情況，根據(jù)使用情況而不是僅根據(jù)預(yù)測(cè)負(fù)載調(diào)整資源。這意味著不惜一切代價(jià)避免過度配置（明白我這里的雙關(guān)了嗎？）。

2.多租戶環(huán)境中的數(shù)據(jù)隱私

部署LLMs通常涉及處理大量數(shù)據(jù)和訓(xùn)練過的知識(shí)模型，這些可能包含敏感或?qū)Ｓ袛?shù)據(jù)。使用公共云的風(fēng)險(xiǎn)在于，你的“鄰居”是以處理實(shí)例的形式存在，它們?cè)谕晃锢碛布线\(yùn)行。因此，公共云確實(shí)存在這樣的風(fēng)險(xiǎn)：在數(shù)據(jù)存儲(chǔ)和處理過程中，數(shù)據(jù)可能會(huì)被公共云數(shù)據(jù)中心中同一物理硬件上運(yùn)行的其他虛擬機(jī)訪問。

如果你詢問公共云提供商有關(guān)此問題，他們會(huì)急忙拿出最新的PowerPoint演示文稿，展示這是不可能的。雖然這主要是真的，但并不完全準(zhǔn)確。所有多租戶系統(tǒng)都存在這種風(fēng)險(xiǎn)；你需要加以緩解。我發(fā)現(xiàn)，云提供商的規(guī)模越小，比如那些僅在單一國(guó)家運(yùn)營(yíng)的云提供商，這種問題出現(xiàn)的可能性就越大。這適用于數(shù)據(jù)存儲(chǔ)和LLMs。

秘訣在于選擇符合嚴(yán)格安全標(biāo)準(zhǔn)并能提供證明的云提供商：靜止和傳輸中的數(shù)據(jù)加密、身份和訪問管理（IAM）以及隔離策略。當(dāng)然，更好的做法是你實(shí)施自己的安全策略和安全技術(shù)棧，以確保在云上使用多租戶LLMs的風(fēng)險(xiǎn)較低。

3.處理有狀態(tài)模型部署

大型語言模型（LLMs）大多數(shù)都是有狀態(tài)的，這意味著它們會(huì)在一次交互到下一次交互之間保留信息。這個(gè)舊方法提供了新的好處：即在持續(xù)學(xué)習(xí)場(chǎng)景中提高效率的能力。然而，在云環(huán)境中管理這些模型的有狀態(tài)性是有挑戰(zhàn)性的，因?yàn)樵骗h(huán)境中的實(shí)例可能是按設(shè)計(jì)短暫或無狀態(tài)的。

支持有狀態(tài)部署的編排工具（如 Kubernetes）是有幫助的。它們可以為大型語言模型利用持久性存儲(chǔ)選項(xiàng)，并配置為跨會(huì)話維護(hù)和操作其狀態(tài)。為了支持大型語言模型的連續(xù)性和性能，您需要這樣做。

隨著生成式人工智能的爆炸式增長(zhǎng)，在云平臺(tái)上部署大型語言模型已成定局。對(duì)于大多數(shù)企業(yè)來說，不使用云實(shí)在是太不方便了。我對(duì)接下來這股狂熱的擔(dān)憂是，我們會(huì)錯(cuò)過一些容易解決的問題，并會(huì)犯下巨大而昂貴的錯(cuò)誤，而這些錯(cuò)誤在最終大多是可以避免的。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：星璇

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

與機(jī)器對(duì)話：揭示提示工程的十個(gè)秘密

51CTO內(nèi)容精選 ? 2046瀏覽 ? 0回復(fù)
你想在本地部署大模型嗎？本地部署大模型的三種工具

AI探索時(shí)代 ? 4808瀏覽 ? 0回復(fù)
三個(gè)臭皮匠與一個(gè)諸葛亮：覆蓋率與正確率的博弈

魯班模錘1 ? 1813瀏覽 ? 0回復(fù)
Meta發(fā)布Llama 3.2：AI大模型再升級(jí)，從云端到掌上

芝士AI吃魚 ? 2475瀏覽 ? 0回復(fù)
人工智能的三個(gè)階段計(jì)算智能，感知智能和認(rèn)知智能

AI探索時(shí)代 ? 3469瀏覽 ? 0回復(fù)
OpenAI奧特曼最新對(duì)話：將很快進(jìn)入智能體階段；OpenAI最初三個(gè)目標(biāo)一個(gè)已失效；智慧和能源可解鎖AGI

51CTO技術(shù)棧 ? 1973瀏覽 ? 0回復(fù)
對(duì)于Advanced RAG系統(tǒng)，你不得不知道的三個(gè)階段優(yōu)化技巧

AI博物院 ? 2001瀏覽 ? 0回復(fù)
對(duì)于Advanced RAG系統(tǒng)你不得不知道的三個(gè)階段優(yōu)化技巧

AI博物院 ? 2309瀏覽 ? 0回復(fù)
大模型部署調(diào)用(vLLM+LangChain)

一起AI技術(shù) ? 4484瀏覽 ? 0回復(fù)
黃仁勛新年演講最全總結(jié)：新推最強(qiáng)GPU，72塊連一起可以承載全球互聯(lián)網(wǎng)的流量！英偉達(dá)的三個(gè)野心

51CTO技術(shù)棧 ? 1944瀏覽 ? 0回復(fù)
AI指令的秘密：三個(gè)關(guān)鍵詞就能讓AI效果翻倍

草臺(tái)AI ? 1577瀏覽 ? 0回復(fù)
你的LLM評(píng)估方法過時(shí)了嗎？這三個(gè)范式轉(zhuǎn)變不容錯(cuò)過

Baihai_IDP ? 1819瀏覽 ? 0回復(fù)
4090單卡部署滿血 671B DeepSeek，本地部署“成本驟降32倍”?。?！

玄姐聊AGI ? 6133瀏覽 ? 0回復(fù)
傳統(tǒng)RAG的局限被打破！三個(gè)輕量級(jí)智能體分工協(xié)作，如何讓問答系統(tǒng)更精準(zhǔn)？

AI博物院 ? 1769瀏覽 ? 0回復(fù)
OpenAI深夜發(fā)布Agent開發(fā)三劍客！開源一個(gè)新的SDK，現(xiàn)場(chǎng)手搓三個(gè)Agent！還抖了一個(gè)內(nèi)部的料

51CTO技術(shù)棧 ? 1988瀏覽 ? 0回復(fù)
DeepSeek 部署全解析：三種方案對(duì)比與云端部署的顯著優(yōu)勢(shì)

AI算力補(bǔ)給站 ? 1157瀏覽 ? 0回復(fù)
在企業(yè)場(chǎng)景中應(yīng)該怎么部署大模型——大模型企業(yè)級(jí)部署框架介紹

AI探索時(shí)代 ? 1382瀏覽 ? 0回復(fù)
手把手帶你看懂自注意力機(jī)制：三個(gè)輸入一步步算到底

人工智能訓(xùn)練營(yíng) ? 455瀏覽 ? 0回復(fù)
部署一個(gè)大模型，到底需要多大機(jī)器？

hm673c38238a021 ? 1069瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴(kuò)展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇：微軟3.8B模型媲美GPT-3.5！小到用iPhone就能跑起來，網(wǎng)友：Good data is all you need!

下一篇：商湯科技Copilot技術(shù)應(yīng)用負(fù)責(zé)人張濤：大模型不能解決一切，AI產(chǎn)品需要領(lǐng)域知識(shí)

社區(qū)精華內(nèi)容

目錄

<sub id="2g6nz"></sub>

^{<sub id="2g6nz"><rt id="2g6nz"></rt></sub>}

<sub id="2g6nz"></sub>

<blockquote id="2g6nz"><rt id="2g6nz"></rt></blockquote>

<style id="2g6nz"></style>