自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<strong id="zayka"><li id="zayka"><menuitem id="zayka"></menuitem></li></strong>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨立部署問題原創(chuàng)

發(fā)布于 2024-10-9 09:52

瀏覽

0收藏

“ 大模型產(chǎn)品的技術(shù)復雜度遠遠超出你的想象 ”

最近一段時間公司在搞AIGC領(lǐng)域的產(chǎn)品，雖然集成了很多第三方的大模型服務接口，但從節(jié)省成本的角度，公司也找了一部分具有相似效果的開源模型做獨立部署。

但在做模型獨立部署方面面對著各種各樣的問題，而且環(huán)境極不穩(wěn)定，因此就引發(fā)了關(guān)于大模型企業(yè)級應用中的環(huán)境部署和運維的問題。

關(guān)于大模型在企業(yè)生產(chǎn)中的部署問題

首先拋開成本問題從技術(shù)的角度來說，小公司獨立部署大模型會很吃力，因為大模型部署是一個系統(tǒng)性的問題。涉及到算力，大模型，服務接口，并發(fā)問題等多個環(huán)節(jié)，設(shè)計到系統(tǒng)運維，鏡像，監(jiān)控，系統(tǒng)架構(gòu)等多個方面。

企業(yè)獨立部署大模型主要涉及哪些問題點？

首先最基礎(chǔ)的就是算力問題，對大部分企業(yè)來說根本無力建屬于自己的機房，面對著動輒幾萬甚至幾十萬的算力機，對大部分企業(yè)來說都無法承擔。

因此，購買或租用一些云端算力機是一個比較好的選擇，但云端算力機也只是一個一個獨立的機器，在應用層面并沒有提供自己集群部署和運維的能力。

關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨立部署問題-AI.x社區(qū)

當然，并不是說云計算做不到這一點，而是能做到這一點的云服務商機器的價格都比較貴；因此，對很多小微企業(yè)來說，都會選擇一臺或多臺算力能夠簡單支持業(yè)務正常運營的機器，然后做人肉運維。

比如我們公司，就是購買了幾臺云端算力機，在上面部署幾個模型，然后天天出問題，一個問題查一天。

從大模型的部署角度來看，部署大模型無非以下幾種方式：

最簡單的是一些小模型，單臺機器就能夠支撐其運算需求，這時在企業(yè)生產(chǎn)中只需要在多臺機器上部署多個相同的模型，然后在入口做一個負載均衡就可以了。

但如果沒有完整的運維系統(tǒng)，全靠人肉運維，這樣會把運維和技術(shù)人員給累死。

先說這種模式經(jīng)常出現(xiàn)的一些問題，比如怎么檢測大模型服務的健康狀況？說白了就是怎么知道這些機器是否在正常運行？一臺機器一臺機器的看嗎？

再有，如果某臺機器出問題了，怎么快速定位到這臺機器上？大模型的集群部署是否有自動健康檢測系統(tǒng)？

我想很多企業(yè)都做不到這一點，一旦出問題只能靠技術(shù)人員慢慢排查；而這還不包括一些莫名其妙的問題。

關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨立部署問題-AI.x社區(qū)

比如說我自己，前幾天遇到一個bug，AIGC的任務無法提交到大模型，本來以為任務無法提交是因為自己的模塊有bug，然后查了一下午時間發(fā)現(xiàn)是因為算力機出問題導致業(yè)務端無法獲取到算力機，然后間接導致任務無法提交。

而如果是那種參數(shù)量和算力要求巨大的模型，單機部署就無法實現(xiàn)，只能依靠集群的并行計算能力，但換句話說能做到大模型集群并行計算的公司又有多少？

模型不同模塊之間怎么部署，怎么監(jiān)控，怎么解決它們的通訊問題，某些模塊的算力瓶頸怎么解決？遇到高并發(fā)問題怎么解決？是使用異步通訊，還是使用消息隊列做削峰處理？中間引入的異步通訊模塊或消息隊列中間件怎么保證穩(wěn)定性？

最重要的是，在出現(xiàn)生產(chǎn)問題時怎么做到及時的響應，并快速恢復上線，把影響降到最小？而這些靠人工來做是不可能完成的，但大部分企業(yè)又沒有能力構(gòu)建完善的運維系統(tǒng)。

再有在大部分小微企業(yè)中，老板或者領(lǐng)導最看重的就是業(yè)務的開發(fā)進度，而不是系統(tǒng)運維的難度。業(yè)務開發(fā)時間被不斷的壓縮，各種業(yè)務bug已經(jīng)讓人不厭其煩，再加上模型服務的不穩(wěn)定性，真的是讓人崩潰。

關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨立部署問題-AI.x社區(qū)

還有就是很多小公司為了省錢，前期也不肯找一個有能力，有經(jīng)驗的架構(gòu)師做系統(tǒng)架構(gòu)，很多小項目都是匆匆上馬，開發(fā)人員素質(zhì)不齊，導致大量的設(shè)計缺陷和業(yè)務漏洞，還包括一些項目管理混亂，簡直就是群魔亂舞。

就拿作者自己的公司來說，采用的就是租用云算力服務商的算力機，把模型服務獨立部署在云端；而為了提高擴展性，就通過調(diào)用云算力服務商的接口，根據(jù)業(yè)務壓力動態(tài)進行擴容，也就是用鏡像的方式啟動多臺相同環(huán)境的機器；然后業(yè)務端通過輪訓或其它方式來進行動態(tài)選擇算力機。

然后為了解決可能存在的性能壓力，因此就采用消息隊列的方式做擴容；但由于業(yè)務時間緊，項目開發(fā)都是以完成功能為主，因此就導致整個擴容模塊沒有數(shù)據(jù)一致性處理，代碼沒注釋，業(yè)務邏輯混亂，日志不全。

隨便某個中間環(huán)節(jié)出問題，就只能從頭開始排查，無法準確定位到問題產(chǎn)生的時間，地點和方式。

說了這么多，其實從根吧上來說還是很多小微企業(yè)的老板對整個技術(shù)沒有一個完整的認識；大模型技術(shù)本身就極具復雜性，由于其龐大的算力需求就導致單機部署基本成為不可能。

而集群化部署的復雜性又是不可想象的，因此其運維的難度與傳統(tǒng)運維相比完全不可同日而語。

再加上需要把大模型與具體的業(yè)務相結(jié)合，而怎么設(shè)計大模型的服務接口，不但要保證功能性，還要保證穩(wěn)定性和擴展性；而這就需要有著足夠強大的業(yè)務理解和梳理能力，以及強大的接口抽象能力。

而以上種種，任何一個都不是普通人能輕易完成的任務。

因此從各方面來看對小企業(yè)來說，獨立部署大模型都不是一個好的選擇，表面上來看好像是節(jié)約了成本；但事實上不但大大增加了運維的難度和成本，最重要的是大大提高了系統(tǒng)的運行風險，導致整個系統(tǒng)風險不可控。

其次，大量的運維問題會占用技術(shù)和開發(fā)人員大量的時間；就比如說運維方面出了一個小問題，就很可能導致整個開發(fā)進度被耽誤，開發(fā)人員會遇到各種各樣莫名其妙的問題，而無從下手。

因此，選擇一個三方模型雖然成本可能會高一點，但可以讓你完全專注于自己的核心業(yè)務，減少系統(tǒng)性風險以及各種亂七八糟的問題。

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/LPa5V-wWLKTSoGSTfiQZDA???

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責任

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

ICLR 2024：確定性與隨機環(huán)境中的effective horizon！

AIGC最前線 ? 2630瀏覽 ? 0回復
大模型“分區(qū)”部署在云和邊緣更合適？

51CTO技術(shù)棧 ? 2304瀏覽 ? 0回復
什么時候需要訓練和微調(diào)屬于自己的大模型——小微企業(yè)必須要明白的問題

AI探索時代 ? 2015瀏覽 ? 0回復
大模型技術(shù)在AIGC領(lǐng)域所面臨的主要問題

AI探索時代 ? 2507瀏覽 ? 0回復
智能體在連續(xù)環(huán)境中的路徑優(yōu)化與沖突解決

xuxiangda ? 3208瀏覽 ? 0回復
為什么將RAG擴展到生產(chǎn)環(huán)境如此困難？

丟翅膀的魚 ? 1933瀏覽 ? 0回復
如何基于一臺MacBook搞定企業(yè)級大模型知識庫部署

玄姐聊AGI ? 2216瀏覽 ? 0回復
關(guān)于大模型在企業(yè)級應用中的選擇問題疑問回復

AI探索時代 ? 1716瀏覽 ? 0回復
關(guān)于大模型微調(diào)與訓練的問題，大模型訓練的難點在哪里？

AI探索時代 ? 2183瀏覽 ? 0回復
生產(chǎn)環(huán)境測試模型的四種方法

魚蟲子 ? 1917瀏覽 ? 0回復
AI大模型在GIS中的應用

zhishan15 ? 3945瀏覽 ? 0回復
在趨動云上使用xinference部署大模型

一起AI技術(shù) ? 2558瀏覽 ? 0回復
4090單卡部署滿血 671B DeepSeek，本地部署“成本驟降32倍”?。。?/a>

玄姐聊AGI ? 6152瀏覽 ? 0回復
企業(yè)部署DeepSeek的AI基礎(chǔ)設(shè)施方案建議

夜行神魚 ? 2148瀏覽 ? 0回復
【模型部署】在Dify中接入ComfyUI+Flux實現(xiàn)文生圖

一起AI技術(shù) ? 3043瀏覽 ? 0回復
關(guān)于大模型智能體意圖識別不準確問題——function call的缺陷

AI探索時代 ? 1065瀏覽 ? 0回復
在企業(yè)場景中應該怎么部署大模型——大模型企業(yè)級部署框架介紹

AI探索時代 ? 1395瀏覽 ? 0回復
關(guān)于打造高質(zhì)量RAG系統(tǒng)的問題記錄

AI探索時代 ? 834瀏覽 ? 0回復
大模型數(shù)據(jù)預處理——關(guān)于復雜文檔在大模型應用中的解決方案

AI探索時代 ? 550瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

關(guān)于RAG應用中怎么高質(zhì)量的進行數(shù)據(jù)召回——召回策略的研究 1天前發(fā)布
關(guān)于基于RAG技術(shù)的智能客服系統(tǒng)解決方案 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：從檢索增強——RAG看檢索技術(shù)的發(fā)展

下一篇：人工智能的三個階段計算智能，感知智能和認知智能

社區(qū)精華內(nèi)容

目錄

<acronym id="ax4bw"><p id="ax4bw"></p></acronym>