自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

三分鐘學(xué)會(huì)計(jì)算DeepSeek的顯存內(nèi)存配置

人工智能
讓我們的程序也能借船出海搭上AI的快車,那么問題來了。如果我需要本地部署一個(gè)大模型需要什么配置的電腦呢?

DeepSeek本地部署

前段時(shí)間DeepSeek震驚了全世界。

不容易?。〗K于國內(nèi)有了自己的精品。

圖片圖片

但訪問過程中頻繁的 “服務(wù)器繁忙”,也讓很多人嘗而不得作為技術(shù)人員都在考慮如何充分利用開源的價(jià)值。

讓我們的程序也能借船出海搭上AI的快車,那么問題來了。如果我需要本地部署一個(gè)大模型需要什么配置的電腦呢?

顯卡、顯存怎么選配

模型的大小,決定了對硬件的需求。以 DeepSeek-R1 為例,1.5b、7b、32b、70b、671b 之間差距非常大。

圖片圖片

很多人埋怨說:我的大模型就是個(gè)“人工智障”,但你得反過來檢視一下是不是用的模型參數(shù)太少了?

我們談?wù)揂模型比B模型強(qiáng)大前提都是在同一個(gè)體量上,拿 7b 模型 對比 405b 模型本身就不是一個(gè)級別體量的。

官方給了一個(gè)模型版本和配置的對應(yīng)表:

如下:

參數(shù)量

FP16 顯存占用

INT8 顯存占用

INT4 顯存占用

1.5B

3.0GB

1.5GB

0.75GB

7B

14.0GB

7.0GB

3.5GB

8B

16.0GB

8.0GB

4.0GB

14B

28.0GB

14.0GB

7.0GB

32B

64.0GB

32.0GB

16.0GB

70B

140.0GB

70.0GB

35.0GB

671B

1342.0GB

671.0GB

335.5GB

比較直觀是吧!前幾天看到梁斌博士自己搭建了一個(gè)滿血版DeepSeek 671b 最強(qiáng)模型花了多少錢呢?

配置如下:

CPU
    AMD EPYC 9534 
    64核 128線程,2.5 GHz
    一共 2塊CPU 共128核
GPU
    AMD MI300X
    192 G
    一共 8塊GPU 共 1536 G 顯存
內(nèi)存
    1526 G

效果如下:

圖片圖片

這么一臺服務(wù)器下來250萬打底,還只是AMD的配置。畢竟 MI300 系列還是數(shù)據(jù)高性價(jià)比的產(chǎn)品換成 NVEDIA 的 H100 或者 A100價(jià)格至少上升 50%。

普通使用需要什么配置

我們大部分人都不追求極限,你們大佬用 671b 的我用個(gè) 7b 或者 32b 的就差不多了,但要如何計(jì)算配置?

網(wǎng)上有各種各樣的教材需要你理解 int8、fp16、float32 等等專業(yè)術(shù)語和公式。

圖片圖片

最簡單的方法

直接抄我的答案:用 參數(shù)量 ?? 系數(shù) 即可。常見的有int4 代表4位 系數(shù)0.5, int8 代表 8位 系數(shù)為1,fp16 代表16位 系數(shù)為2, float32 代表 32位 系數(shù)為4。

怎么看系數(shù)?如果我們是通過ollama下載的模型,打開下載頁。

圖片圖片

在 model 欄目會(huì)寫一個(gè)參數(shù):

quantization Q4_K_M

Q4 代表4位量化版本可以對標(biāo) int4,實(shí)際略高于 int4。如果按 int4 的系數(shù)取 0.5,這里可以估算在 0.7 ~ 0.8 左右,如果估算 DeepSeek 的 Q4 量化版本型數(shù)據(jù)推理以及10個(gè)線程的并發(fā)請求,我們系數(shù)取 0.8。所以,比如 計(jì)算 DeepSeek 14b 版本默認(rèn) fp16,則顯存需求為 14 ?? 0.8 = 11.2 G。

在滿足顯存的同時(shí)內(nèi)存用量最好為顯存的2倍用于加載模型和計(jì)算緩沖。以下給出幾個(gè)計(jì)算好的顯存數(shù)值,都是以 DeepSeek-R1 Q4量化版 為例的最低配置。

參數(shù)量

顯存

671B

536 GB

70B

56 GB

14B

11.2 GB

7B

5.6 GB

1.5B

1.2 GB

所以哪怕我們就是個(gè)普通的電腦跑個(gè)乞丐版 1.5b 通常問題不大,需要注意這里做了減法只包含基礎(chǔ)運(yùn)行和1個(gè)線程本地調(diào)用,如果需要更多訪問推理請適當(dāng)增加系數(shù)。

當(dāng)然我給的方法只是粗算:

可以進(jìn)入 https://huggingface.co/spaces/hf-accelerate/model-memory-usage

這個(gè)網(wǎng)站有個(gè)在線計(jì)算器,如圖:

圖片圖片

只要提供各項(xiàng)參數(shù)即可計(jì)算出配置要求,需要的朋友們可以自己嘗試一下。

責(zé)任編輯:武曉燕 來源: Java面試教程
相關(guān)推薦

2024-04-01 09:59:08

消息隊(duì)列通信微服務(wù)

2009-10-26 19:09:50

VB.NET轉(zhuǎn)換形態(tài)

2009-11-17 10:13:29

PHP正則表達(dá)式

2024-03-07 07:38:59

微服務(wù)HTTP客戶端

2021-10-22 09:09:43

Windows 11操作系統(tǒng)微軟

2024-03-28 08:07:42

RabbitMQ訂閱模式

2024-03-11 09:03:12

客戶端負(fù)載均衡Ribbon

2024-04-02 08:27:19

異步任務(wù)抽象

2021-04-20 13:59:37

云計(jì)算

2020-06-29 07:42:20

邊緣計(jì)算云計(jì)算技術(shù)

2024-05-16 11:13:16

Helm工具release

2009-11-09 12:55:43

WCF事務(wù)

2024-12-18 10:24:59

代理技術(shù)JDK動(dòng)態(tài)代理

2022-02-17 09:24:11

TypeScript編程語言javaScrip

2023-12-27 08:15:47

Java虛擬線程

2024-01-16 07:46:14

FutureTask接口用法

2024-08-30 08:50:00

2019-08-29 20:10:03

U盤系統(tǒng)Windows 10

2009-11-03 17:15:07

VB.NET開發(fā)Exc

2013-06-28 14:30:26

棱鏡計(jì)劃棱鏡棱鏡監(jiān)控項(xiàng)目
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號