2025最新版DeepSeek保姆級安裝教程:本地部署+避坑指南
本文旨在提供一個全面且詳細的DeepSeek本地部署指南,幫助大家在自己的設備上成功運行DeepSeek模型。無論你是AI領域的初學者還是經驗豐富的開發(fā)者,都能通過本文的指導,輕松完成DeepSeek的本地部署。
一、本地部署的適用場景
DeepSeek本地部署適合以下場景:
- 高性能硬件配置:如果你的電腦配置較高,特別是擁有獨立顯卡和足夠的存儲空間,那么本地部署將能充分利用這些硬件資源。
- 數據安全需求:對于需要處理敏感數據的用戶,本地部署可以避免數據上傳至云端,確保數據的安全性和隱私性。
- 高頻任務處理:對于需要頻繁處理大量或復雜任務的用戶,本地部署能提供更高的靈活性和響應速度。
- 成本控制:對于日常使用量大、API調用費用較高的用戶,本地部署能顯著降低運行成本。
- 個性化需求:本地部署允許用戶對模型進行二次開發(fā)和定制,滿足特定的應用場景和需求。
二、環(huán)境準備與依賴安裝
1. 硬件要求
- 操作系統(tǒng):推薦Linux(如Ubuntu 20.04及以上版本)或Windows系統(tǒng)。
- Python版本:需要安裝Python 3.8及以上版本。
- GPU支持:需要支持CUDA的NVIDIA GPU,推薦顯存16GB及以上。
2.硬件配置
模型 | 顯存需求 | 內存需求 | 推薦顯卡 |
7B | 10-12GB | 16GB | RTX 3060 |
14B | 20-24GB | 32GB | RTX 3090 |
32B | 40-48GB | 64GB | RTX 4090 |
3. 軟件依賴
- CUDA與CUDNN:根據NVIDIA GPU型號和驅動版本,安裝合適的CUDA(11.2及以上版本)和CUDNN(8.1及以上版本)。
4. 安裝步驟
更新系統(tǒng)(Linux為例)
sudo apt-get update
安裝必要依賴
sudo apt-get install -y python3-pip python3-dev python3-venv git
創(chuàng)建并激活虛擬環(huán)境
python3 -m venv deepseek-env
source deepseek-env/bin/activate
安裝PyTorch
根據CUDA版本選擇合適的PyTorch安裝命令。例如,CUDA 11.2的安裝命令如下:
pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu112
三、DeepSeek模型下載與部署
1. 克隆DeepSeek代碼庫
git clone https://github.com/deepseek-ai/deepseek.git
cd deepseek
2. 安裝項目依賴
pip install -r requirements.txt
3. 下載并放置預訓練模型
從官方提供的鏈接下載DeepSeek預訓練模型權重,并將其放置在models/
目錄下。
wget [官方鏈接] -O models/deepseek_model.pth
4. 配置環(huán)境變量
設置模型路徑和GPU設備號等環(huán)境變量
export MODEL_PATH=models/deepseek_model.pth
export CUDA_VISIBLE_DEVICES=0
5. 運行模型
使用以下命令啟動DeepSeek模型進行推理或訓練。
python run.py --model_path $MODEL_PATH --input "你的輸入文本"
四、簡化部署方案:使用Ollama
對于初學者或不希望手動配置環(huán)境的用戶,可以使用Ollama工具簡化DeepSeek的本地部署過程。
1.下載安裝Ollama
在本地部署DeepSeek會使用到Ollama,所以,需要現在本地下載安裝Ollama。
Ollama官方地址:https://ollama.com
圖片
小伙伴們可以根據自己的需要下載MacOS、Linux和Windows版本的Ollama,由于冰河目前使用的是Windows系統(tǒng),所以,這里我下載的是Windows版本的Ollama。
下載后在本地安裝Ollama。
2.下載DeepSeek-R1
(1)定位Models
進入Ollama官網,找到Models。
圖片
(2)找到DeepSeek-R1模型
圖片
(3)選擇對應的模型下載
DeepSeek-R1有很多不同的版本可供下載,例如1.5b、7b、8b、14b、32b、70b或671b,版本越高,模型越大,對于電腦的內存、顯卡等資源的配置要求就越高。
這里為了方便安裝演示,我先給大家演示如何部署8b的模型。后續(xù)帶著大家在服務上部署更高版本的模型。
進入DeepSeek-R1模型的詳情,選擇8b模型,如下所示。
(4)打開電腦終端
以管理員身份打開電腦終端,如下所示。
圖片
(5)部署8b模型
首先,如下圖所示復制8b模型的代碼。
圖片
隨后,將其粘貼到命令行終端,如下所示。
圖片
如果出現下圖所示的進度,則說明正在下載模型。
圖片
等待一段時間,如果出現success字樣,則說明部署成功,如下所示。
圖片
部署成功后,我們可以試著在命令行發(fā)送一條消息給DeepSeek,這里我發(fā)送一個“你好”給DeepSeek。
圖片
可以看到,向DeepSeek發(fā)送你好后,它也回復了一段內容。
至此,我們就可以和DeepSeek在命令行進行對話了。不過,只是在命令行與DeepSeek對話,那就顯得有點不怎么方便了,所以,我們繼續(xù)部署Chatbox。
3.安裝Chatbox
通過部署Chatbox,我們可以使用在網頁或者客戶端與DeepSeek進行交互。Chatbox的安裝步驟如下所示。
(1)下載安裝Chatbox
Chatbox官網:https://chatboxai.app/zh
直接進入官網下載客戶端,如下所示。
圖片
下載完成后,雙擊進行安裝即可。
(2)配置DeepSeek-R1模型
打開Chatbox,選擇設置—>Ollama API,如下所示。
圖片
選擇已經安裝好的DeepSeek-R1 8b模型,進行保存。
圖片
等待部署完成,就可以在Chatbox頁面中與DeepSeek進行對話了。
六、安裝Open-WebUI
1.安裝Docker
安裝Open-WebUI前,我們可以先安裝Docker。進入Docker官網:https://www.docker.com,下載Docker。
圖片
下載后安裝到自己電腦即可。
2.安裝open-webui
如果是在Linux系統(tǒng)下,則可以打開命令行,輸入以下命令安裝 Open-WebUI。
docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main
安裝完成后,打開瀏覽器,訪問 http://localhost:3000,注冊一個賬號并登錄,即可進入open-webui。
在界面左上角選擇對應的模型,即可開始對話。
如果是Windows系統(tǒng),則在瀏覽器搜索Open-WebUI,進入官網,并復制下圖所示的命令。
圖片
隨后打開Windows命令行,輸入復制的命令后等待安裝完成。
安裝完成后,打開瀏覽器,訪問 http://localhost:3000,注冊一個賬號并登錄,即可進入open-webui。
七、常見問題解決方案
問題現象 | 解決方案 |
顯存不足報錯 | 使用量化模型或換用更小模型 |
響應速度慢 | 設置環(huán)境變量 |
生成內容中斷 | 輸入 |
中文輸出夾雜英文 | 在提問末尾添加「請使用純中文回答」 |
歷史記憶混亂 | 輸入 |