自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="4nmx4"><track id="4nmx4"></track></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

DeepSeek 協(xié)程異步API 調(diào)用與llamafactory本地vllm部署推理

AI悠閑區(qū)

發(fā)布于 2025-4-1 07:26

瀏覽

0收藏

簡介

使用協(xié)程調(diào)用DeepSeek的API，發(fā)現(xiàn)效果并不明顯，沒有加速的效果。
但如是本地部署DeepSeek，本地部署需要支持異步調(diào)用，我使用 llamafactory 部署，發(fā)現(xiàn)協(xié)程加速的效果還是很顯著的。

代碼實戰(zhàn)

調(diào)用官方API

DeepSeek官方文檔 https://api-docs.deepseek.com/zh-cn/
python 的調(diào)用代碼如下，該調(diào)用方式為同步調(diào)用速度很慢。

# Please install OpenAI SDK first: `pip3 install openai`

from openai import OpenAI

client = OpenAI(api_key="<DeepSeek API Key>", base_url="https://api.deepseek.com")

response = client.chat.completions.create(
    model="deepseek-chat",
    messages=[
        {"role": "system", "content": "You are a helpful assistant"},
        {"role": "user", "content": "Hello"},
    ],
    stream=False
)
print(response.choices[0].message.content)

import os
from tqdm import tqdm
from dotenv import load_dotenv
# 加載 .env 文件的密鑰
load_dotenv()

api_key = os.getenv("deepseek_api")
queries = [
    "What is AI?",
    "How does deep learning work?",
    "Explain reinforcement learning.",
    "人工智能的應用領域有哪些？",
    "大模型是如何進行預訓練的？",
    "什么是自監(jiān)督學習，它有哪些優(yōu)勢？",
    "Transformer 結構的核心組件是什么？",
    "GPT 系列模型是如何生成文本的？",
    "強化學習在游戲 AI 中的應用有哪些？",
    "目前 AI 領域面臨的主要挑戰(zhàn)是什么？"
]

answer1 = []

for query in tqdm(queries):
    # 官方提供的API調(diào)用方式
    response = client.chat.completions.create(
        model="deepseek-chat",
        messages=[
            {"role": "system", "content": "You are a helpful assistant"},
            {"role": "user", "content": "Hello"},
        ],
        stream=False,
    )
    content = response.choices[0].message.content
    answer1.append(content)

為了防止在分享代碼的時候，導致 API Key 泄露，我把key保存到 .env 文件中，通過??load_dotenv??加載密鑰。

DeepSeek 協(xié)程異步API 調(diào)用與llamafactory本地vllm部署推理-AI.x社區(qū)

協(xié)程異步調(diào)用

import asyncio
from typing import List

# from langchain.chat_models import ChatOpenAI
from langchain_openai import ChatOpenAI
from langchain.schema import SystemMessage, HumanMessage

# 初始化模型
llm = ChatOpenAI(
    model_name="deepseek-chat",
    # model_name="deepseek-reasoner",
    openai_api_key=api_key,
    openai_api_base="https://api.deepseek.com/v1",
)


async def call_deepseek_async(query: str, progress) -> str:
    messages = [
        SystemMessage(cnotallow="You are a helpful assistant"),
        HumanMessage(cnotallow=query),
    ]
    response = await llm.ainvoke(messages)
    progress.update(1)
    return response.content


async def batch_call_deepseek(queries: List[str], concurrency: int = 5) -> List[str]:
    semaphore = asyncio.Semaphore(concurrency)
    progress_bar = tqdm(total=len(queries), desc="Async:")

    async def limited_call(query: str):
        async with semaphore:
            return await call_deepseek_async(query, progress_bar)

    tasks = [limited_call(query) for query in queries]
    return await asyncio.gather(*tasks)


# for python script 
# responses = asyncio.run(batch_call_deepseek(queries, cnotallow=10))

# for jupyter
response = await batch_call_deepseek(queries, cnotallow=10)

注意：異步調(diào)用需要使用 await 等待。

下述是tqdm 另外的一種，協(xié)程進度條的寫法：

from tqdm.asyncio import tqdm_asyncio
results = await tqdm_asyncio.gather(*tasks)

上述的異步協(xié)程代碼，我調(diào)用DeepSeek的API，沒有加速效果，我懷疑官方進行了限速。

我使用本地llamafactory部署的DeepSeek，上述異步協(xié)程的效果加速明顯。

llamafactory vllm本地部署 deepseek的腳本，只支持 linux 系統(tǒng)。

??deepseek_7B.yaml?? 文件內(nèi)容:

model_name_or_path: deepseek-ai/DeepSeek-R1-Distill-Qwen-7B
template: deepseek3
infer_backend: vllm
vllm_enforce_eager: true
trust_remote_code: true

linux 部署腳本：

nohup llamafactory-cli api deepseek_7B.yaml > deepseek_7B.log 2>&1 &

異步協(xié)程方法二

下述是 ChatGPT 生成的另外一種異步協(xié)程寫法。
（下述方法我沒有在本地部署的API上測試過，僅供大家參考）

import asyncio
from tqdm.asyncio import tqdm_asyncio

answer = []

async def fetch(query):
    response = await client.chat.completions.create(
        model="deepseek-chat",
        messages=[
            {"role": "system", "content": "You are a helpful assistant"},
            {"role": "user", "content": query},
        ],
        stream=False,
    )
    return response.choices[0].message.content

async def main():
    tasks = [fetch(query) for query in queries]
    results = await tqdm_asyncio.gather(*tasks)
    answer.extend(results)

asyncio.run(main())

vllm_infer

如果你是linux系統(tǒng)，那么相比API調(diào)用，最快的方式就是vllm推理。
你需要使用下述腳本，
???https://github.com/hiyouga/LLaMA-Factory/blob/main/scripts/vllm_infer.py??

python vllm_infer.py \
--model_name_or_path deepseek-ai/DeepSeek-R1-Distill-Qwen-7B \
--template deepseek3 \
--dataset industry_cls \
--dataset_dir ../../data/llamafactory_dataset/ \
--save_name output/generated_predictions.jsonl

llamafactory 可以指定自定義的數(shù)據(jù)集地址，你需要構建相應格式的數(shù)據(jù)集文件。

數(shù)據(jù)集文件夾下的文件：

DeepSeek 協(xié)程異步API 調(diào)用與llamafactory本地vllm部署推理-AI.x社區(qū)

DeepSeek 協(xié)程異步API 調(diào)用與llamafactory本地vllm部署推理-AI.x社區(qū)

DeepSeek 協(xié)程異步API 調(diào)用與llamafactory本地vllm部署推理-AI.x社區(qū)

本文轉(zhuǎn)載自??AI悠閑區(qū)??，作者：jieshenai

標簽

贊

收藏

回復

舉報

回復

相關推薦

你想在本地部署大模型嗎？本地部署大模型的三種工具

AI探索時代 ? 4816瀏覽 ? 0回復
基于Celery、Redis和Florence 2實戰(zhàn)異步機器學習推理

51CTO內(nèi)容精選 ? 2613瀏覽 ? 0回復
大模型部署解決方案之TorchServe+vLLM

夜行神魚 ? 2273瀏覽 ? 0回復
大模型部署調(diào)用(vLLM+LangChain)

一起AI技術 ? 4484瀏覽 ? 0回復
手把手教你將本地部署的DeepSeek R1集成到Dify

AIGC新知 ? 4535瀏覽 ? 0回復
手把手教你在本地部署 DeepSeek R1，并集成到 Dify 中，建議收藏！

玄姐聊AGI ? 1.0w瀏覽 ? 0回復
部署滿血DeepSeek R1的避坑指南-vLLM 0.7.1

NLP工作站 ? 6277瀏覽 ? 0回復
DeepSeek沒反應？那就在本地部署更好用 Mac和PC都能可視化

數(shù)字化助推器 ? 2649瀏覽 ? 0回復
如何利用 DeepSeek-R1 本地部署強大的推理模型：從 ChatGPT 風格界面到 API 集成

Halo咯咯 ? 2763瀏覽 ? 0回復
Deepseek AI模型本地部署步驟簡記：ollama + deepseek-r1 + 本地AI模型的Web UI

lintoms ? 2459瀏覽 ? 0回復
4090單卡部署滿血 671B DeepSeek，本地部署“成本驟降32倍”?。?！

玄姐聊AGI ? 6148瀏覽 ? 0回復
Deepseek AI模型本地部署步驟簡記：ollama + deepseek-r1 + 本地AI模型的Web UI

parson2000 ? 1666瀏覽 ? 0回復
通過LM Studio本地私有化部署DeepSeek-R1模型，無網(wǎng)絡也能用

與輝鴻蒙 ? 3433瀏覽 ? 0回復
DeepSeek R1 全系列模型部署指南

芝士AI吃魚 ? 6931瀏覽 ? 0回復
用 vLLM 快速上手 DeepSeek 大模型部署

穿越時空111 ? 6043瀏覽 ? 0回復
M3芯片+Ollama本地部署DeepSeek R1：小白也能玩轉(zhuǎn)AI推理

zhishan15 ? 1467瀏覽 ? 0回復
大規(guī)模AI推理再非難事：如何在Kubernetes上部署DeepSeek

51CTO內(nèi)容精選 ? 985瀏覽 ? 0回復
DeepSeek 部署全解析：三種方案對比與云端部署的顯著優(yōu)勢

AI算力補給站 ? 1172瀏覽 ? 0回復
大模型部署框架Ollama和vLLM怎么選？一文講透兩大框架的優(yōu)缺點和適用場景

AI博物院 ? 1236瀏覽 ? 0回復

AI悠閑區(qū)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

提示詞繞過大模型安全限制 5天前發(fā)布
從零開始微調(diào)Embedding模型：基于BERT的實戰(zhàn)教程 2025-04-14 01:31:07發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構設計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇：我們一起聊聊大模型 SFT 有監(jiān)督微調(diào)教程

下一篇：從零開始微調(diào)Embedding模型：基于BERT的實戰(zhàn)教程

社區(qū)精華內(nèi)容

目錄

<blockquote id="u3sd4"><p id="u3sd4"></p></blockquote>

<sup id="u3sd4"></sup>

<style id="u3sd4"></style>

^{<thead id="u3sd4"></thead>}