自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="otwns"><i id="otwns"></i></blockquote>

<s id="otwns"><li id="otwns"></li></s>

<blockquote id="otwns"><i id="otwns"></i></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

在趨動(dòng)云上使用xinference部署大模型原創(chuàng)

一起AI技術(shù)

發(fā)布于 2025-1-7 07:52

瀏覽

0收藏

前言

本文將介紹如何在趨動(dòng)云平臺(tái)上使用xinference部署對(duì)話模型、向量化模型以及多模態(tài)模型。

xinference簡(jiǎn)介

xinference官網(wǎng)

官網(wǎng)說(shuō)明：https://inference.readthedocs.io/zh-cn/latest/getting_started/installation.html

xinference可以部署的模型類別

chat對(duì)話模型
embedding向量化模型
rerank模型
vl-chat多模態(tài)模型

環(huán)境準(zhǔn)備

選擇鏡像

選擇鏡像環(huán)境

安裝xinference

xinference支持的引擎有：

transformers
vllm
llama.cpp
SGlong引擎 .....

本篇文章，我們嘗試使用transformers引擎，部署Qwen2-0.5B-Instruct對(duì)話模型。

# 安裝transformers引擎
pip install "xinference[transformers]"

# 安裝sentence-transformers
pip install sentence-transformers

部署chat對(duì)話模型

下載模型

切換至??/gemini/code??目錄下，下載模型：

git lfs install
git clone https://www.modelscope.cn/Qwen/Qwen2.5-0.5B-Instruct.git

注意事項(xiàng)：此處也可以在啟動(dòng)項(xiàng)目時(shí)，選擇模型加載，在趨動(dòng)云的公共模型中選擇??Qwen2.5-0.5B-Instruct??模型。

啟動(dòng)xinference

1. 在命令行中啟動(dòng)??supervisor??? 進(jìn)程：??xinference-supervisor -H 0.0.0.0??運(yùn)行結(jié)果：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

2. 新建一個(gè)terminal，啟動(dòng)??Worker??? 進(jìn)程：??xinference-worker -e http://127.0.0.1:9997 -H 0.0.0.0??運(yùn)行結(jié)果：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

此處的??9997??應(yīng)該與supervisor啟動(dòng)時(shí)指定的端口一致。

端口映射

在趨動(dòng)云控制臺(tái)的右側(cè)"端口"，添加端口映射如下：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

啟動(dòng)對(duì)話模型

瀏覽器訪問(wèn)http://direct.virtaicloud.com:40336

??http://direct.virtaicloud.com:40336??是上一步端口映射后，趨動(dòng)云提供的外網(wǎng)訪問(wèn)地址。

在??language models???選擇??chat???模型，并搜索??qwen2.5??模型

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

使用pwd命令獲取趨動(dòng)云上已下載Qwen模型的的絕對(duì)路徑

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

配置模型必選參數(shù)

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

注意事項(xiàng)：因?yàn)槲覀兿螺d的模型為Qwen2.5-0.5B-Instruct，所以??Model size???為??0_5??，此處應(yīng)根據(jù)實(shí)際情況選擇。

配置模型路徑

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

注意事項(xiàng)：
Model path為上述第3步中獲取的模型在趨動(dòng)云上的絕對(duì)路徑。
Model UID用于后續(xù)調(diào)用使用，此處我們配置為??Qwen2.5-0.5B-Instruct??。如果不配置的話，會(huì)使用默認(rèn)的Model UID,在后續(xù)調(diào)用時(shí)注意調(diào)用代碼中的傳參內(nèi)容。

點(diǎn)擊啟動(dòng)，稍后片刻，頁(yè)面會(huì)顯示啟動(dòng)成功后的內(nèi)容。

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

調(diào)用驗(yàn)證

from openai importOpenAI
openai_api_key ="EMPTY"
openai_api_base ="http://direct.virtaicloud.com:40336/v1"

client =OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)

chat_response = client.chat.completions.create(
    model="Qwen2.5-0.5B-Instruct",
    messages=[
{"role":"system","content":"你是一個(gè)很有用的助手。"},
{"role":"user","content":"中華人民共和國(guó)的首都是哪里？"},
]
)
print("Chat response:", chat_response)

運(yùn)行結(jié)果：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

注意事項(xiàng)：
示例中，??openai_api_base??需要配置映射端口后的地址，讀者需要根據(jù)實(shí)際情況修改。
示例中，??model="Qwen2.5-0.5B-Instruct"???要與在??xinference???中配置??Model UID??的內(nèi)容一致。

部署chat對(duì)話模型(微調(diào)訓(xùn)練過(guò)的)

下載模型

此處，我們?cè)谮厔?dòng)云啟動(dòng)時(shí)，選擇曾經(jīng)微調(diào)的一個(gè)醫(yī)療大模型??Qwen2-7B-final??并加載。

備注說(shuō)明：該模型是之前我微調(diào)過(guò)的一個(gè)醫(yī)療大模型，具體微調(diào)過(guò)程請(qǐng)見(jiàn)【課程總結(jié)】day24（上）：大模型三階段訓(xùn)練方法(LLaMa Factory)。

啟動(dòng)模型

在Launch頁(yè)面，選擇??chat???并搜索??qwen2???，選擇??qwen2-instruct??。

2. 配置模型必選參數(shù)：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

配置模型路徑：

注意事項(xiàng)：
該模型是基于??Qwen2-7B-instruct???微調(diào)的，所以??Model size???選擇??7_0??。
該模型在趨動(dòng)云上的絕對(duì)路徑為：??/gemini/pretrain/Qwen2-7B-final??。

點(diǎn)擊啟動(dòng)，稍后片刻，頁(yè)面會(huì)顯示啟動(dòng)成功后的內(nèi)容。

調(diào)用驗(yàn)證

from openai importOpenAI
openai_api_key ="EMPTY"
openai_api_base ="http://direct.virtaicloud.com:40336/v1"

client =OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)

chat_response = client.chat.completions.create(
    model="qwen2-instruct",
    messages=[
{"role":"system","content":"你是一個(gè)很有用的助手。"},
{"role":"user","content":"我最近失眠比較厲害，請(qǐng)問(wèn)應(yīng)該如何診治？"},
]
)
print("Chat response:", chat_response)

運(yùn)行結(jié)果：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

注意事項(xiàng)：示例中， ??model="qwen2-instruct"???要與在??xinference???中配置??Model UID??的內(nèi)容一致。

部署embeddign模型

前置步驟與部署chat模型的操作一致，只是配置Model UID和Model Path時(shí) 略有不同。

部署vl-chat多模態(tài)模型

前置步驟與部署chat模型的操作一致，此處不再贅述。

下載模型

此處，我們?cè)谮厔?dòng)云啟動(dòng)時(shí)，在模型廣場(chǎng)搜索??Qwen-VL-chat??并加載。

備注說(shuō)明：該模型是在趨動(dòng)云模型廣場(chǎng)搜索的一個(gè)Qwen的多模態(tài)大模型。

啟動(dòng)模型

在Launch頁(yè)面，選擇??vl-chat???并搜索??qwen??。

2. 配置模型必選參數(shù)：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

3. 配置模型路徑：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

注意事項(xiàng)：該模型在趨動(dòng)云上的絕對(duì)路徑為：??/gemini/pretrain2/Qwen-VL-Chat??。

點(diǎn)擊啟動(dòng)，稍后片刻，頁(yè)面會(huì)顯示啟動(dòng)成功后的內(nèi)容。

調(diào)用驗(yàn)證

from openai importOpenAI
import base64

# 配置OpenAI客戶端
openai_api_key ="EMPTY"
openai_api_base ="http://direct.virtaicloud.com:40336/v1"# 請(qǐng)根據(jù)實(shí)際端口映射地址修改

client =OpenAI(
    api_key=openai_api_key,
    base_url=openai_api_base,
)

def encode_image_to_base64(image_path):
"""將圖片轉(zhuǎn)換為base64編碼"""
withopen(image_path,"rb")as image_file:
return base64.b64encode(image_file.read()).decode('utf-8')

def chat_with_image(image_path, prompt):
"""與多模態(tài)模型對(duì)話"""
# 將圖片轉(zhuǎn)換為base64
    base64_image = encode_image_to_base64(image_path)


    messages=[
    {
     "role":"user",
     "content":[
        {"type":"text","text":prompt},
        {
          "type":"image_url",
          "image_url":{
          "url":f"data:image/png;base64,{base64_image}"
          }
        }
        ]
      }
    ]
# 調(diào)用模型
# try:

    response = client.chat.completions.create(
        model="qwen-vl-chat",# 使用部署的多模態(tài)模型名稱
        messages=messages,
        max_tokens=1024,
        temperature=0.7,
        response_format={"type":"text"}# 指定響應(yīng)格式為文本
)
return response.choices[0].message.content
# except Exception as e:
#     return f"調(diào)用出錯(cuò): {str(e)}"

if __name__ =="__main__":
# 測(cè)試調(diào)用
    image_path ="./腦部CT.png"# 替換為實(shí)際的圖片路徑
    prompt ="這張圖片中有什么內(nèi)容？請(qǐng)?jiān)敿?xì)描述。"

    result = chat_with_image(image_path, prompt)
print("模型回復(fù):", result)

圖片：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

運(yùn)行結(jié)果：

在趨動(dòng)云上使用xinference部署大模型-AI.x社區(qū)

常見(jiàn)問(wèn)題

問(wèn)題1：Qwen2-vl-chat模型部署后，調(diào)用時(shí)報(bào)錯(cuò)：??ValueError: No chat template is set for this processor.???。問(wèn)題原因：查看Xinference的日志，提示不支持??Qwen2-vl??模型。

本文轉(zhuǎn)載自公眾號(hào)一起AI技術(shù) 作者：熱情的Dongming

原文鏈接：??https://mp.weixin.qq.com/s/KdcQBy4j6HgjGbPlIxT5CQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請(qǐng)注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2025-1-7 09:50:38修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

【乘風(fēng)進(jìn)階學(xué)習(xí)季】夏日初長(zhǎng)，乘風(fēng)而上，碼出未來(lái)！

AI.x社區(qū)官方賬號(hào) ? 52.9w瀏覽 ? 36回復(fù)
綜述：大語(yǔ)言模型在信息抽取上的應(yīng)用

xuxiangda ? 4746瀏覽 ? 0回復(fù)
大模型“分區(qū)”部署在云和邊緣更合適？

51CTO技術(shù)棧 ? 2304瀏覽 ? 0回復(fù)
AI大語(yǔ)言模型在高階心智理論任務(wù)上展現(xiàn)驚人表現(xiàn)

AI論文解讀 ? 3174瀏覽 ? 0回復(fù)
哪個(gè)中文開(kāi)源大模型在信息抽取上效果最好？附：用于提取的提示詞

大語(yǔ)言模型論文跟蹤 ? 4895瀏覽 ? 0回復(fù)
探討 | 大模型在傳統(tǒng)NLP任務(wù)的使用姿勢(shì)

NLP工作站 ? 3340瀏覽 ? 0回復(fù)
你想在本地部署大模型嗎？本地部署大模型的三種工具

AI探索時(shí)代 ? 4816瀏覽 ? 0回復(fù)
關(guān)于大模型在企業(yè)生產(chǎn)環(huán)境中的獨(dú)立部署問(wèn)題

AI探索時(shí)代 ? 2496瀏覽 ? 0回復(fù)
探討 | 大模型在傳統(tǒng)NLP任務(wù)的使用姿勢(shì)

NLP工作站 ? 2837瀏覽 ? 0回復(fù)
社區(qū)專屬福利，100%中獎(jiǎng)：免費(fèi)試用、快速上云

AI.x社區(qū)活動(dòng)小助手 ? 4968瀏覽 ? 0回復(fù)
實(shí)現(xiàn)了個(gè)ChatGPT趨動(dòng)的游戲，玩得樂(lè)此不疲

NLP工作站 ? 2177瀏覽 ? 0回復(fù)
多模態(tài)大模型在表格解析任務(wù)上效果如何？親身經(jīng)歷全是淚！

NLP工作站 ? 1551瀏覽 ? 0回復(fù)
在AutoDL上使用LLamaFactory進(jìn)行模型訓(xùn)練

一起AI技術(shù) ? 3844瀏覽 ? 0回復(fù)
4090單卡部署滿血 671B DeepSeek，本地部署“成本驟降32倍”！?。?/a>

玄姐聊AGI ? 6152瀏覽 ? 0回復(fù)
在消費(fèi)級(jí)硬件上微調(diào) DeepSeek-R1

AIGC前沿技術(shù)追蹤 ? 1669瀏覽 ? 0回復(fù)
用好云服務(wù)，托起GenAI：從數(shù)據(jù)準(zhǔn)備到部署的全流程梳理

51CTO內(nèi)容精選 ? 1426瀏覽 ? 0回復(fù)
AI大模型本地化方案：Xinference 本地運(yùn)行大模型

風(fēng)云2002_1 ? 2018瀏覽 ? 0回復(fù)
【模型部署】在Dify中接入ComfyUI+Flux實(shí)現(xiàn)文生圖

一起AI技術(shù) ? 3043瀏覽 ? 0回復(fù)
在企業(yè)場(chǎng)景中應(yīng)該怎么部署大模型——大模型企業(yè)級(jí)部署框架介紹

AI探索時(shí)代 ? 1395瀏覽 ? 0回復(fù)

一起AI技術(shù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

【模型測(cè)試】基于OpenCompass構(gòu)建Dify應(yīng)用的自定義評(píng)測(cè)體系 2025-04-09 12:07:35發(fā)布
【模型測(cè)試】ai-eval-system在線評(píng)測(cè)系統(tǒng)v0.2預(yù)覽版本介紹 2025-04-09 06:38:42發(fā)布

熱門推薦

MCP協(xié)議之MCP-server(sse方式)實(shí)踐 0回復(fù)

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

上一篇：人臉識(shí)別和MTCNN模型

下一篇：在AutoDL上使用LLamaFactory進(jìn)行模型訓(xùn)練

社區(qū)精華內(nèi)容

目錄

<p id="tp7z8"><li id="tp7z8"></li></p>

<blockquote id="tp7z8"></blockquote>