自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<blockquote id="v64jb"></blockquote>}

<blockquote id="v64jb"></blockquote>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

智能對(duì)話新紀(jì)元：大模型推理服務(wù)

發(fā)布于 2024-11-7 14:15

瀏覽

0收藏

在人工智能的浪潮中，大型語言模型憑借其強(qiáng)大的對(duì)話理解和生成能力，引領(lǐng)了智能對(duì)話技術(shù)的潮流。企業(yè)和個(gè)人對(duì)于私有化智能服務(wù)的需求日益增長(zhǎng)，將這樣的大模型部署為專屬服務(wù)顯得尤為重要。今天，讓我們一起探索如何將大模型私有化部署，構(gòu)建你的智能助手。

1. 環(huán)境準(zhǔn)備

首先確保你有一套滿足硬件要求的服務(wù)器或云環(huán)境，通常需要有一塊性能良好的GPU，足夠的內(nèi)存和存儲(chǔ)空間來容納模型和運(yùn)行日志。此外，選擇合適的操作系統(tǒng)（如Ubuntu Linux）并安裝必需的軟件依賴項(xiàng)（如Python、Cuda等）。

2. 獲取模型

你可以從官方倉(cāng)庫或者其他可靠的來源下載預(yù)訓(xùn)練好的模型權(quán)重文件。

以清華ChatGlm為例

模型下載地址：https://huggingface.co/THUDM/chatglm3-6b-32k/tree/main

智能對(duì)話新紀(jì)元：大模型推理服務(wù)-AI.x社區(qū)

將模型文件下載到本地

3. 安裝必要的庫

使用pip或conda安裝必需的Python庫，包括但不限于transformers（用于加載和處理模型），torch（PyTorch的核心庫），以及任何其他你可能需要的數(shù)據(jù)處理或服務(wù)框架相關(guān)的庫。

4. 封裝API接口

為了使模型能夠響應(yīng)外部請(qǐng)求，你需要開發(fā)一個(gè)RESTful API或者WebSocket服務(wù)，使得客戶端可以通過網(wǎng)絡(luò)發(fā)送請(qǐng)求并接收模型的回復(fù)。這通常涉及到編寫一些后端代碼，比如使用Flask或FastAPI框架。

以下是一個(gè)簡(jiǎn)單的推理腳本 server.py ，只是簡(jiǎn)單的非流式推理腳本。后續(xù)再更新流式推理以及日志的保存腳本。

from __future__ impport print_function
import json
import traceback
import flask
from flask import request , Flask,g,stream_with_context
from flask import Response
from transformers import AutoModel,AutoTokenizer
import torch
import os
import sys
import logging
from logging import handlers
import time
import flask_cors import CORS
import requests


# 下載的模型文件放在推理腳本的同級(jí)目錄的model文件下
tokenizer = AutoTokenizer.from_pretrained("./model/",trust_remote_code=True)
model = AutoModel.from_pretrained("./model",trust_remote_code=True).half().cuda()
model= model.eval()
path = os.path.dirname(os.path.abspath(__file__))


app = Flask(__name__)
CORS(app)


@app.route("/predict",methods=["POST"])
def predict():
  try:
      post_data = json.load(flask.loads.get_data())
      question = post_data.get("question")
      history = post_data.get("history")
      response, history = model.chat(tokenizer,question,history=history)
      res = get_return_json(0,"success",response)
      return res
  execpt Exception as e:
      success = -1
      errorMsg = str(e)
      res = get_return_json(success,errorMsg,'')
      return res
      
def get_return_json(code,return_msg,result):
    return_json = {'return_code':code, 'return_msg':return_msg,'answer': result}
    return return_json
if __name__ == "__main__":
    app.run(host=='0.0.0.0',port=8080,debug=False,threaded=False)

5. 執(zhí)行腳本

進(jìn)入到server.py 所在的目錄，比如 cd /workspace/server

執(zhí)行 python server.py 即可運(yùn)行服務(wù)

本文轉(zhuǎn)載自 ??AI論文解讀??，作者：墨瀾

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

革新GUI自動(dòng)化：V-Zen模型引領(lǐng)多模態(tài)語言模型新紀(jì)元

AI論文解讀 ? 2850瀏覽 ? 0回復(fù)
YOLO-NAS：開啟實(shí)時(shí)目標(biāo)檢測(cè)新紀(jì)元

sword_hero ? 3034瀏覽 ? 0回復(fù)
大語言模型llama-2-7b推理服務(wù)實(shí)戰(zhàn)

zhcs333 ? 4304瀏覽 ? 0回復(fù)
手機(jī)流暢運(yùn)行470億大模型：上交大提出PowerInfer-2引領(lǐng)智能手機(jī)大模型推理新紀(jì)元

AI論文解讀 ? 4411瀏覽 ? 0回復(fù)
Google推出開源代碼大模型CodeGemma：AI編程新紀(jì)元，代碼自動(dòng)完成和生成技術(shù)再升級(jí)

AI論文解讀 ? 3062瀏覽 ? 0回復(fù)
全新發(fā)布：LangGraph開啟認(rèn)知架構(gòu)新紀(jì)元

ermulong ? 3475瀏覽 ? 0回復(fù)
尤洋團(tuán)隊(duì)新作，網(wǎng)友：這是新紀(jì)元

angel ? 2634瀏覽 ? 0回復(fù)
ECCV2024｜LightenDiffusion 超越現(xiàn)有無監(jiān)督方法，引領(lǐng)低光圖像增強(qiáng)新紀(jì)元！

angel ? 3811瀏覽 ? 0回復(fù)
亞馬遜 RAG 新突破：REAPER 技術(shù)開啟大型智能對(duì)話助手新境界

大語言模型論文跟蹤 ? 2556瀏覽 ? 0回復(fù)
mPLUG-DocOwl2:新模型無需OCR，多頁文檔理解邁入新紀(jì)元

AI論文解讀 ? 3040瀏覽 ? 0回復(fù)
多模態(tài)-故障診斷 | 大核卷積開啟視覺新紀(jì)元!

Tang_Lan ? 3535瀏覽 ? 0回復(fù)
多模態(tài)-故障診斷 | 大核卷積開啟視覺新紀(jì)元!

Tang_Lan ? 2429瀏覽 ? 0回復(fù)
Emu3：開啟多模態(tài)人工智能新紀(jì)元 —— 視頻、圖像、文本三合一模型

穿越時(shí)空111 ? 2168瀏覽 ? 0回復(fù)
OpenAI Sora震撼登場(chǎng)：20秒打造專業(yè)級(jí)視頻，開啟創(chuàng)意新紀(jì)元！

十一月雨_55 ? 1700瀏覽 ? 0回復(fù)
OpenCV 5：邁向計(jì)算機(jī)視覺新紀(jì)元的最新進(jìn)展

sword_hero ? 2429瀏覽 ? 0回復(fù)
開啟AI短劇新紀(jì)元!SkyReels-V1/A1雙劍合璧!昆侖萬維開源首個(gè)面向AI短劇的視頻生成模型

angel ? 3058瀏覽 ? 0回復(fù)
英偉達(dá)震撼發(fā)布GR00T N1，全球首個(gè)開放通用人形機(jī)器人模型，顛覆多模態(tài)操控，開啟機(jī)器人智能新紀(jì)元

angel ? 1894瀏覽 ? 0回復(fù)
DiT控制新紀(jì)元！"即插即控"，Tiamat AI重磅開源EasyControl：任意比例出圖+推理速度狂飆

angel ? 1016瀏覽 ? 0回復(fù)
AI語音革命新紀(jì)元：Sesame模型讓聊天AI“活”出表情包式情緒聲線?

51CTO內(nèi)容精選 ? 512瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

深度剖析：為何擴(kuò)散模型會(huì)成為語言模型的未來？ 2025-03-14 07:45:15發(fā)布
一文讀懂 RAG-Gym：用過程監(jiān)督優(yōu)化推理與搜索智能體 2025-03-04 10:43:21發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：多智能體新進(jìn)展 | 斯坦福大學(xué)提出新模型'Hypothetical Minds'，讓AI更懂人類思維

下一篇： FineTuneBench：商業(yè)精細(xì)調(diào)整API能夠如何融入LLMs中的新知識(shí)？

社區(qū)精華內(nèi)容

目錄

<sub id="ndq1b"></sub>

^{<blockquote id="ndq1b"></blockquote>}