自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="ycaih"></sub>

<p id="ycaih"><li id="ycaih"></li></p>

<u id="ycaih"></u>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型訓(xùn)練完成之后可以直接使用嗎？該怎么使用訓(xùn)練好的大模型？原創(chuàng)

發(fā)布于 2024-7-17 06:59

瀏覽

0收藏

學(xué)習(xí)機器學(xué)習(xí)的人大部分都知道怎么設(shè)計并訓(xùn)練一個模型，但開發(fā)模型的目的是為了解決業(yè)務(wù)問題，所以怎么使用大模型也是重中之重。

剛訓(xùn)練好的大模型事實上雖然可以用，但由于沒有用戶接口，所以只能自己用，無法對外提供服務(wù)；所以，剛訓(xùn)練好的大模型需要經(jīng)過一些處理才可以使用，包括數(shù)據(jù)預(yù)處理，接口開發(fā)等。

huggingface官網(wǎng)地址：https://huggingface.co/models 需科學(xué)上網(wǎng)

大模型訓(xùn)練完成之后可以直接使用嗎？該怎么使用訓(xùn)練好的大模型？-AI.x社區(qū)

01、大模型加載與保存

訓(xùn)練一個大模型，在訓(xùn)練完成之后最重要的就是要把模型給保存下，然后在使用的時候加載。

在什么情況下需要保存模型？

保存模型主要有兩種情況，第一種是重新設(shè)計了一個新的模型，第二種是微調(diào)過的模型。

當然不論是何種原因，保存模型也有兩種方式，一種是直接把模型進行保存，不論是模型本身還是模型參數(shù)。第二種是使用字典方式保存模型參數(shù)。

代碼如下所示，這里使用的是pytorch自定義模型，如果是從網(wǎng)絡(luò)中加載的其它模型，可以根據(jù)其具體的實現(xiàn)進行保存。

import torch
from torch import nn
# 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 當作例子沒有具體實現(xiàn)
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        pass


    def forward(self, x):
        return x


# 創(chuàng)建一個模型對象
model = MyModel()


# 第一種保存模型的方式
torch.save(model, "my_model.pth")


# 第二種保存模型的方式 使用dict字段保存參數(shù)
torch.save(model.state_dict(), "dict_my_model.pth")

可能會有人有疑問，沒有訓(xùn)練過的模型也可以保存嗎？

雖然很多人都會使用別人訓(xùn)練好的模型，但有時我們只需要使用其模型結(jié)構(gòu)，不需要其訓(xùn)練的參數(shù)，所以就會有人把沒有訓(xùn)練過的模型進行保存。然后讓別人可以用沒用被數(shù)據(jù)“污染”過的新模型。

比如，pytorch從官網(wǎng)加載模型時就有一個參數(shù)，pretrained=false來加載未訓(xùn)練過的模型。當然，用戶也可以選擇訓(xùn)練過的模型進行微調(diào)。

模型的加載

模型既然可以被保存，那么就可以被加載。保存模型有兩種方式，加載模型也有兩種方式。

第一種方式保存就直接加載，而第二種方式保存就需要先創(chuàng)建一個模型，然后再加載。

需要注意的說，這里加載的是自定義模型，所以一定要把神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)給引入進來，下面代碼的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)就是MyModel。否則會報錯找不到模型，而如果是從網(wǎng)絡(luò)中加載模型則不會出現(xiàn)這個問題。

import torch
from torch import nn
# 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 當作例子沒有具體實現(xiàn)
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        pass


    def forward(self, x):
        return x


# 創(chuàng)建一個模型對象
model = MyModel()


# 第一種保存模型的方式
torch.save(model, "my_model.pth")


# 第二種保存模型的方式 使用dict字段保存參數(shù)
torch.save(model.state_dict(), "dict_my_model.pth")


# 第一種加載模型的方式 有了這個之后就不需要使用 model = MyModule()創(chuàng)建模型了
load_model = torch.load("my_model.pth")
print(load_model)




# 第二種加載方式 這里只會加載模型的參數(shù)
dict_load = torch.load("dict_my_model.pth")
print(dict_load)


#  因此，需要先創(chuàng)建模型，再從字典中加載參數(shù)
dict_model = MyModel()
dict_model.load_state_dict(torch.load("dict_my_model.pth"))
print("------------------")
print(dict_model)

02、使用模型的三種方式

使用模型大概有以下三種方式：

第一種方式是直接調(diào)用第三方模型服務(wù)公司的API接口，比如chatGPT的接口，通義千問接口和百度文心一言等接口。

這種方式最簡單，也不需要懂得大模型的技術(shù)，只需要有編程基礎(chǔ)會調(diào)用接口即可。

而后面兩種其實是兩種情況，就是自己部署大模型。

自己部署大模型分為兩種情況，第一種是使用別人訓(xùn)練或微調(diào)好的模型，比如huggingface上的模型，pytorch官網(wǎng)提供的模型等；第二種是自己設(shè)計并訓(xùn)練模型。

兩者的區(qū)別就是，第一種使用別人的模型，就需要按照別人的要求和規(guī)則去使用或訓(xùn)練模型。比如，它們可能會對模型進行簡單的輸入處理和API封裝，我們自己也可以在其基礎(chǔ)之上對模型進行更加完善的設(shè)計。

如下所示，是使用huggingface上的大模型。from_pretrained(model_id)就是從huggingface倉庫中加載大模型。

from transformers import AutoTokenizer, AutoModelForCausalLM


# 大模型名詞
model_id = "shenzhi-wang/Llama3-8B-Chinese-Chat"


# 加載分詞器 在自然語言處理中，需要對文字進行分詞 并轉(zhuǎn)換為神經(jīng)網(wǎng)絡(luò)能夠識別的向量格式
tokenizer = AutoTokenizer.from_pretrained(model_id)


# 加載大模型
model = AutoModelForCausalLM.from_pretrained(
    model_id, torch_dtype="auto", device_map="auto"
)






"""


 用戶使用，按照大模型提供的輸入案例來操作
"""
messages = [
    {"role": "system", "content": "You are Llama3-8B-Chinese-Chat, which is finetuned on Llama3-8B-Instruct with Chinese-English mixed data by the ORPO alignment algorithm. You, Llama3-8B-Chinese-Chat, is developed by Shenzhi Wang (王慎執(zhí) in Chinese). You are a helpful assistant."},
    {"role": "user", "content": "介紹一下你自己"},
]


# 數(shù)據(jù)預(yù)處理
input_ids = tokenizer.apply_chat_template(
    messages, add_generation_prompt=True, return_tensors="pt"
).to(model.device)


# 大模型只能識別向量格式的數(shù)據(jù)，所以在開始之前需要對數(shù)據(jù)進行預(yù)處理
outputs = model.generate(
    input_ids,
    max_new_tokens=1024,
    do_sample=True,
    temperature=0.6,
    top_p=0.9,
)


# 獲取結(jié)果
response = outputs[0][input_ids.shape[-1]:]
print(tokenizer.decode(response, skip_special_tokens=True))

第二種自定義模型，我們就需要自己對大模型進行預(yù)處理和接口封裝。

import torch
from torch import nn
# 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu) 當作例子沒有具體實現(xiàn)
class MyModel(nn.Module):
    def __init__(self):
        super(MyModel, self).__init__()
        pass

    def forward(self, x):
        return x

# 創(chuàng)建一個模型對象
model = MyModel()

# 第一種保存模型的方式
torch.save(model, "my_model.pth")

# 第二種保存模型的方式 使用dict字段保存參數(shù)
torch.save(model.state_dict(), "dict_my_model.pth")

# 第一種加載模型的方式 有了這個之后就不需要使用 model = MyModule()創(chuàng)建模型了
load_model = torch.load("my_model.pth")
print(load_model)


# 第二種加載方式 這里只會加載模型的參數(shù)
dict_load = torch.load("dict_my_model.pth")
print(dict_load)

#  因此，需要先創(chuàng)建模型，再從字典中加載參數(shù)
dict_model = MyModel()
dict_model.load_state_dict(torch.load("dict_my_model.pth"))
print("------------------")
print(dict_model)

""" 數(shù)據(jù)預(yù)處理 """
def process_prefix(param):
    # params是輸入?yún)?shù)，自然語言處理中就是字符串，計算機視覺處理中就是圖片或視頻
    # 把參數(shù)轉(zhuǎn)換為張量/向量
    inputs = torch.Tensor(param)
    """
        當然，這里只是簡單舉個例子，實際的預(yù)處理要比這復(fù)雜的多，不但要實現(xiàn)功能，還有保證接口的可擴展性，以及上層功能的調(diào)用
    """
    return inputs

# 把用戶輸入轉(zhuǎn)化為向量后 輸入到模型中
resp = dict_model(process_prefix(""))

def process_post(resp):
    """
        這里主要對模型的輸出進行處理，不同的模型輸出數(shù)據(jù)格式不一，所以為了使用的方便，需要對模型輸出進行處理
    """

總的來說，模型的使用就類似于模型設(shè)計中的輸入層和輸出層，由于每個模型的輸入和輸出都不一樣，所以每個模型的輸入和輸出都需要進行特殊處理。

開發(fā)者對模型進行包裝之后，就可以通過API接口或SDK的形式提供給業(yè)務(wù)人員調(diào)用。

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/8ThSarUkwOgJ46lTAvCJWQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標簽

已于2024-7-17 07:00:23修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

探討 | 大模型在傳統(tǒng)NLP任務(wù)的使用姿勢

NLP工作站 ? 3335瀏覽 ? 0回復(fù)
預(yù)訓(xùn)練大語言模型對時間序列預(yù)測真的有用嗎？去掉預(yù)訓(xùn)練LLM效果反而提升

海因斯DK ? 4157瀏覽 ? 0回復(fù)
大模型所謂的參數(shù)是什么？大模型為什么需要訓(xùn)練？大模型訓(xùn)練到底干了什么？

AI探索時代 ? 6081瀏覽 ? 0回復(fù)
怎么使用langchain加載模型？langchain加載模型的幾種方式

AI探索時代 ? 5856瀏覽 ? 0回復(fù)
最新研究：大語言模型使用Json格式輸出會降低模型性能嗎？

大語言模型論文跟蹤 ? 3430瀏覽 ? 0回復(fù)
使用Concrete ML為模型訓(xùn)練和推理確保端到端隱私

51CTO內(nèi)容精選 ? 1711瀏覽 ? 0回復(fù)
大模型訓(xùn)練集群的存儲設(shè)計

夜行神魚 ? 2661瀏覽 ? 0回復(fù)
關(guān)于大模型微調(diào)與訓(xùn)練的問題，大模型訓(xùn)練的難點在哪里？

AI探索時代 ? 2176瀏覽 ? 0回復(fù)
關(guān)于大模型的使用——提示詞工程

AI探索時代 ? 2797瀏覽 ? 0回復(fù)
為什么預(yù)訓(xùn)練大模型要使用無監(jiān)督學(xué)習(xí)的方式？

AI探索時代 ? 2365瀏覽 ? 0回復(fù)
大模型訓(xùn)練的本質(zhì)是什么？以及大模型訓(xùn)練的核心要點

AI探索時代 ? 2311瀏覽 ? 0回復(fù)
云計算與大模型訓(xùn)練的結(jié)合

AI探索時代 ? 1732瀏覽 ? 0回復(fù)
怎么學(xué)習(xí)設(shè)計和訓(xùn)練一個大模型——也就是神經(jīng)網(wǎng)絡(luò)？

AI探索時代 ? 1634瀏覽 ? 0回復(fù)
在AutoDL上使用LLamaFactory進行模型訓(xùn)練

一起AI技術(shù) ? 3800瀏覽 ? 0回復(fù)
大模型訓(xùn)練之訓(xùn)練數(shù)據(jù)準備，即怎么準備高質(zhì)量的訓(xùn)練數(shù)據(jù)集？

AI探索時代 ? 3002瀏覽 ? 0回復(fù)
看看 AI 大牛日常如何使用大模型

機器學(xué)習(xí)與數(shù)學(xué) ? 2176瀏覽 ? 0回復(fù)
【模型測試】大模型評測工具OpenCompass使用方法總結(jié)

一起AI技術(shù) ? 2085瀏覽 ? 0回復(fù)
Kimi-VL開源多模態(tài)大模型結(jié)構(gòu)、訓(xùn)練方法、訓(xùn)練數(shù)據(jù)淺析

大模型自然語言處理 ? 1007瀏覽 ? 0回復(fù)
怎么學(xué)習(xí)使用大模型？論大模型和汽車的關(guān)系

AI探索時代 ? 945瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進行數(shù)據(jù)召回——召回策略的研究 1天前發(fā)布
關(guān)于基于RAG技術(shù)的智能客服系統(tǒng)解決方案 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：大模型愛好者的福音，有了它個人電腦也可以運行大模型了

下一篇：如果老板讓你基于大模型搭建一個系統(tǒng)，怎么選擇一個適合自己任務(wù)的大模型？選擇大模型需要考慮哪些問題？

社區(qū)精華內(nèi)容

目錄

<style id="kmvl0"></style>

<legend id="kmvl0"><track id="kmvl0"></track></legend>

<cite id="kmvl0"></cite>

<style id="kmvl0"></style>