自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

大模型技術(shù)細(xì)節(jié)——大模型之文本生成與文檔總結(jié) 原創(chuàng)

發(fā)布于 2024-8-5 10:43

瀏覽

0收藏

“ 大模型就是一個黑盒，盒子外面的人一直在霧里看花”

我們一直在說大模型大模型，但大部分人都沒深入研究過大模型的具體實現(xiàn)以及隱藏在大模型這個黑盒下的技術(shù)細(xì)節(jié)。

思考個問題，根據(jù)要求讓大模型生成一段文字和給大模型一個PDF文本，讓它總結(jié)文本內(nèi)容，這兩種方式是同一種大模型嗎？

文本生成大模型和文檔總結(jié)大模型

很多人都簡單的認(rèn)為，生成文本的模型和進(jìn)行文檔總結(jié)的模型是一回事，都屬于文本處理模型。

因為從使用者的角度來說，只需要告訴它需求或者仍給它一個文檔它就能很好的完成任務(wù)；所以說從使用者的角度來說，產(chǎn)生上面的認(rèn)知也不能說錯。

但事實上，大部分人都被大模型的黑盒給欺騙了，大模型遠(yuǎn)遠(yuǎn)沒有想的那么簡單。

文本生成模型和文檔總結(jié)模型有很多相似之處，但它們的目的和具體的實現(xiàn)方式不盡相同。

大模型技術(shù)細(xì)節(jié)——大模型之文本生成與文檔總結(jié) -AI.x社區(qū)

文本生成模型

定義

文本生成模型是通過學(xué)習(xí)數(shù)據(jù)的分布生成新的文本內(nèi)容。它們通常用于生成自然語言文本，如文章、對話、故事等。

目標(biāo)

生成連貫，符合語法和語義的新文本段落。

常見類型

自回歸模型

自回歸模型典型的有GPT(Generative Pre-trained Transformer)，也就是生成式預(yù)訓(xùn)練模型，通過逐步預(yù)測下一個詞生成文本。

from transformers import GPT2LMHeadModel, GPT2Tokenizer


tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
model = GPT2LMHeadModel.from_pretrained("gpt2")
input_text = "Once upon a time"
input_ids = tokenizer.encode(input_text, return_tensors='pt')
output = model.generate(input_ids, max_length=50)
print(tokenizer.decode(output[0], skip_special_tokens=True))

自編碼模型
自編碼模型典型的有BERT(Bidirectional Encoder Representation from Transformers)，常用于理解和生成上下文相關(guān)文本。

from transformers import BertModel, BertTokenizer


tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
model = BertModel.from_pretrained("bert-base-uncased")
input_text = "Hello, my dog is cute"
input_ids = tokenizer.encode(input_text, return_tensors='pt')
outputs = model(input_ids)
print(outputs)

應(yīng)用場景

生成文章，故事，對話
自動寫作和創(chuàng)作
自然語言對話系統(tǒng)

文檔總結(jié)模型

定義

文檔總結(jié)模型是通過提取和抽取技術(shù)生成簡潔的文檔摘要，它們常用于從長文本中提取關(guān)鍵信息，并生成簡明扼要的摘要。

目標(biāo)

生成文檔的簡要概述，提煉出關(guān)鍵信息

常見類型

抽取式摘要模型(Extractive Summarization Models)

常見的抽取式摘要模型BERTSUM，基于BERT的抽取式文檔總結(jié)模型，通過選擇原文中的重要句子生成摘要。

# 從huggingface中加載模型
from transformers import BertTokenizer, BertForSequenceClassification


tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
model = BertForSequenceClassification.from_pretrained("bert-base-uncased")
input_text = "Your long document text here."
input_ids = tokenizer.encode(input_text, return_tensors='pt')
outputs = model(input_ids)
print(outputs)

生成式摘要模型(Abstractive Summarization Models)
T5(Text-to-Text Transfer Transformer)，通過生成新的句子來總結(jié)文檔。

from transformers import T5Tokenizer, T5ForConditionalGeneration


tokenizer = T5Tokenizer.from_pretrained("t5-small")
model = T5ForConditionalGeneration.from_pretrained("t5-small")
input_text = "summarize: Your long document text here."
input_ids = tokenizer.encode(input_text, return_tensors='pt')
outputs = model.generate(input_ids, max_length=50)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

應(yīng)用場景

新聞?wù)?/li>
科研論文摘要
法律文檔摘要
長文章的概述

區(qū)別與聯(lián)系

目的

文本生成模型：生成連貫的新文本內(nèi)容

文檔總結(jié)模型：生成文檔的簡明摘要，提取關(guān)鍵信息

方法

文本生成模型：使用語言模型(如GPT)根據(jù)上下文逐詞生成文本。

文檔總結(jié)模型：使用抽取式或生成式方法從文檔中提取或生成摘要

輸入輸出

文本生成模型：

輸入：起始文本或上下文提示

輸出：生成新的文本段落

文檔總結(jié)模型：

輸入：完整的文檔或長文本

輸出：簡明的文檔摘要

總結(jié)

盡管文本生成模型和文檔總結(jié)模型在技術(shù)上有一些重疊，但它們的目的和具體應(yīng)用場景不同。

文本生成模型用于生成新的文本，而文檔總結(jié)模型則用于提煉和總結(jié)現(xiàn)有文檔的內(nèi)容。

學(xué)習(xí)大模型技術(shù)，不能只浮于表面，要深入理解其內(nèi)部實現(xiàn)；這樣我們才能真正了解大模型能做什么，不能做什么。

也就是常說的，知其然也要知其所以然。

本文轉(zhuǎn)載自公眾號AI探索時代作者：DFires

原文鏈接：??https://mp.weixin.qq.com/s/tdhkqUKgG4nOW5Ss3bv1pQ??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

人工智能應(yīng)用

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

騰訊AI新研究打破長文本生成模型限制，序列并行技術(shù)再突破

AI論文解讀 ? 5432瀏覽 ? 0回復(fù)
開源音頻模型Stable Audio Open，文本生成47秒高清音效

Aceryt ? 4116瀏覽 ? 0回復(fù)
浙大、螞蟻集團(tuán)推出MaPa：文本生成超真實3D模型

Aceryt ? 2879瀏覽 ? 0回復(fù)
RAG技術(shù)性能提升之文檔分塊策略方案

AIGC觀察者 ? 4763瀏覽 ? 0回復(fù)
Midjourney大更新，細(xì)節(jié)最強(qiáng)文本生圖片模型來啦！

Aceryt ? 2463瀏覽 ? 0回復(fù)
大模型學(xué)習(xí)方法之——大模型技術(shù)學(xué)習(xí)路線

AI探索時代 ? 3892瀏覽 ? 0回復(fù)
大模型技術(shù)學(xué)習(xí)之——大模型常用架構(gòu)以及技術(shù)難點

AI探索時代 ? 3455瀏覽 ? 0回復(fù)
綜述 | 大模型的可控文本生成

NLP工作站 ? 3385瀏覽 ? 0回復(fù)
再談大模型工作流技術(shù)之——ComfyUI框架

AI探索時代 ? 7768瀏覽 ? 0回復(fù)
大模型圖像處理技術(shù)之擴(kuò)散模型——Diffusion Model

AI探索時代 ? 2618瀏覽 ? 0回復(fù)
什么是生成式大模型？大模型與生成式大模型的區(qū)別？

AI探索時代 ? 3391瀏覽 ? 0回復(fù)
大模型技術(shù)全面解析，從大模型的概念，技術(shù)，應(yīng)用和挑戰(zhàn)多個方面介紹大模型

AI探索時代 ? 1.4w瀏覽 ? 0回復(fù)
你知道大模型聊天補(bǔ)全和文本生成的區(qū)別嗎？

AI探索時代 ? 2832瀏覽 ? 0回復(fù)
Kaggle大模型競賽優(yōu)勝方案總結(jié)與思考

arnoldzhw ? 2960瀏覽 ? 0回復(fù)
文字秒變視頻，附技術(shù)細(xì)節(jié)

云原生AI百寶箱 ? 1981瀏覽 ? 0回復(fù)
2025年大模型與Transformer架構(gòu)：技術(shù)前沿與未來趨勢報告

歐米伽未來研究所 ? 6064瀏覽 ? 0回復(fù)
文本生成無限長視頻，無需任何訓(xùn)練

Aceryt ? 1802瀏覽 ? 0回復(fù)
多模態(tài)大模型Ovis核心技術(shù)點、訓(xùn)練方法、數(shù)據(jù)細(xì)節(jié)

大模型自然語言處理 ? 1574瀏覽 ? 0回復(fù)
Seedream 3.0技術(shù)細(xì)節(jié)重磅發(fā)布！中文圖文生成再進(jìn)化,2K高清+爆改文字渲染,遠(yuǎn)超Canva！

angel ? 2073瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

關(guān)于RAG應(yīng)用中怎么高質(zhì)量的進(jìn)行數(shù)據(jù)召回——召回策略的研究 1天前發(fā)布
關(guān)于基于RAG技術(shù)的智能客服系統(tǒng)解決方案 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：大模型的分類——生成式大模型和判別式大模型聯(lián)系與區(qū)別

下一篇：大模型的發(fā)展趨勢預(yù)測——大模型會做的更小，還是做的更大

社區(qū)精華內(nèi)容

目錄

<sub id="e444f"><p id="e444f"></p></sub>

<sub id="e444f"></sub>

<cite id="e444f"><track id="e444f"></track></cite>