自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="sq8a0"><acronym id="sq8a0"></acronym></blockquote>

<pre id="sq8a0"></pre>

<thead id="sq8a0"><video id="sq8a0"><small id="sq8a0"></small></video></thead>

<var id="sq8a0"></var>

<table id="sq8a0"><strong id="sq8a0"><nav id="sq8a0"></nav></strong></table>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

LLM和RAG技術(shù)的比較探索原創(chuàng)

51CTO技術(shù)棧

發(fā)布于 2024-4-30 10:13

瀏覽

0收藏

作者 | Ashok Gorantla

整理 | 言征

出品 | 51CTO技術(shù)棧（微信號：blog51cto）

在人工智能（AI）的動態(tài)環(huán)境中，兩種開創(chuàng)性的技術(shù)——大型語言模型（LLM）和檢索增強生成（RAG）——在理解和生成類人文本方面脫穎而出。本文開始了LLM和RAG之間的比較之旅，揭示了它們的機制、應(yīng)用以及它們?yōu)槿斯ぶ悄茴I(lǐng)域提供的獨特優(yōu)勢。

一、大型語言模型（LLM）：基礎(chǔ)與應(yīng)用

LLM，如GPT（Generative Pre-trained Transformer），憑借其在廣泛的主題中生成連貫和上下文相關(guān)文本的能力，已經(jīng)徹底改變了人工智能場景。LLM的核心是依靠大量的文本數(shù)據(jù)和復(fù)雜的神經(jīng)網(wǎng)絡(luò)架構(gòu)，從他們接受過訓(xùn)練的文本內(nèi)容中學(xué)習(xí)語言模式、語法和知識。

LLM的優(yōu)勢在于它們的泛化能力：它們可以在沒有特定任務(wù)訓(xùn)練的情況下執(zhí)行各種與語言相關(guān)的任務(wù)。這包括翻譯語言、回答問題，甚至寫文章。然而，LLM并非沒有挑戰(zhàn)。他們有時會產(chǎn)生聽起來合理但不正確或無意義的答案，這種現(xiàn)象被稱為“幻覺”。此外，他們的輸出質(zhì)量在很大程度上取決于他們訓(xùn)練數(shù)據(jù)的質(zhì)量和廣度。

核心方面規(guī)模：LLM的標(biāo)志是其龐大的參數(shù)數(shù)量，達到數(shù)十億，涵蓋了廣泛的語言范圍。訓(xùn)練制度：他們對不同的文本數(shù)據(jù)進行預(yù)培訓(xùn)，隨后針對量身定制的任務(wù)進行微調(diào)，深入理解語言的細微差別。實用范圍：LLM可以在各個方面使用，從幫助內(nèi)容創(chuàng)建到促進語言翻譯。

示例：使用LLM生成文本

為了進行說明，請考慮以下使用LLM生成文本示例的Python代碼片段：

from transformers import GPT2Tokenizer, GPT2LMHeadModel

# Input
prompt = "How long have Australia held on to the Ashes?" 
    
# Encode the inputs with GPT2 Tokenizer
tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
inputs = tokenizer.encode(prompt, return_tensors='pt')  ## using pyTorch ('tf' to use TensorFlow)

# Generate outputs with gpt2 Model
model = GPT2LMHeadModel.from_pretrained('gpt2')
outputs = model.generate(inputs, max_length=25)

# Decode and print the result
result = tokenizer.decode(outputs[0], skip_special_tokens=True)
print("Generated text:", result)

這段代碼使用GPT-2（一種流行的LLM）初始化文本生成管道，并根據(jù)給定的提示生成文本。

二、檢索增強生成（RAG）：綜述和使用案例

RAG通過將GPT等模型的生成能力與檢索機制相結(jié)合，引入了一種新的方法。該機制實時搜索文本數(shù)據(jù)庫（如維基百科），以找到可用于通知模型響應(yīng)的相關(guān)信息。這種檢索和生成的結(jié)合使RAG能夠產(chǎn)生不僅與上下文相關(guān)，而且基于事實信息的答案。

與傳統(tǒng)LLM相比，RAG的主要優(yōu)勢之一是能夠通過參考最新來源提供更準(zhǔn)確和具體的信息。這使得RAG對于信息的準(zhǔn)確性和及時性至關(guān)重要的應(yīng)用程序特別有用，例如在新聞報道或?qū)W術(shù)研究援助中。

然而，對外部數(shù)據(jù)庫的依賴意味著，如果數(shù)據(jù)庫不全面或檢索過程效率低下，RAG的性能可能會受到影響。此外，將檢索機制集成到生成過程中會增加模型的復(fù)雜性，可能會增加所需的計算資源。

Core Aspects核心方面混合性質(zhì)：RAG模型首先檢索相關(guān)文檔，然后利用此上下文進行知情生成。動態(tài)知識訪問：與LLM不同，RAG模型可以利用最新或特定領(lǐng)域的數(shù)據(jù)，提供更強的通用性。應(yīng)用領(lǐng)域：RAG在需要外部知識的場景中大放異彩，如深度問答和事實內(nèi)容生成。

示例：為信息檢索實現(xiàn)RAG

以下是如何實現(xiàn)用于檢索和生成文本的基本RAG系統(tǒng)的簡化示例：

from transformers import RagTokenizer, RagRetriever, RagSequenceForGeneration 
 
# A sample query to ask the model
query = "How long have Australia held on to the Ashes?" 

tokenizer = RagTokenizer.from_pretrained("facebook/rag-sequence-nq")  ## Get the tokenizer from the pretrained model
tokenized_text = tokenizer(query, return_tensors='pt', max_length=100, truncatinotallow=True) ## Encode/Tokenize the query

# Find results with RAG-Sequence model (uncased model) using wiki_dpr dataset
retriever = RagRetriever.from_pretrained("facebook/rag-sequence-nq", index_name="exact", use_dummy_dataset=True) ## Uses a pretrained DPR dataset (wiki_dpr) https://huggingface.co/datasets/wiki_dpr
model = RagSequenceForGeneration.from_pretrained("facebook/rag-sequence-nq", retriever=retriever) 
model_generated_tokens = model.generate(input_ids=tokenized_text["input_ids"], max_new_tokens=1000) ## Find the relavant information from the dataset (tokens)

print(tokenizer.batch_decode(model_generated_tokens, skip_special_tokens=True)[0]) ## Decode the data to find the answer

該代碼利用Facebook的RAG模型來回答查詢，首先對輸入進行標(biāo)記，然后根據(jù)實時檢索到的信息生成響應(yīng)。

三、LLM vs RAG

LLM和RAG之間的選擇取決于特定的任務(wù)要求。以下是它們的組合方式：

1.知識可訪問性

LLM依賴于其預(yù)訓(xùn)練語料庫，可能導(dǎo)致信息過時。RAG具有檢索功能，可確保訪問最新的數(shù)據(jù)。

2.實施復(fù)雜性

RAG模型由于其雙步驟性質(zhì)，呈現(xiàn)出比LLM更高的復(fù)雜性和需要更多的資源。

3.靈活性和應(yīng)用

這兩種型號都具有廣泛的應(yīng)用潛力。LLM是各種NLP任務(wù)的堅實基礎(chǔ)，而RAG模型在即時訪問外部詳細數(shù)據(jù)至關(guān)重要的情況下表現(xiàn)出色。

四、結(jié)論：駕馭LLM和RAG的取舍

LLM和RAG都代表著人工智能理解和生成類人文本能力的重大進步。在LLM和RAG模型之間進行選擇需要權(quán)衡NLP項目的獨特需求。LLM提供了多功能性和通用性，使其適用于廣泛的應(yīng)用程序和各種語言任務(wù)。相比之下，RAG的優(yōu)勢在于其提供準(zhǔn)確、信息豐富的響應(yīng)的能力，在知識密集型任務(wù)中尤其有價值，非常適合于最新或特定詳細信息的整合至關(guān)重要的情況。

隨著人工智能的不斷發(fā)展，LLM和RAG的比較分析強調(diào)了為正確的任務(wù)選擇正確工具的重要性。鼓勵開發(fā)人員和研究人員在其特定需求的背景下權(quán)衡這些技術(shù)的優(yōu)勢和局限性，旨在充分利用人工智能在創(chuàng)建智能響應(yīng)和上下文感知應(yīng)用程序方面的潛力。

參考鏈接：??https://dzone.com/articles/a-comparative-exploration-of-llm-and-rag??

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：言征

?

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

AIGC圖像技術(shù)在淘寶人生2的探索和應(yīng)用

pangguiyu ? 6005瀏覽 ? 0回復(fù)
三大關(guān)鍵技術(shù)看RAG如何提升LLM的能力

angel ? 7346瀏覽 ? 0回復(fù)
【LLM】大語言模型在用戶興趣探索中的應(yīng)用

sbf_2000 ? 3855瀏覽 ? 0回復(fù)
如何訓(xùn)練LLM自動在RAG和參數(shù)記憶之間進行選擇

51CTO內(nèi)容精選 ? 2476瀏覽 ? 0回復(fù)
微軟重磅開源 GraphRAG：新一代 RAG 技術(shù)來了！

玄姐聊AGI ? 5455瀏覽 ? 0回復(fù)
LLM-based Agent在B端商業(yè)化的技術(shù)探索與實踐

51CTO技術(shù)棧 ? 3115瀏覽 ? 0回復(fù)
FlashAttention3：“苗條”的就是比較好！

魯班模錘1 ? 2931瀏覽 ? 0回復(fù)
基于網(wǎng)格環(huán)境的模仿學(xué)習(xí)技術(shù)實戰(zhàn)探索

51CTO內(nèi)容精選 ? 2549瀏覽 ? 0回復(fù)
#AIGC創(chuàng)新先鋒者征文大賽#快手 B 端商業(yè)化技術(shù)探索：基于 LLM 構(gòu)建智能 RAG 與 Agent 平臺

快手技術(shù) ? 2477瀏覽 ? 0回復(fù)
LLM-R：基于RAG和層次化Agent落地案例解析

恰似驚鴻 ? 2137瀏覽 ? 0回復(fù)
大模型技術(shù)全面解析，從大模型的概念，技術(shù)，應(yīng)用和挑戰(zhàn)多個方面介紹大模型

AI探索時代 ? 1.4w瀏覽 ? 0回復(fù)
MobileLLM：“苗條”的模型比較好！

魯班模錘1 ? 2275瀏覽 ? 0回復(fù)
?探索Sora背后秘密：結(jié)合OpenAI Sora技術(shù)報告來看其能力和技術(shù)點

arnoldzhw ? 2312瀏覽 ? 0回復(fù)
大模型之深入探索RAG流程

一起AI技術(shù) ? 2425瀏覽 ? 0回復(fù)
RAG應(yīng)用在得物開放平臺的智能答疑的探索

卓勝微wjp ? 1557瀏覽 ? 0回復(fù)
基于代理知識蒸餾技術(shù)克服文檔提取和RAG策略失敗問題?

51CTO內(nèi)容精選 ? 1021瀏覽 ? 0回復(fù)
GenAI紅隊：將LLM置于網(wǎng)絡(luò)安全測試中的技巧和技術(shù)

51CTO內(nèi)容精選 ? 971瀏覽 ? 0回復(fù)
EDC2-RAG：利用聚類和壓縮技術(shù)提升RAG準(zhǔn)確性

大語言模型論文跟蹤 ? 1518瀏覽 ? 0回復(fù)
關(guān)于個人的創(chuàng)業(yè)想法——基于人工智能技術(shù)在垂直領(lǐng)域解決方案的探索

AI探索時代 ? 426瀏覽 ? 0回復(fù)

51CTO技術(shù)棧

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

中國開源大模型新成員：小米推理大模型首秀！ 7h前發(fā)布
剛剛！一場直播讓宇樹成功正名！直播G1長跑操場40圈，6萬人點贊！真實跑步水平曝光：2m/s接近天工！ 12h前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

微軟突然封鎖Cursor，全面禁用C、C++、C#擴展，網(wǎng)友：理解微軟，Cursor白嫖VSCode 0回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

上一篇： OpenAI也要做搜索？傳SearchGPT將迎擊谷歌核心業(yè)務(wù)！OpenAI與金融時報新協(xié)議已定，將進行鏈接和引用

下一篇：全球開發(fā)者用GPT4都在做什么？這28種方法值得一看

社區(qū)精華內(nèi)容

目錄

<menuitem id="slej7"><td id="slej7"></td></menuitem>