自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="fxzpg"></blockquote>

<sup id="fxzpg"><rt id="fxzpg"></rt></sup>

<optgroup id="fxzpg"></optgroup>

<sub id="fxzpg"><i id="fxzpg"></i></sub>

<menu id="fxzpg"><dd id="fxzpg"></dd></menu>

<cite id="fxzpg"></cite>

<p id="fxzpg"></p>

<cite id="fxzpg"></cite>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

增強(qiáng)問答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？

發(fā)布于 2024-9-14 14:14

瀏覽

0收藏

增強(qiáng)問答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？-AI.x社區(qū)

增強(qiáng)問答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？-AI.x社區(qū)

引言：文本檢索在信息檢索系統(tǒng)中的重要性

文本檢索是信息檢索系統(tǒng)的核心組成部分，它在搜索引擎、問答系統(tǒng)和推薦系統(tǒng)等多種應(yīng)用中發(fā)揮著至關(guān)重要的作用。隨著技術(shù)的發(fā)展，文本檢索已經(jīng)從簡單的關(guān)鍵詞匹配演變?yōu)槔脧?fù)雜的算法理解和匹配文本的語義。特別是在問答系統(tǒng)中，文本檢索技術(shù)能夠從大量數(shù)據(jù)中找到與用戶查詢最相關(guān)的信息，這對于提高系統(tǒng)的準(zhǔn)確性和用戶滿意度至關(guān)重要。

近年來，隨著深度學(xué)習(xí)技術(shù)的發(fā)展，基于神經(jīng)網(wǎng)絡(luò)的排名模型在文本檢索中的應(yīng)用越來越廣泛。這些模型通過學(xué)習(xí)文本之間深層的語義關(guān)系，能夠更準(zhǔn)確地評估和排序搜索結(jié)果，從而顯著提高檢索的準(zhǔn)確性。此外，多階段文本檢索系統(tǒng)的出現(xiàn)，通過先進(jìn)行粗篩選再精細(xì)排序的方式，進(jìn)一步提高了檢索效率和準(zhǔn)確性。

本文將詳細(xì)介紹文本檢索技術(shù)的最新進(jìn)展，特別是在問答系統(tǒng)中的應(yīng)用，并通過實(shí)驗(yàn)比較不同排名模型的性能，為文本檢索技術(shù)的發(fā)展和應(yīng)用提供參考。

論文標(biāo)題: Enhancing Q&A Text Retrieval with Ranking Models: Benchmarking, fine-tuning and deploying Rerankers for RAG

機(jī)構(gòu): NVIDIA

論文鏈接:??https://arxiv.org/pdf/2409.07691.pdf??

文本檢索與排名模型的基本概念

1. 文本檢索的核心作用

文本檢索是許多信息檢索應(yīng)用的核心組成部分，如搜索、問答（Q&A）和推薦系統(tǒng)。近年來，文本檢索通過檢索增強(qiáng)生成（RAG）系統(tǒng)被賦予了新的使命，即為大型語言模型（LLM）提供外部和最新的上下文信息。

2. 文本嵌入模型

文本嵌入模型將變長文本表示為固定維度的向量，這對于有效的文本檢索至關(guān)重要，因?yàn)樗鼈兡軌蛘Z義匹配文本內(nèi)容。這些模型基于Transformer架構(gòu)，如Sentence-BERT、DPR等，通常通過對比學(xué)習(xí)作為雙編碼器或后組合模型進(jìn)行訓(xùn)練，優(yōu)化模型以最大化查詢和相關(guān)（正向）段落之間的相似性，同時(shí)最小化查詢和非相關(guān)（負(fù)向）段落之間的相似性。

3. 排名模型

排名模型在文本檢索系統(tǒng)中發(fā)揮著至關(guān)重要的作用，它們通常作為交叉編碼器，輸入查詢和段落對，使用自注意力機(jī)制深入模擬查詢和段落對的語義關(guān)系。排名模型僅為檢索模型檢索到的頂部候選段落提供相關(guān)性預(yù)測，可以通過使用較小的嵌入模型來提高檢索準(zhǔn)確性，從而顯著減少索引時(shí)間和成本。

NV-RerankQA-Mistral-4B-v3模型的介紹與優(yōu)勢

1. 模型概述

NV-RerankQA-Mistral-4B-v3是一種先進(jìn)的排名模型，它在文本檢索準(zhǔn)確性上實(shí)現(xiàn)了顯著提升。該模型是從Mistral 7B模型修剪而來，只保留了底部的16層，以減少推理計(jì)算和內(nèi)存需求。此外，它的自注意力機(jī)制從單向（因果）修改為雙向，以改進(jìn)Mistral基于嵌入模型的準(zhǔn)確性。

2. 訓(xùn)練與優(yōu)化

NV-RerankQA-Mistral-4B-v3采用對比學(xué)習(xí)和InfoNCE損失函數(shù)進(jìn)行訓(xùn)練，這種列表式對比學(xué)習(xí)損失函數(shù)旨在最大化問題和正向段落對的相關(guān)性得分，同時(shí)最小化問題和負(fù)向段落對的得分。在數(shù)據(jù)預(yù)處理階段，通過使用教師嵌入模型從語料庫中挖掘負(fù)樣本，以確保高質(zhì)量的訓(xùn)練數(shù)據(jù)。

增強(qiáng)問答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？-AI.x社區(qū)

實(shí)驗(yàn)設(shè)置與數(shù)據(jù)集

1. 數(shù)據(jù)集選擇與處理

在本研究中，我們使用了BEIR數(shù)據(jù)集的三個(gè)問答子集：Natural Questions (NQ)、HotpotQA 和 FiQA。這些數(shù)據(jù)集已經(jīng)被預(yù)處理，分割成不超過512個(gè)詞元的小段落。這種處理方式是為了適應(yīng)模型輸入的限制，并確保數(shù)據(jù)的一致性和可管理性。

2. 實(shí)驗(yàn)流程

實(shí)驗(yàn)的設(shè)置模仿了典型的文本檢索索引和查詢流程。首先進(jìn)行索引流程，將文本語料庫分割成更小的段落，并使用嵌入模型將這些段落轉(zhuǎn)換成向量后存儲在向量數(shù)據(jù)庫中。查詢流程隨后進(jìn)行，對于每個(gè)查詢，系統(tǒng)都會(huì)返回一個(gè)按相關(guān)性排序的段落列表，用于計(jì)算檢索指標(biāo)（如NDCG@10）。

在具體實(shí)現(xiàn)中，查詢問題被嵌入后，通過向量搜索（例如使用精確或近似最近鄰算法）在向量索引中找到最相關(guān)的top-k段落。然后，這些top-k段落通過排名模型進(jìn)行重新排序，以生成最終的有序列表。

實(shí)驗(yàn)結(jié)果與分析

1. 基準(zhǔn)結(jié)果

我們在不同的嵌入模型和排名模型組合下，對文本檢索流程進(jìn)行了基準(zhǔn)測試。測試結(jié)果顯示在不同的問答數(shù)據(jù)集上的NDCG@10評分如下：

對于較小的嵌入模型（如snowflake-arctic-embed-l和NV-EmbedQA-e5-v5），大多數(shù)交叉編碼器（除了小型的ms-marco-MiniLM-L-12-v2）都顯著提高了排名準(zhǔn)確性。
對于較大的嵌入模型（如NV-EmbedQA-Mistral7B-v2），只有大型的NV-RerankQA-Mistral-4B-v3排名模型能夠提高其準(zhǔn)確性。

特別是，NV-RerankQA-Mistral-4B-v3排名模型在所有數(shù)據(jù)集上都提供了最高的排名準(zhǔn)確性，較第二好的排名模型（bge-reranker-v2-m3）高出14%。

增強(qiáng)問答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？-AI.x社區(qū)

增強(qiáng)問答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？-AI.x社區(qū)

增強(qiáng)問答文本檢索的排序（RAG）模型，你學(xué)會(huì)了嗎？-AI.x社區(qū)

模型訓(xùn)練的權(quán)衡考慮

在部署文本檢索系統(tǒng)時(shí)，尤其是涉及到排名模型的多階段文本檢索系統(tǒng)，我們必須在模型大小、排名準(zhǔn)確性和系統(tǒng)需求（如索引和服務(wù)的延遲/吞吐量）之間進(jìn)行權(quán)衡。這些權(quán)衡考慮對于實(shí)現(xiàn)高效且成本效益高的系統(tǒng)至關(guān)重要。

1. 模型大小與系統(tǒng)性能的權(quán)衡

模型的大小直接影響到系統(tǒng)的性能。大型模型雖然能夠提高檢索的準(zhǔn)確性，但同時(shí)也會(huì)增加索引的時(shí)間和成本。例如，使用大型嵌入模型（如NV-EmbedQA-Mistral7B-v2）進(jìn)行文本索引，會(huì)顯著增加處理時(shí)間，這對于需要頻繁更新索引的應(yīng)用場景是不可接受的。因此，可能需要通過使用較小的嵌入模型和排名模型的組合來優(yōu)化性能和成本。

2. 排名準(zhǔn)確性與索引吞吐量的權(quán)衡

排名模型可以顯著提高檢索的準(zhǔn)確性，特別是在頂級候選文檔的再排名中。然而，這種準(zhǔn)確性的提高可能以犧牲索引吞吐量和服務(wù)延遲為代價(jià)。例如，NV-RerankQA-Mistral-4B-v3雖然在排名準(zhǔn)確性上表現(xiàn)優(yōu)異，但其復(fù)雜性和計(jì)算需求較高，可能不適合需要快速響應(yīng)的應(yīng)用。

本文轉(zhuǎn)載自??51CTO技術(shù)棧??，作者：柏企

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

阿里RAG新框架R4：增強(qiáng)檢索器-重排序-響應(yīng)器，5個(gè)知識密集任務(wù)上都超過Self-RAG等！

PaperAgent ? 5279瀏覽 ? 0回復(fù)
通過檢索增強(qiáng)生成(RAG) 增強(qiáng)LLM的實(shí)戰(zhàn)演練

51CTO內(nèi)容精選 ? 3227瀏覽 ? 0回復(fù)
DocReLM：自建數(shù)據(jù)集訓(xùn)練檢索模型和重排序模型提高 RAG 效果

大語言模型論文跟蹤 ? 3598瀏覽 ? 0回復(fù)
面向大語言模型的檢索增強(qiáng)生成(RAG)技術(shù)：綜述

angel ? 4711瀏覽 ? 0回復(fù)
RAG新范式MemLong：用于長文本生成的記憶增強(qiáng)檢索

PaperAgent ? 2553瀏覽 ? 0回復(fù)
MemLong：用于長文本建模的記憶增強(qiáng)檢索

sbf_2000 ? 2304瀏覽 ? 0回復(fù)
RAG高級優(yōu)化：基于問題生成的文檔檢索增強(qiáng)

恰似驚鴻 ? 2723瀏覽 ? 0回復(fù)
從檢索增強(qiáng)——RAG看檢索技術(shù)的發(fā)展

AI探索時(shí)代 ? 1938瀏覽 ? 0回復(fù)
如何讓LLM學(xué)會(huì)"試錯(cuò)" | LLM竟然學(xué)會(huì)了"自我反省"，它真的有自我意識嗎？

sbf_2000 ? 2394瀏覽 ? 0回復(fù)
再談大模型檢索增強(qiáng)生成——RAG

AI探索時(shí)代 ? 1845瀏覽 ? 0回復(fù)
OPEN-RAG：利用開源大模型增強(qiáng)檢索增強(qiáng)推理

大模型自然語言處理 ? 2049瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG檢索模塊初建成

一起AI技術(shù) ? 2051瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG的檢索增強(qiáng)之ElasticSearch

一起AI技術(shù) ? 2429瀏覽 ? 0回復(fù)
基于Agent的金融問答系統(tǒng)：RAG的檢索增強(qiáng)之上下文重排和壓縮

一起AI技術(shù) ? 1861瀏覽 ? 0回復(fù)
怎么解決大模型知識庫的檢索問題，RAG檢索增強(qiáng)之ReRank(重新排序)

AI探索時(shí)代 ? 3013瀏覽 ? 0回復(fù)
RAG檢索增強(qiáng)生成和大模型微調(diào)的抉擇

AI探索時(shí)代 ? 1979瀏覽 ? 0回復(fù)
故障診斷 | 信號降噪算法合集，你學(xué)會(huì)了嗎？

Tang_Lan ? 2355瀏覽 ? 0回復(fù)
什么是檢索增強(qiáng)生成 (RAG)？

Halo咯咯 ? 1611瀏覽 ? 0回復(fù)
RAG只能應(yīng)用于文本檢索嗎？關(guān)于大模型應(yīng)用之RAG——檢索增強(qiáng)的思考

AI探索時(shí)代 ? 1063瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

深度剖析：為何擴(kuò)散模型會(huì)成為語言模型的未來？ 2025-03-14 07:45:15發(fā)布
一文讀懂 RAG-Gym：用過程監(jiān)督優(yōu)化推理與搜索智能體 2025-03-04 10:43:21發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：破解AI多模態(tài)理解難題：浙江大學(xué)與字節(jié)跳動(dòng)聯(lián)手推出Molecule-Space新方法

下一篇：斯坦福大學(xué)研究團(tuán)隊(duì)破解小規(guī)模語料庫知識獲取難題，提出創(chuàng)新的合成持續(xù)預(yù)訓(xùn)練方法

社區(qū)精華內(nèi)容

目錄

<mark id="06wws"></mark>

<sub id="06wws"><p id="06wws"><li id="06wws"></li></p></sub>

<rt id="06wws"><var id="06wws"></var></rt>

<dfn id="06wws"><pre id="06wws"></pre></dfn>

<abbr id="06wws"></abbr>