自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

顛覆傳統(tǒng)RAG,創(chuàng)新大模型檢索增強(qiáng)—Insight-RAG

人工智能 新聞
Megagon實(shí)驗(yàn)室的研究人員提出了一種創(chuàng)新框架Insight-RAG,從而更好地捕捉任務(wù)特定的細(xì)微信息,整合的數(shù)據(jù)質(zhì)量也更高。

RAG已經(jīng)成為大模型的標(biāo)題,但傳統(tǒng)方法存在檢索深度不足、難以整合多源信息等弊端,例如,傳統(tǒng) RAG 依賴表面相關(guān)性檢索文檔,容易忽略單個(gè)文檔內(nèi)深埋的信息。在法律協(xié)議中,會忽略微妙的合同條款;在商業(yè)報(bào)告里,錯(cuò)過隱藏的數(shù)據(jù)趨勢。

所以,Megagon實(shí)驗(yàn)室的研究人員提出了一種創(chuàng)新框架Insight-RAG,從而更好地捕捉任務(wù)特定的細(xì)微信息,整合的數(shù)據(jù)質(zhì)量也更高。

圖片

洞察力識別器是Insight-RAG框架的第一步,其核心任務(wù)是從輸入查詢中提取關(guān)鍵的信息需求。通過分析輸入的查詢和任務(wù)背景,識別出完成任務(wù)所需的核心信息。

例如,如果任務(wù)是回答一個(gè)關(guān)于特定科學(xué)概念的問題,洞察力識別器會提取出問題中涉及的關(guān)鍵實(shí)體和關(guān)系,并將其轉(zhuǎn)化為一個(gè)可以被后續(xù)模塊理解的“洞察力”。

圖片

洞察力識別器會將輸入的查詢轉(zhuǎn)化為一個(gè)句子片段,這個(gè)句子片段是一個(gè)未完成的句子,需要后續(xù)模塊來補(bǔ)充完整。例如,對于問題“Person X的出生地是哪里?”洞察力識別器會提取出“Person X was born in”這樣的句子片段。該格式不僅簡化了問題的表達(dá),還為后續(xù)模塊提供了明確的檢索方向。

此外,洞察力識別器還會判斷問題的答案是否為多個(gè)。例如,如果問題是“加利福尼亞有哪些城市?”由于問題中使用了復(fù)數(shù)形式的名詞,因此答案應(yīng)該是多個(gè)城市。這一判斷將作為后續(xù)模塊處理問題的依據(jù)。

洞察力挖掘器是Insight-RAG框架的第二步,其任務(wù)是根據(jù)洞察力識別器提取的句子片段,從文檔數(shù)據(jù)庫中檢索出與之高度相關(guān)的具體內(nèi)容。這一模塊的核心是一個(gè)經(jīng)過專門訓(xùn)練的大型語言模型,該模型通過持續(xù)預(yù)訓(xùn)練的方式,學(xué)習(xí)如何從大量文檔中提取與任務(wù)相關(guān)的見解。

研究人員使用LLaMA-3.2 3B模型作為洞察力挖掘器,并對其進(jìn)行了持續(xù)預(yù)訓(xùn)練。

預(yù)訓(xùn)練過程中,模型不僅學(xué)習(xí)了原始文檔的內(nèi)容,還學(xué)習(xí)了從文檔中提取的三元組信息。這種雙重訓(xùn)練方式使得模型能夠更好地理解文檔中的語義關(guān)系,并能夠根據(jù)輸入的句子片段檢索出與之高度相關(guān)的具體內(nèi)容。

圖片

響應(yīng)生成器是Insight-RAG框架的最后一步,其任務(wù)是將原始查詢與洞察力挖掘器檢索到的具體內(nèi)容結(jié)合起來,生成一個(gè)上下文豐富且準(zhǔn)確的回答。這一模塊的核心是一個(gè)經(jīng)過微調(diào)的大型語言模型,通過整合原始查詢和檢索到的見解,生成一個(gè)完整的回答。

例如,如果原始問題是“Person X的出生地是哪里?”洞察力識別器提取出的句子片段是“Person X was born in”,而洞察力挖掘器檢索到的具體內(nèi)容是“New York”,那么響應(yīng)生成器將生成一個(gè)完整的回答:“Person X的出生地是紐約?!?/span>

響應(yīng)生成器的設(shè)計(jì)使得Insight-RAG框架能夠生成高質(zhì)量的回答,不僅考慮了文檔中的表面相關(guān)性,還深入挖掘了文檔中的語義信息。這種設(shè)計(jì)使得Insight-RAG框架在處理復(fù)雜任務(wù)時(shí)表現(xiàn)得更加出色。

為了評估Insight-RAG框架的性能,研究人員使用了AAN和OC兩個(gè)科學(xué)論文數(shù)據(jù)集進(jìn)行了綜合測試。

結(jié)果顯示,Insight-RAG框架在深層信息檢索任務(wù)中表現(xiàn)出色。與傳統(tǒng)的RAG方法相比,Insight-RAG在大多數(shù)情況下都能顯著提高準(zhǔn)確率。例如,在AAN數(shù)據(jù)集中,Insight-RAG的準(zhǔn)確率比傳統(tǒng)RAG方法提高了約60%。

圖片

Insight-RAG框架在多源信息聚合任務(wù)中同樣表現(xiàn)非常好。與傳統(tǒng)的RAG方法相比,Insight-RAG能夠更有效地聚合來自多個(gè)來源的信息,從而提高模型的性能。例如,在OC數(shù)據(jù)集中,Insight-RAG的準(zhǔn)確率比傳統(tǒng)RAG方法提高了約50%。

責(zé)任編輯:張燕妮 來源: AIGC開放社區(qū)
相關(guān)推薦

2025-03-28 08:00:00

RAG文本檢索大模型

2025-03-10 08:00:00

RAG檢索Reranker

2025-04-01 09:25:09

2023-10-14 17:46:17

RAG提示工程GPT-3

2025-03-04 09:10:00

RAG大模型AI

2024-05-28 09:24:32

2024-02-05 14:12:37

大模型RAG架構(gòu)

2024-05-20 08:31:33

檢索增強(qiáng)生成LLM大型語言模型

2024-11-19 13:05:40

2024-10-31 14:46:31

2025-04-29 08:20:51

2024-06-19 16:11:22

2025-02-11 08:00:00

大語言模型檢索增強(qiáng)生成CAG

2024-12-04 10:35:21

2024-02-18 09:00:00

RAG工具LlamaIndexChatGPT

2025-03-25 10:41:06

RAG大語言模型AI

2023-11-28 08:18:37

AIGCDBA

2024-11-04 10:40:00

AI模型

2025-04-29 08:09:39

2025-02-06 13:50:06

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號