自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<s id="umof8"><li id="umof8"></li></s>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn) 原創(chuàng)

大模型自然語言處理

發(fā)布于 2024-11-28 16:46

瀏覽

0收藏

前言

檢索增強生成（RAG）系統(tǒng)在處理復(fù)雜推理任務(wù)方面展現(xiàn)出顯著的潛力。然而，現(xiàn)有的RAG系統(tǒng)在面對需要復(fù)雜推理、多領(lǐng)域知識集成及數(shù)值計算的任務(wù)時，仍存在性能瓶頸。為了進一步提升系統(tǒng)的表現(xiàn)，本文提出了一種混合RAG系統(tǒng)，通過整合多種優(yōu)化方法，顯著增強了系統(tǒng)的推理能力和處理復(fù)雜任務(wù)的能力。本文介紹的RAG系統(tǒng)設(shè)計并實現(xiàn)了一個包括網(wǎng)頁處理、屬性預(yù)測、數(shù)值計算、LLM知識提取、知識圖譜及推理模塊在內(nèi)的綜合架構(gòu)。該系統(tǒng)能夠有效地從多種來源提取信息，并通過高級推理模塊結(jié)合這些信息，生成高質(zhì)量的答案。

一、方法

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

混合RAG系統(tǒng)整體架構(gòu)

混合RAG系統(tǒng)包括六個關(guān)鍵模塊：網(wǎng)頁處理、屬性預(yù)測器、數(shù)值計算器、LLM知識提取器、知識圖譜模塊和推理模塊。

網(wǎng)頁處理：使用trafilatura和BeautifulSoup庫從網(wǎng)頁中提取文本和表格，然后使用Blingfire庫將文本分割成句子，并根據(jù)關(guān)鍵詞將句子組織成文本塊。
屬性預(yù)測器：通過LLMs和SVM分類器評估問題的領(lǐng)域、類型和時效性，以優(yōu)化模型在不同問題類型上的性能。
數(shù)值計算器：利用外部Python解釋器進行數(shù)值計算，通過LLMs生成數(shù)學(xué)表達式，并使用eval函數(shù)處理這些表達式。
LLM知識提取器：利用LLMs內(nèi)部的知識進行推理，減少對外部參考文檔的依賴。
知識圖譜模塊：通過模擬API查詢知識圖譜，使用LLMs生成查詢語句。
推理模塊：結(jié)合文本塊、表格、知識圖譜三元組和LLM知識進行最終答案的推理，通過設(shè)計良好的提示模板和控制推理路徑來實現(xiàn)。

1.1 網(wǎng)頁處理

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

網(wǎng)頁處理

文本塊處理：

使用trafilatura庫從網(wǎng)頁中提取純文本，該庫能有效去除噪聲，如頁眉、頁腳和鏈接。

對于trafilatura無法處理的網(wǎng)頁，使用BeautifulSoup作為備選方案。

利用Blingfire庫將提取的文本分割成句子。

根據(jù)關(guān)鍵詞將句子組織成文本塊，例如，將問題和其后的文本連接起來，直到達到預(yù)設(shè)的長度閾值。

表格處理：

使用BeautifulSoup提取網(wǎng)頁中的表格，并將其轉(zhuǎn)換為Markdown格式。
清理空表格以減少噪聲。

文本嵌入和rank指標(biāo)：

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

rank指標(biāo)

使用sentence-t5-large模型生成文本塊和查詢的向量嵌入。
采用余弦相似度作為排名指標(biāo)，計算用戶查詢嵌入和文本塊嵌入之間的相似度。

1.2 屬性預(yù)測

In-Context Learning（ICL）：利用大型語言模型（LLMs）的自然語言理解和多任務(wù)泛化能力。通過向模型提供分類指令和5個類別的示例，指導(dǎo)其對后續(xù)問題進行分類。采用自我一致性策略，多次采樣模型的輸出，選擇出現(xiàn)頻率最高的類別作為問題的分類結(jié)果。
支持向量機（SVM）：使用CRAG公開數(shù)據(jù)集訓(xùn)練一個SVM分類器。利用MiniLM-L6-v2模型獲取句子嵌入，用于訓(xùn)練SVM。SVM模型在預(yù)測屬性方面表現(xiàn)出較高的準(zhǔn)確性，并且計算開銷較小。

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

屬性預(yù)測提示詞

1.3 數(shù)值計算

生成數(shù)學(xué)表達式：鼓勵大型語言模型（LLMs）將推理過程表述為數(shù)學(xué)表達式。將可能包含數(shù)值信息的檢索到的文本塊和表格整合到模型的提示中。使用提示技術(shù)促使模型直接生成有效的Python表達式。
計算表達式：使用多次采樣生成Python表達式，并通過eval函數(shù)處理這些表達式以得到計算結(jié)果。

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

數(shù)值計算提示詞

安全性和終止執(zhí)行：LLMs生成的程序代碼可能包含惡意代碼，直接執(zhí)行這些代碼可能對系統(tǒng)穩(wěn)定性構(gòu)成威脅。為了確保系統(tǒng)安全，最佳實踐是使用ast.literal_eval或在沙箱環(huán)境中執(zhí)行代碼。

1.4 LLM知識提取器

知識提取器的過程類似于常規(guī)的模型生成過程。使用zero-shot提示，這些提示要求模型評估給定查詢是否涉及錯誤前提，并生成更簡潔的響應(yīng)。在提示中不包含來自外部知識庫的參考文檔，并且不包括多次采樣，以減少計算開銷。

LLM能夠僅基于訓(xùn)練過程中內(nèi)部化的知識進行響應(yīng)。這種方法在處理被分類為慢變和穩(wěn)定的問題時表現(xiàn)良好。

直接讓模型回答問題可能會引入幻覺，盡管使用了零樣本CoT推理。為了平衡幻覺和LLM內(nèi)部知識，系統(tǒng)將LLM知識提取器的輸出僅作為參考之一。設(shè)計了特定的提示，確保模型既不過度依賴文檔參考，也不過分信任LLM的知識。

提示模板旨在讓LLM基于所有參考信息進行推理并得出最終答案。通過輸出格式示范和零樣本CoT控制推理過程，這對于多跳問題特別有用。利用Llama3-70B-Instruct的強指令遵循能力，成功地在控制推理任務(wù)方面取得了穩(wěn)步進展。

設(shè)計了多條規(guī)則來約束推理路徑和輸出格式，確保輸出精確。通過在提示中提出中間問題來引導(dǎo)模型推理。

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

LLM知識提取器提示詞

1.5 知識圖譜抽取模塊

使用 函數(shù)調(diào)用方法：系統(tǒng)從查詢中提取實體，并使用LLM生成函數(shù)調(diào)用來檢索相關(guān)信息。函數(shù)調(diào)用的質(zhì)量取決于LLM生成的查詢語句的質(zhì)量。

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

知識圖譜抽取模塊提示詞-函數(shù)調(diào)用方法的提示模板

1.6 推理模塊

輸入信息整合：推理模塊接收來自網(wǎng)頁處理、數(shù)值計算器、LLM知識提取器和知識圖譜模塊的所有參考信息，包括文本塊、表格、知識圖譜三元組和LLM生成的知識。
提示模板設(shè)計：設(shè)計了一個詳細的提示模板，用于指導(dǎo)大型語言模型（LLM）進行推理。提示模板包括系統(tǒng)提示和用戶提示。系統(tǒng)提示明確了任務(wù)要求、規(guī)則和輸出格式。用戶提示包含了具體的查詢和參考信息。
推理路徑控制：通過輸出格式示范和零樣本CoT技術(shù)，控制推理路徑，特別是對于多跳問題。設(shè)計了多條規(guī)則來約束推理路徑和輸出格式，確保輸出精確。
中間問題引導(dǎo)：在提示中提出中間問題，引導(dǎo)模型進行逐步推理，從而提高推理的準(zhǔn)確性和詳細程度。
處理不確定性和錯誤：如果參考信息不包含回答問題所需的信息，或者模型無法基于當(dāng)前知識直接回答問題，模型將回答“我不知道”。如果問題的前提是錯誤的，模型將回答“無效問題”。
最終答案生成：模型生成的推理過程和最終答案必須遵循嚴(yán)格的格式要求，確保答案簡潔且詳細解釋推理過程。

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

推理模塊提示詞

1.7 處理邊界情況

無效問題：通過分析提供的參考信息，識別出具有錯誤前提的問題，即查詢與事實相矛盾的問題。在推理提示中添加特殊規(guī)則，使模型在這種情況下輸出“無效問題”。
減少幻覺：使用屬性預(yù)測器和推理模塊來減少幻覺。對于時間變化的問題，模型會回答“我不知道”，因為這些問題難以處理。在推理模塊中添加規(guī)則和提示工程技術(shù)，使模型在不確定時回答“我不知道”。
格式錯誤：由于未對推理輸出進行約束采樣，模型可能會生成無法解析的答案。設(shè)計了一個備份總結(jié)代理，當(dāng)解析失敗時，基于推理模塊的輸出生成簡潔準(zhǔn)確的總結(jié)。設(shè)計了一個備份總結(jié)代理，當(dāng)解析失敗時，基于推理模塊的輸出生成簡潔準(zhǔn)確的總結(jié)。

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

備份總結(jié)代理提示詞

二、實驗

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

領(lǐng)域?qū)傩员憩F(xiàn)：系統(tǒng)在電影、音樂和開放領(lǐng)域表現(xiàn)良好，但在金融和體育領(lǐng)域表現(xiàn)不佳，主要因為這些領(lǐng)域需要處理動態(tài)信息。
動態(tài)性問題：隨著問題的動態(tài)性增加，系統(tǒng)的有效性逐漸下降。
問題類型表現(xiàn)：系統(tǒng)在需要復(fù)雜推理的任務(wù)上表現(xiàn)優(yōu)異，這得益于強大的推理模塊。

混合RAG系統(tǒng)，提升復(fù)雜推理任務(wù)表現(xiàn)-AI.x社區(qū)

消融實驗

數(shù)值計算器和推理模塊對系統(tǒng)性能的提升貢獻顯著。

總結(jié)

本文介紹了一種混合檢索增強生成（RAG）系統(tǒng)，通過一系列綜合優(yōu)化顯著提高了檢索質(zhì)量、增強了推理能力并提升了數(shù)值計算能力，通過多個模塊的協(xié)同工作顯著提升了LLMs在復(fù)雜推理任務(wù)中的表現(xiàn)。

參考文獻

A Hybrid RAG System with Comprehensive Enhancement on Complex Reasoning，https://arxiv.org/pdf/2408.05141v1
??https://gitlab.aicrowd.com/shizueyy/crag-new??

本文轉(zhuǎn)載自公眾號大模型自然語言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/KVSVPSpY0epi85xgF2h5Cw??

?著作權(quán)歸作者所有，如需轉(zhuǎn)載，請注明出處，否則將追究法律責(zé)任

標(biāo)簽

已于2024-11-28 18:47:06修改

贊

收藏

回復(fù)

舉報

回復(fù)

相關(guān)推薦

AI學(xué)會隱藏思維暗中推理！不依賴人類經(jīng)驗解決復(fù)雜任務(wù)，更黑箱了

Crystalcxt ? 2259瀏覽 ? 0回復(fù)
Transformer在復(fù)雜推理任務(wù)中的新進展：多步邏輯推理中的匹配策略

xuxiangda ? 4829瀏覽 ? 0回復(fù)
Gptpdf：一個簡單巧妙的復(fù)雜Pdf解析工具，提升RAG效果

Syrupup ? 5301瀏覽 ? 0回復(fù)
RegMix-用回歸任務(wù)解決大模型數(shù)據(jù)混合問題

NLP工作站 ? 3064瀏覽 ? 0回復(fù)
提升RAG系統(tǒng)性能10條策略建議

AIGC觀察者 ? 2515瀏覽 ? 0回復(fù)
用于復(fù)雜RAG任務(wù)的先進可控Agent

PaperAgent ? 2333瀏覽 ? 0回復(fù)
提升 RAG 系統(tǒng)的回答質(zhì)量：構(gòu)建高效的 Prompt

玄姐聊AGI ? 3215瀏覽 ? 0回復(fù)
【學(xué)習(xí)挑戰(zhàn)賽】任務(wù)進階，完成就有獎品拿

AI.x社區(qū)官方賬號 ? 3.2w瀏覽 ? 2回復(fù)
StaR ｜用少量推理數(shù)據(jù)讓模型學(xué)會通用推理能力，顯著提升模型復(fù)雜推理

arnoldzhw ? 2787瀏覽 ? 0回復(fù)
淺看引入智能信息助理提升大模型處理復(fù)雜推理任務(wù)的潛力-AssisTRAG

大模型自然語言處理 ? 1920瀏覽 ? 0回復(fù)
R2AG:將檢索信息融入RAG，提升問答系統(tǒng)準(zhǔn)確性

大模型自然語言處理 ? 1781瀏覽 ? 0回復(fù)
使用MCTS顯著提升LLM在復(fù)雜任務(wù)的推理能力

arnoldzhw ? 5773瀏覽 ? 0回復(fù)
提升RAG性能的全攻略：優(yōu)化檢索增強生成系統(tǒng)的策略大揭秘

Halo咯咯 ? 5187瀏覽 ? 0回復(fù)
“RAG界的DeepSeek”開源-企業(yè)復(fù)雜私域知識理解與推理框架PIKE-RAG

大模型自然語言處理 ? 2245瀏覽 ? 0回復(fù)
為什么大模型在 OCR 任務(wù)上表現(xiàn)不佳？

Baihai_IDP ? 941瀏覽 ? 0回復(fù)
RAG系統(tǒng)中的“幕后英雄”：重排器如何提升信息檢索的精準(zhǔn)度？

Halo咯咯 ? 808瀏覽 ? 0回復(fù)
Agentic RAR+Nano-GraphRAG+Claude 3.7 Sonnet=智能推理RAG系統(tǒng)

PyTorch研習(xí)社 ? 693瀏覽 ? 0回復(fù)
Hybrid-RRF：動態(tài)權(quán)重混合檢索RAG方案

大語言模型論文跟蹤 ? 1832瀏覽 ? 0回復(fù)
谷歌新型 AI 系統(tǒng)在復(fù)雜診斷中表現(xiàn)超越醫(yī)生

51CTO內(nèi)容精選 ? 577瀏覽 ? 0回復(fù)

大模型自然語言處理

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Kimi-VL開源多模態(tài)大模型結(jié)構(gòu)、訓(xùn)練方法、訓(xùn)練數(shù)據(jù)淺析 2025-04-16 07:08:19發(fā)布
十大PDF解析工具在不同文檔類別中的比較研究 2025-04-07 06:31:37發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： RAG再進化？基于長期記憶的檢索增強生成新范式-MemoRAG

下一篇： DB-GPT-Hub:text2sql的微調(diào)框架及基準(zhǔn)測試套件

社區(qū)精華內(nèi)容

目錄

<blockquote id="tm4ig"><i id="tm4ig"></i></blockquote>

<sub id="tm4ig"></sub>