自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

AI大模型+RAG的綜述!

人工智能
本文全面回顧了當(dāng)前最先進的RAG技術(shù),包括樸素RAG、進階RAG和模塊RAG等范式,并置于LLM背景下。文章討論了RAG過程中的核心技術(shù),如“檢索”、“生成”和“增強”,并深入探討了它們的協(xié)同作用。

1.介紹

本文全面回顧了當(dāng)前最先進的RAG技術(shù),包括樸素RAG、進階RAG和模塊RAG等范式,并置于LLM背景下。文章討論了RAG過程中的核心技術(shù),如“檢索”、“生成”和“增強”,并深入探討了它們的協(xié)同作用。此外,文章還構(gòu)建了一個全面的評估框架,概述了評估目標(biāo)和度量標(biāo)準(zhǔn),并進行了比較分析,闡明了RAG的優(yōu)缺點。最后,文章預(yù)測了RAG的未來發(fā)展方向,強調(diào)了解決當(dāng)前挑戰(zhàn)的潛在增強、多模式設(shè)置的擴展以及其生態(tài)系統(tǒng)的發(fā)展。

圖1 RAG技術(shù)發(fā)展科技樹圖1 RAG技術(shù)發(fā)展科技樹

2.定義

RAG是一種通過整合外部知識庫來增強LLM的性能的模式,采用協(xié)同方法結(jié)合信息檢索機制和上下文學(xué)習(xí)來提高LLM的性能。其工作流程包括三個關(guān)鍵步驟:將語料庫劃分為離散塊,構(gòu)建向量索引,并根據(jù)與查詢和索引塊的向量相似性來識別和檢索塊。這些步驟支持其信息檢索和上下文感知生成能力。RAG已成為LLMs系統(tǒng)中最受歡迎的架構(gòu)之一,許多對話產(chǎn)品幾乎完全基于RAG構(gòu)建。

圖 2 RAG 技術(shù)在 QA 問題中的案例圖 2 RAG 技術(shù)在 QA 問題中的案例

3.RAG框架

在RAG的技術(shù)演進歷程中,基于技術(shù)范式的考量,我們將其劃分為以下幾個發(fā)展階段:樸素RAG、進階RAG和模塊RAG。

3.1樸素RAG

樸素RAG研究范式是一種早期的方法學(xué),用于處理自然語言生成任務(wù)。它包括索引、檢索和生成三個階段。索引階段從原始數(shù)據(jù)中提取文本,并將其轉(zhuǎn)化為向量表示,以便于檢索和生成。檢索階段計算查詢向量與索引語料庫中向量化的塊之間的相似度分數(shù),并優(yōu)先檢索出最相似的塊作為擴展上下文的基礎(chǔ)。生成階段將查詢和選定的文檔合成一個連貫的提示,并要求大型語言模型根據(jù)提示來制定響應(yīng)。這種方法允許模型利用其內(nèi)在的參數(shù)知識或?qū)⑵漤憫?yīng)限制在提供文檔中所包含的信息。

Naive RAG在檢索、生成和增強三個關(guān)鍵領(lǐng)域面臨挑戰(zhàn),包括精度低、召回率低、幻覺挑戰(zhàn)、難以結(jié)合上下文、重復(fù)冗余、平衡段落價值、協(xié)調(diào)寫作風(fēng)格和語氣、過度依賴增強信息等。這些問題影響了模型性能和輸出質(zhì)量。

3.2進階RAG

進階RAG通過增強有針對性的檢索策略和改進索引方法來彌補Naive RAG的缺點。它實施了預(yù)檢索和后檢索策略,并采用了滑動窗口、細粒度分割和元數(shù)據(jù)等技術(shù)來改進索引方法。此外,還引入了各種方法來優(yōu)化檢索過程,如ILIN。在檢索階段,通過計算查詢和塊之間的相似性來確定適當(dāng)?shù)纳舷挛?,并微調(diào)嵌入模型以增強特定領(lǐng)域上下文中的檢索相關(guān)性。在后檢索階段,應(yīng)對上下文窗口限制帶來的挑戰(zhàn),并對檢索到的內(nèi)容進行重新排名和提示壓縮。

3.3模塊RAG

圖3 RAG 范式對比圖圖3 RAG 范式對比圖

模塊RAG結(jié)構(gòu)是新型框架,具大靈活性和適應(yīng)性,可整合各種方法增強功能模塊,解決特定問題。此范式漸成常態(tài),支持多模塊間串行流水線或端到端訓(xùn)練方法。進階RAG是模塊RAG的專門形式,Naive RAG是進階RAG的特例。三者關(guān)系為繼承和發(fā)展。

新模塊搜索模塊通過集成LLM生成的代碼、查詢語言和其他定制工具,實現(xiàn)了對特定場景的定制和額外的語料庫的直接搜索。記憶模塊利用LLM的記憶能力來引導(dǎo)檢索,通過迭代創(chuàng)建無界的記憶池并結(jié)合“原始問題”和“雙重問題”。RAG-Fusion通過采用多查詢方法來增強傳統(tǒng)搜索系統(tǒng),并揭示更深層次的變革性知識。查詢路由決定用戶的查詢的后續(xù)操作,選擇適合查詢的數(shù)據(jù)存儲,并確保搜索結(jié)果與用戶的顯式和隱含意圖緊密匹配。任務(wù)適配器專注于將RAG適應(yīng)于各種下游任務(wù),并增強了跨任務(wù)和模型的通用性。

新模式下的模塊RAG具有高度的適應(yīng)性,允許在RAG過程中替換或重新排列模塊以適應(yīng)特定問題情境。優(yōu)化RAG管道可以提高信息效率和信息質(zhì)量,通過整合各種搜索技術(shù)、改進檢索步驟、融入認知回溯、實施多功能的查詢策略和利用嵌入相似性,實現(xiàn)檢索效率和上下文信息的深度之間的平衡。這些方法有助于生成對后退提示的響應(yīng)和最終的答案生成過程。然而,這種方法可能不會始終產(chǎn)生令人滿意的結(jié)果,特別是在語言模型對主題不熟悉時。

4.檢索

在RAG中,精確語義表示、協(xié)調(diào)查詢和文檔語義空間、以及檢索器輸出與大型語言模型偏好的協(xié)調(diào),是高效檢索相關(guān)文檔的核心問題。

4.1加強語義表示

RAG中的語義空間對于查詢和文檔的多維映射至關(guān)重要,建立準(zhǔn)確語義空間的方法包括塊優(yōu)化和管理外部文檔的微調(diào)嵌入模型。塊優(yōu)化需要考慮索引內(nèi)容的性質(zhì)、嵌入模型、用戶查詢的預(yù)期長度和復(fù)雜性以及應(yīng)用程序的使用情況,而微調(diào)嵌入模型需要使用專門領(lǐng)域的數(shù)據(jù)集,以提高模型準(zhǔn)確捕捉特定領(lǐng)域信息的能力。最近的研究引入了多樣化的方法,如摘要嵌入技術(shù)、元數(shù)據(jù)篩選技術(shù)和圖索引技術(shù)等,以提高檢索結(jié)果和RAG的性能。

4.2對齊查詢和文檔

RAG應(yīng)用中,檢索器可以通過查詢重寫和嵌入變換兩種基本技術(shù)實現(xiàn)查詢和文檔語義對齊。查詢重寫通過將原始查詢與額外指導(dǎo)結(jié)合來創(chuàng)建偽文檔或生成“假設(shè)”文檔,而嵌入變換則通過優(yōu)化查詢嵌入的表示并將其映射到與預(yù)期任務(wù)更緊密對齊的潛在空間中。這兩種技術(shù)都能提高檢索器識別結(jié)構(gòu)化信息的能力。

4.3對齊檢索器和LLM

在RAG管道中,提高檢索命中率不一定能改善最終結(jié)果,因為檢索到的文檔可能不滿足LLMs的需求。為了改善檢索性能和更準(zhǔn)確地響應(yīng)用戶查詢,提出了兩種將檢索器輸出與LLMs偏好對齊的方法:微調(diào)檢索器和適配器。微調(diào)檢索器時,可以使用LLM反饋信號來完善檢索模型,并使用監(jiān)督信號進行訓(xùn)練。適配器則通過API集成功能或解決本地計算資源有限的問題來幫助對齊。此外,還介紹了四種監(jiān)督微調(diào)嵌入模型的方法,以提高檢索器和LLM之間的協(xié)同作用。這些方法有助于提高檢索性能和更準(zhǔn)確地響應(yīng)用戶查詢。

5.生成

RAG的重要組件是生成器,負責(zé)將檢索信息轉(zhuǎn)換為連貫文本。它通過整合數(shù)據(jù)提高準(zhǔn)確性,受檢索文本指導(dǎo)確保一致性。這種全面輸入讓生成器深入了解問題上下文,提供更有信息和上下文相關(guān)的響應(yīng)。生成器有助于提高大型模型對輸入數(shù)據(jù)的適應(yīng)能力。

5.1使用冷凍LLM進行后檢索

使用大型語言模型進行后檢索處理,可以優(yōu)化檢索結(jié)果質(zhì)量,使其更符合用戶需求或后續(xù)任務(wù)。信息壓縮和重新排序是兩種常見的操作,通過減少噪音、解決上下文長度限制和增強生成效應(yīng)來提高模型回答的準(zhǔn)確性。重新排序模型在優(yōu)化檢索器檢索的文檔集合方面起著重要作用,通過重新排列文檔記錄,優(yōu)先考慮最相關(guān)的項目,從而限制文檔總數(shù),提高檢索效率和響應(yīng)速度。這種方法還納入了上下文壓縮,以提供更精確的檢索信息。

5.2針對RAG的微調(diào)LLM

優(yōu)化RAG模型的關(guān)鍵在于生成器的優(yōu)化,生成器的作用是接收檢索到的信息并生成相關(guān)文本。為了提高生成器的性能,需要對模型進行微調(diào),并使用代表性工作進行數(shù)據(jù)和優(yōu)化函數(shù)的探索。總體優(yōu)化過程包括訓(xùn)練數(shù)據(jù)通常包括輸入-輸出對,旨在訓(xùn)練模型根據(jù)輸入生成輸出。利用對比學(xué)習(xí)和實施結(jié)構(gòu)化數(shù)據(jù)訓(xùn)練方案也可以提高模型性能。

6.RAG的增強

RAG發(fā)展關(guān)鍵技術(shù)主要圍繞增強階段、增強數(shù)據(jù)來源和增強過程三個方面。圖4展示了RAG核心組件的分類。

圖4 RAG的核心組件的分類體系圖4 RAG的核心組件的分類體系

6.1RAG的增強階段

RAG的增強階段包括預(yù)訓(xùn)練、微調(diào)和推理階段。預(yù)訓(xùn)練階段通過基于檢索的策略加強開放域QA的PTMs,如REALM模型和RETRO模型。微調(diào)階段,RAG與微調(diào)結(jié)合能更好地滿足特定場景需求,微調(diào)檢索器能優(yōu)化語義表示,協(xié)調(diào)檢索與生成模型,提升通用性和適應(yīng)性。推理階段,RAG模型的推理階段十分重要,與LLM的集成廣泛,如DSP框架、PKG方法、CREAICL、RECITE和ITRG等。這些增強階段能利用預(yù)訓(xùn)練模型的能力而無需進一步訓(xùn)練。

6.2增強源

RAG模型通過增強數(shù)據(jù)源的選擇和不同層次的知識處理技術(shù)來提高有效性。增強方法包括使用純文本等非結(jié)構(gòu)化數(shù)據(jù)、結(jié)構(gòu)化數(shù)據(jù),以及利用LLM自身生成的內(nèi)容進行檢索和增強。結(jié)合無結(jié)構(gòu)數(shù)據(jù)時,模型生成低概率單詞觸發(fā),創(chuàng)建臨時句子,用檢索到的上下文重新生成句子以預(yù)測后續(xù)句子。結(jié)合結(jié)構(gòu)化數(shù)據(jù)時,模型使用知識圖譜提供高質(zhì)量的上下文信息,緩解模型幻覺。在RAG中利用LLMs生成的文本時,模型將問題分為已知或未知,選擇性地應(yīng)用檢索增強,或?qū)LM生成器用于取代檢索器,通過迭代創(chuàng)建與檢索增強生成器無界的內(nèi)存池,使用內(nèi)存選擇器來選擇作為原始問題的雙重問題的輸出,從而自我增強生成模型。這些方法強調(diào)了RAG中創(chuàng)新數(shù)據(jù)源利用的廣泛性,旨在提高模型性能和任務(wù)有效性。

6.3增強過程

在RAG領(lǐng)域,為了解決單一檢索步驟和生成可能導(dǎo)致效率低下的問題,提出了改進檢索過程的方法,包括迭代檢索、遞歸檢索和自適應(yīng)檢索。迭代檢索通過多次迭代提供額外的上下文參考,增強后續(xù)答案生成的魯棒性。遞歸檢索通過反復(fù)改進搜索查詢來提高搜索結(jié)果的深度和相關(guān)性。自適應(yīng)檢索通過使LLM主動確定檢索的最佳時間和內(nèi)容來提高檢索信息的效率和相關(guān)性。這些方法需要根據(jù)特定場景的要求和每個方法的固有屬性進行選擇。

圖5 具有不同增強方面的代表性 RAG 研究的技術(shù)樹圖譜圖5 具有不同增強方面的代表性 RAG 研究的技術(shù)樹圖譜

圖6 RAG與其他模型優(yōu)化方法的比較圖6 RAG與其他模型優(yōu)化方法的比較

表1 RAG與微調(diào)之間的比較

6.4RAG與微調(diào)的比較

RAG和FT是兩種不同的方法,RAG適合特定查詢,F(xiàn)T適合復(fù)制特定結(jié)構(gòu)、樣式或格式。FT可以提升模型性能和效率,但不適合整合新知識或快速迭代新用途。這兩種方法可以相互補充,結(jié)合使用可能產(chǎn)生最優(yōu)性能。優(yōu)化過程可能需要多次迭代。

7.RAG評估

自然語言處理中的RAG模型評估在法律語言學(xué)社區(qū)中受到關(guān)注,評估主要目的是理解和優(yōu)化模型在不同應(yīng)用場景的性能。歷史上,評估主要集中在特定下游任務(wù)中的表現(xiàn),使用適合手頭任務(wù)的既定指標(biāo)?,F(xiàn)在,評估的目標(biāo)、方面、基準(zhǔn)和工具已經(jīng)轉(zhuǎn)向基于RAG模型獨特屬性的研究,以提供一個全面的概述。

7.1評估目標(biāo)

RAG模型的評價集中于檢索和生成模塊,評估檢索質(zhì)量可以使用命中率、MRR和NDCG等指標(biāo),評估生成質(zhì)量包括真實性、相關(guān)性、非危害性和準(zhǔn)確性,可以通過手動或自動評估方法進行。對于未標(biāo)記的內(nèi)容,評估還包括上下文相關(guān)的答案。評估方法可以用于檢索和生成的質(zhì)量評估。

7.2評估方面

RAG模型的評價主要關(guān)注三個關(guān)鍵質(zhì)量分數(shù)(上下文相關(guān)性和答案準(zhǔn)確性、相關(guān)性)和四種基本能力(噪聲魯棒性、負拒絕、信息整合、反事實魯棒性)。這些因素共同影響著模型的檢索和生成兩大目標(biāo)。質(zhì)量分數(shù)從信息檢索和生成過程中的不同角度評估模型的效率,而能力則對模型在各種挑戰(zhàn)和復(fù)雜場景下的性能至關(guān)重要。表2總結(jié)了每個評估方面的具體指標(biāo)。

表2 適用于評價方面RAG的指標(biāo)摘要表

7.3評估基準(zhǔn)和工具

RAG模型評估框架由基準(zhǔn)測試和自動化評估工具組成,提供定量指標(biāo)以衡量模型表現(xiàn)并加深對其能力的理解?;鶞?zhǔn)測試評估模型基本能力,而自動化工具利用LLM裁定質(zhì)量分數(shù)。這些工具和基準(zhǔn)共同構(gòu)成強大的RAG模型評估框架,如表3所示。

表3 評價框架摘要

8.未來展望

這一部分探討了RAG的三個未來展望:未來的挑戰(zhàn)、模式擴展和RAG生態(tài)系統(tǒng)。

8.1RAG的未來挑戰(zhàn)

RAG技術(shù)雖然取得了顯著進展,但仍面臨一些挑戰(zhàn),如擴大LLM角色、規(guī)模定律和生產(chǎn)就緒的RAG等。RAG技術(shù)已經(jīng)超越了基于文本的問答,接納了圖像、音頻和視頻等多種模態(tài)數(shù)據(jù),催生了創(chuàng)新的多模態(tài)模型。在圖像領(lǐng)域,RA-CM3和BLIP-2等模型實現(xiàn)了文本和圖像的檢索和生成,以及零樣本圖像到文本轉(zhuǎn)換。在音頻和視頻領(lǐng)域,GSS方法、UEOP、基于KNN的注意力融合、Vid2Seq等也取得了進展。在代碼領(lǐng)域,RBPS通過編碼和頻率分析檢索與開發(fā)人員目標(biāo)一致的代碼示例,表現(xiàn)出色。RAG技術(shù)還有很大的發(fā)展空間。

8.2RAG生態(tài)系統(tǒng)

RAG生態(tài)系統(tǒng)是一種強大的語言模型,能夠處理復(fù)雜的查詢并產(chǎn)生詳細的響應(yīng),在醫(yī)學(xué)、法律和教育等領(lǐng)域表現(xiàn)出色。RAG生態(tài)系統(tǒng)的發(fā)展受到技術(shù)堆棧發(fā)展的影響,如關(guān)鍵工具的流行和新興技術(shù)堆棧的獨特貢獻。RAG模型和技術(shù)堆棧的共同增長是顯而易見的,技術(shù)進步不斷為現(xiàn)有基礎(chǔ)設(shè)施制定新標(biāo)準(zhǔn)。RAG工具包正在匯集成為一個基礎(chǔ)技術(shù)堆棧,為高級企業(yè)應(yīng)用程序奠定基礎(chǔ)。然而,完全集成和全面的平臺的概念仍然存在,有待進一步的創(chuàng)新和發(fā)展。

圖 7 RAG 的生態(tài)系統(tǒng)概覽圖 7 RAG 的生態(tài)系統(tǒng)概覽

責(zé)任編輯:華軒 來源: 數(shù)據(jù)分析及應(yīng)用
相關(guān)推薦

2024-11-29 18:37:07

2024-02-05 14:12:37

大模型RAG架構(gòu)

2023-09-14 12:35:59

2023-05-16 12:11:22

2025-02-06 13:50:06

2024-01-06 17:31:56

模型技術(shù)

2024-12-04 10:35:21

2025-04-16 02:30:00

2024-11-21 15:44:21

2023-05-10 14:40:40

AI模型算力

2024-08-05 10:23:36

2020-12-21 09:44:06

Google Transforme技術(shù)

2025-04-22 08:08:37

2025-03-21 14:34:17

2024-12-25 08:02:17

人工智能AI運維

2024-10-18 15:40:00

2024-07-01 10:19:22

2023-11-22 11:29:28

2023-11-05 10:04:47

2024-02-26 00:00:00

RAG系統(tǒng)圖譜
點贊
收藏

51CTO技術(shù)棧公眾號