談?wù)?RAG 的四個(gè)級別
選擇正確的 RAG(檢索增強(qiáng)生成)架構(gòu)主要取決于具體的用例和實(shí)施要求,確保系統(tǒng)符合任務(wù)需求。
Agentic RAG 的重要性將日益增加,與Agentic X的概念相一致,其中代理能力嵌入個(gè)人助理和工作流程中。
這里的“X”代表代理系統(tǒng)的無限適應(yīng)性,能夠?qū)崿F(xiàn)無縫任務(wù)自動(dòng)化和跨不同環(huán)境的明智決策,從而提高組織效率和自主性。綜合不同的文檔來源對于有效解決復(fù)雜、多部分的查詢至關(guān)重要。
一、概述
提供準(zhǔn)確的 RAG 實(shí)現(xiàn)的挑戰(zhàn)包括檢索相關(guān)數(shù)據(jù)、準(zhǔn)確解釋用戶意圖以及利用 LLM 的推理能力完成復(fù)雜任務(wù)??梢酝ㄟ^像 ReAct 這樣的 RAG 的代理方法增強(qiáng)推理能力,其中創(chuàng)建了事件的推理和行為序列。
我從這項(xiàng)研究中發(fā)現(xiàn)一個(gè)有趣的事實(shí):它指出沒有一個(gè)解決方案可以適合所有數(shù)據(jù)增強(qiáng)的 LLM 應(yīng)用程序。
上下文是指圍繞對話的信息,可幫助人工智能理解用戶的意圖并提供相關(guān)、連貫的響應(yīng)。
這包括用戶之前的輸入、當(dāng)前任務(wù)、環(huán)境以及任何可能影響對話的外部數(shù)據(jù)等因素。
有效的上下文處理使人工智能能夠保持一致和個(gè)性化的對話,根據(jù)正在進(jìn)行的互動(dòng)調(diào)整響應(yīng)并確保對話感覺自然且有意義。
用戶意圖檢測
在許多情況下,系統(tǒng)性能不佳的根源要么是未能確定任務(wù)的重點(diǎn),要么是需要多種技能組合的任務(wù),必須仔細(xì)區(qū)分這些技能才能獲得最佳結(jié)果。
意圖是指用戶輸入背后的潛在目的或目標(biāo),代表用戶希望通過查詢實(shí)現(xiàn)或傳達(dá)什么。
識別意圖可以讓人工智能系統(tǒng)做出適當(dāng)?shù)姆磻?yīng)。
二、RAG數(shù)據(jù)分類
級別 1:顯式事實(shí)查詢
直接詢問具體的已知事實(shí)。
查詢是關(guān)于給定數(shù)據(jù)中直接存在的明確事實(shí),不需要任何額外的推理。
這是最簡單的查詢形式,其中模型的任務(wù)主要是定位和提取相關(guān)信息。當(dāng)用戶提出問題時(shí),RAG 實(shí)現(xiàn)會(huì)針對分塊數(shù)據(jù)中包含的事實(shí)進(jìn)行定位。
級別 2:隱式事實(shí)查詢
間接尋找事實(shí),需要解釋來確定答案。
查詢涉及數(shù)據(jù)中的隱含事實(shí),這些事實(shí)不是顯而易見的,可能需要一定程度的常識推理或基本的邏輯推論。
必要的信息可能分布在多個(gè)部分或需要簡單的推理。
例如,What is the majority party now in the country where Canberra is located?可以通過將堪培拉位于澳大利亞這一事實(shí)與澳大利亞當(dāng)前多數(shù)黨的信息結(jié)合起來回答這個(gè)問題。
在第二級中,我們開始看到推理和行動(dòng)元素的引入,因此對 RAG 采取了更具代理性的方法。
級別 3:可解釋的原理查詢
專注于理解事實(shí)背后的推理,并需要支持邏輯解釋的數(shù)據(jù)。
這些查詢既需要事實(shí)知識,也需要解釋和應(yīng)用對數(shù)據(jù)背景至關(guān)重要的特定領(lǐng)域指南的能力。
這樣的理由通常在外部資源中提供,但在通用語言模型的初始預(yù)訓(xùn)練中很少遇到。
例如,在財(cái)務(wù)審計(jì)中,LLM可能需要遵循監(jiān)管合規(guī)指南來評估公司的財(cái)務(wù)報(bào)表是否符合標(biāo)準(zhǔn)。
同樣,在技術(shù)支持方面,可能需要遵循故障排除工作流程來協(xié)助用戶,確保響應(yīng)準(zhǔn)確并符合既定協(xié)議。
級別 4:隱藏的理性質(zhì)疑
尋求更深入的見解,通常需要基于上下文的推理來揭示潛在的含義或影響。
此類查詢需要人工智能根據(jù)數(shù)據(jù)中觀察到的模式和結(jié)果來推斷未明確記錄的復(fù)雜原理。
這些隱藏的理由涉及隱含的推理和邏輯聯(lián)系,很難精確定位和提取。
例如,在 IT 運(yùn)營中,語言模型可能會(huì)分析過去事件解決的模式以確定成功的策略。
同樣,在軟件開發(fā)中,人工智能可以借鑒過去的調(diào)試案例來推斷有效的問題解決方法。通過綜合這些隱含的洞察,模型能夠提供反映細(xì)致入微、基于經(jīng)驗(yàn)的決策的響應(yīng)。
可解釋和隱藏的原理將焦點(diǎn)轉(zhuǎn)移到 RAG 系統(tǒng)理解和應(yīng)用數(shù)據(jù)背后的推理的能力。
這些層次需要更深層次的認(rèn)知過程,其中代理框架與專家知識相一致或從非結(jié)構(gòu)化歷史數(shù)據(jù)中提取見解。
三、小結(jié)
根據(jù)研究并考慮上圖,需要明確事實(shí)的查詢和依賴于隱性推理的查詢之間存在區(qū)別。
例如,有關(guān)簽證資格的查詢需要領(lǐng)事館指南中的明確事實(shí)(L3),而有關(guān)對公司未來發(fā)展的經(jīng)濟(jì)影響的問題則需要對財(cái)務(wù)報(bào)告和經(jīng)濟(jì)趨勢進(jìn)行分析(L4)。
兩種情況下的數(shù)據(jù)依賴性都強(qiáng)調(diào)了外部來源的重要性——無論是官方文獻(xiàn)還是專家分析。
在這兩種情況下,提供理由有助于將回答內(nèi)容具體化,不僅提供答案,還提供背后的合理推理。