自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破 原創(chuàng) 精華

發(fā)布于 2025-2-20 14:28
瀏覽
0收藏

摘要

盡管檢索增強生成(RAG)系統(tǒng)通過外部檢索擴展了大語言模型(LLM)的能力,并取得了一定進展,但這些系統(tǒng)在應(yīng)對復(fù)雜多變的工業(yè)應(yīng)用需求時仍顯不足。特別是在提取深度領(lǐng)域知識和進行邏輯推理方面,僅依賴檢索的方式存在明顯短板。為此,微軟推出了PIKE-RAG(sPecIalized KnowledgE and Rationale Augmentation Generation),旨在通過提取、理解和應(yīng)用專業(yè)知識,構(gòu)建連貫的推理鏈條,逐步引導(dǎo)LLM生成更精準的響應(yīng)。github對應(yīng)的地址如下: https://github.com/microsoft/PIKE-RAG

背景

當(dāng)前的RAG方法主要依賴文本檢索和LLM的理解能力,缺乏對多樣化數(shù)據(jù)源的深度利用。在工業(yè)應(yīng)用中,尤其是涉及專業(yè)知識和復(fù)雜邏輯的場景中,現(xiàn)有的RAG方法表現(xiàn)出明顯的局限性。以下是RAG在工業(yè)應(yīng)用中面臨的主要挑戰(zhàn):

  1. 知識來源多樣性:RAG系統(tǒng)依賴于多領(lǐng)域、多格式的文檔語料庫,包括掃描圖像、數(shù)字文本和網(wǎng)絡(luò)數(shù)據(jù)等,處理這些多樣化數(shù)據(jù)源的能力有限。
  2. 領(lǐng)域?qū)I(yè)化不足:工業(yè)應(yīng)用需要RAG系統(tǒng)具備特定領(lǐng)域的專業(yè)知識和邏輯推理能力,但現(xiàn)有的RAG方法在提取和理解領(lǐng)域特定知識方面表現(xiàn)不佳。例如,在半導(dǎo)體設(shè)計領(lǐng)域,LLM難以準確捕捉關(guān)鍵的物理原理。
  3. 一刀切的問題:不同應(yīng)用場景對RAG系統(tǒng)的能力要求各異,現(xiàn)有方法往往采用通用策略,無法滿足特定場景的復(fù)雜需求。例如,在基于規(guī)則的查詢和多跳查詢場景中,RAG系統(tǒng)需要不同的能力來應(yīng)對不同的挑戰(zhàn)。

架構(gòu)

PIKE-RAG框架主要由幾個基本模塊組成,包括文檔解析、知識提取、知識存儲、知識檢索、知識組織、以知識為中心的推理以及任務(wù)分解與協(xié)調(diào)。通過調(diào)整主模塊中的子模塊,可以實現(xiàn)專注于不同能力的RAG系統(tǒng),以滿足現(xiàn)實場景中的多樣化需求。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)

Overview of PIKE-RAG Framework

問題分類

面對RAG系統(tǒng)在工業(yè)應(yīng)用中的挑戰(zhàn),微軟提出了PIKE-RAG,通過提取、理解和應(yīng)用專業(yè)知識,結(jié)合特定任務(wù)的推理邏輯,顯著提升了RAG系統(tǒng)的能力。PIKE-RAG將問題分為四類:事實性問題可鏈接推理問題、預(yù)測性問題創(chuàng)造性問題,并據(jù)此提出了RAG系統(tǒng)的能力分類,為系統(tǒng)優(yōu)化指明了方向。

  1. 事實性問題:直接從語料庫中提取明確信息,依賴檢索機制識別相關(guān)事實。
  2. 可鏈接推理問題:需要多步推理和跨來源的知識整合,解決復(fù)雜邏輯鏈條。
  3. 預(yù)測性問題:通過歸納推理,將數(shù)據(jù)組織成可分析的形式(如時間序列),進行未來趨勢預(yù)測。
  4. 創(chuàng)造性問題:結(jié)合領(lǐng)域邏輯和創(chuàng)造性思維,生成創(chuàng)新解決方案。

這種分類方法不僅覆蓋了工業(yè)領(lǐng)域的多樣化需求,還確保了RAG系統(tǒng)能夠高效應(yīng)對從簡單檢索到復(fù)雜推理的全方位挑戰(zhàn)。PIKE-RAG的推出,標志著RAG系統(tǒng)在專業(yè)領(lǐng)域的應(yīng)用邁出了重要一步。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


知識庫

盡管當(dāng)前研究主要側(cè)重于通過算法增強提高檢索增強生成(RAG)系統(tǒng)的性能,但對RAG框架的全面評估仍較少。在此,我們以知識庫、任務(wù)分類和系統(tǒng)開發(fā)三個關(guān)鍵視角概括RAG框架。我們認為知識庫是RAG的核心,貫穿檢索和生成過程。并且,RAG任務(wù)的復(fù)雜性和難度可能會根據(jù)所需的生成能力和可用支持文本有顯著差異。因此,我們根據(jù)RAG系統(tǒng)解決不同問題的能力將其劃分為不同層次。

在實際應(yīng)用中,特定領(lǐng)域(如制造業(yè)、能源和物流)的專業(yè)知識主要來自多年積累的數(shù)據(jù),例如藥品行業(yè)的大量研發(fā)文檔和藥物申請文件。這些資料包含多種格式和多模態(tài)內(nèi)容,如表格、圖表和圖片,它們間還存在功能性鏈接,反映了領(lǐng)域能知識的邏輯組織。然而,現(xiàn)有數(shù)據(jù)集通常只提供預(yù)分割的語料庫,未涵蓋現(xiàn)實應(yīng)用復(fù)雜性,比如整合多格式數(shù)據(jù)和維護文檔間引用關(guān)系。

因此,建立全面的知識庫成為工業(yè)RAG應(yīng)用的重要基礎(chǔ)。我們建議構(gòu)建一個多層異構(gòu)圖形知識庫,其節(jié)點和邊代表不同元素(如文檔、章節(jié)、段落、圖表等)及其關(guān)系。這個圖由信息資源層、語料層和提煉知識層組成,每一層對應(yīng)信息處理的不同階段,象征著不同的知識粒度和抽象層次。

詳細設(shè)計

L0 知識庫構(gòu)建

所提出的RAG系統(tǒng)的基礎(chǔ)階段被指定為L0系統(tǒng),其重點在于構(gòu)建一個強大且全面的知識庫。這一階段對于在后續(xù)層級中實現(xiàn)有效的知識檢索至關(guān)重要。L0系統(tǒng)的主要目標是處理和結(jié)構(gòu)化領(lǐng)域特定文檔,將其轉(zhuǎn)換為機器可讀的格式,并將提取的知識組織成一個異構(gòu)圖。該圖作為所有高級推理和檢索任務(wù)的基礎(chǔ)。L0系統(tǒng)包含幾個關(guān)鍵模塊:文件解析、知識提取和知識存儲。每個模塊在確保知識庫既廣泛又準確反映源文檔中包含的底層信息方面發(fā)揮著至關(guān)重要的作用。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)

文檔解析

文件解析模塊負責(zé)處理各種類型的文件,這包括處理掃描文檔、圖像和復(fù)雜的表格等。為了保留多模態(tài)元素,框架采用布局分析技術(shù),并使用視覺語言模型來描述圖表內(nèi)容,以確保信息的完整性。

知識組織

知識庫被構(gòu)建為一個多層異質(zhì)圖,表示不同層次的信息粒度和抽象級別。該圖捕捉了數(shù)據(jù)各個組成部分(例如文檔、章節(jié)、塊、圖表和表格)之間的關(guān)系,并將它們組織成節(jié)點和邊,以反映它們的相互聯(lián)系和依賴關(guān)系。如下圖所示,這種多層結(jié)構(gòu)包括信息資源層、語料庫層和提煉知識層,能夠為下游任務(wù)提供語義理解和基于推理的檢索能力。

信息資源層:該層捕捉多樣化的信息源,將其視為源節(jié)點,并通過邊表示它們之間的引用關(guān)系。這種結(jié)構(gòu)有助于交叉引用和知識的情境化,為依賴于多源信息的推理奠定了基礎(chǔ)。

語料庫層:該層將解析后的信息組織成章節(jié)和塊,同時保留文檔的原始層次結(jié)構(gòu)。表格和圖表等多模態(tài)內(nèi)容由大語言模型(LLMs)進行總結(jié),并作為塊節(jié)點集成,確保多模態(tài)知識可用于檢索。該層支持不同粒度的知識提取,能夠?qū)崿F(xiàn)跨多種內(nèi)容類型的精確語義分塊和檢索。

提煉知識層:語料庫進一步被提煉為結(jié)構(gòu)化的知識形式(例如知識圖譜、原子知識和表格知識)。這一過程通過命名實體識別(NER)和關(guān)系提取等技術(shù)驅(qū)動,確保提煉的知識捕捉關(guān)鍵邏輯關(guān)系和實體,從而支持高級推理過程。通過將這種結(jié)構(gòu)化知識組織在提煉層中,我們增強了系統(tǒng)基于更深層次領(lǐng)域知識進行推理和綜合的能力。知識提煉過程如下圖所示。以下是典型知識形式的詳細提煉過程。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


L1: 事實性問題回答

在L0系統(tǒng)的基礎(chǔ)上,L1系統(tǒng)引入了知識檢索和知識組織,以實現(xiàn)其檢索和生成能力。這一級別的主要挑戰(zhàn)是語義對齊和分塊。大量的專業(yè)術(shù)語和別名可能會影響分塊檢索的準確性,而不合理的分塊可能會破壞語義連貫性并引入噪聲干擾。為了緩解這些問題,L1系統(tǒng)采用了更復(fù)雜的查詢分析技術(shù)和基本知識提取模塊。其架構(gòu)擴展為包含支持任務(wù)分解、協(xié)調(diào)以及知識組織(KO)初始階段的組件,確保系統(tǒng)能夠有效處理更復(fù)雜的查詢。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


增強分塊

在RAG系統(tǒng)中,分塊(Chunking)是將大量文本分解為更小、更易管理的片段的過程。常見的分塊策略包括固定大小分塊、語義分塊混合分塊。分塊不僅影響檢索的效率和準確性,還直接決定了RAG模型的整體表現(xiàn)。

在我們的系統(tǒng)中,每個分塊扮演雙重角色:

  1. 信息單元:被向量化并存儲在數(shù)據(jù)庫中,供檢索使用。
  2. 知識源:作為進一步知識提取和信息總結(jié)的基礎(chǔ)。

不恰當(dāng)?shù)姆謮K會導(dǎo)致文本向量缺失關(guān)鍵語義信息,甚至阻礙基于完整上下文的知識提取。為了解決這一問題,我們提出了一種文本分割算法,旨在通過保留上下文并為每個塊生成有效摘要,提升分塊效果。

算法核心:動態(tài)分塊與摘要生成
  1. 迭代分割:算法將文本逐步分割成塊,每次迭代生成初始塊的前向摘要,為后續(xù)塊的摘要生成提供上下文支持。
  2. 摘要生成:每個塊使用預(yù)定義的提示模板進行總結(jié),結(jié)合前向摘要和當(dāng)前塊內(nèi)容,確保敘述連貫。
  3. 動態(tài)調(diào)整:算法根據(jù)文本內(nèi)容和結(jié)構(gòu)動態(tài)調(diào)整塊大小,確保分塊效果最優(yōu)。

通過這一算法,RAG系統(tǒng)能夠更高效地處理復(fù)雜文本,為后續(xù)的知識提取和推理奠定堅實基礎(chǔ)。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


自動標注

在RAG的特定領(lǐng)域應(yīng)用中,如醫(yī)療問答,我們常面臨語言風(fēng)格差異挑戰(zhàn),即問題通常以口語化表述,而語料庫則采用專業(yè)術(shù)語。這可能影響檢索的準確性。為解決這一問題,我們設(shè)計了一個自動標記模塊,能有效縮小查詢和源文檔間的差距。

該模塊通過預(yù)處理語料庫,提取全面的領(lǐng)域特定標簽或制定標簽映射規(guī)則。在檢索前,我們從查詢中提取標簽,并利用已生成的標簽集合或標簽對集將其映射到語料庫領(lǐng)域,以提高召回率和精確率。

具體來說,我們利用大語言模型(LLMs)識別語料庫塊中的關(guān)鍵信息,總結(jié)并歸類為“標簽類”。我們?nèi)缓笊烧Z義標簽提取提示,以便更精準地提取標簽。當(dāng)只有語料庫可用時,我們使用這些提示讓LLMs從語料庫中提取標簽。有問答樣本可用時,我們同時對查詢和相應(yīng)的檢索答案塊進行標簽提取。利用這些提取的標簽,LLMs可以映射跨領(lǐng)域標簽并生成標簽對集合。

在建立好語料庫的標簽集合和標簽對集后,可以從查詢中提取標簽并在集合中識別相應(yīng)的映射標簽。這些映射標簽隨后用于增強信息檢索過程,提升召回率和精確率。這一流程利用了LLMs的高級理解和上下文能力以實現(xiàn)領(lǐng)域適應(yīng)性。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


多粒度檢索

L1系統(tǒng)是構(gòu)建在L0系統(tǒng)之上的,旨在實現(xiàn)跨異質(zhì)知識圖的多層次、多粒度檢索。這個知識圖的每一層(如信息源層、語料庫層、提煉知識層)代表了不同抽象層次和粒度的知識,使我們能從多個角度探索和獲取信息。

查詢可以映射到整個文檔或特定文本塊,以在正確的層次上找到所需知識。為實現(xiàn)此功能,系統(tǒng)會計算查詢與圖節(jié)點的相似度分數(shù),度量檢索知識的準確性。這些分數(shù)經(jīng)過各層傳播,聚合不同層次的信息。這種多層傳播允許我們根據(jù)全局和局部視角調(diào)整檢索結(jié)果。最終的相似度分數(shù)由聚合和傳播的組合得出,以平衡精確性和效率。

此外,檢索過程可進行迭代優(yōu)化,基于任務(wù)分解產(chǎn)生的子查詢可進一步提升生成答案的準確性和相關(guān)性。

我們以下圖為例來詳細說明:對于圖的每一層,查詢Q和圖節(jié)點都被轉(zhuǎn)換為高維向量嵌入以評估相似度。這個過程被表示為g(?),其中I、C和D分別代表信息源層、語料庫層和提煉知識層的節(jié)點集。傳播和聚合操作則由函數(shù)f(?)表示,最終的塊相似度分數(shù)S則通過聚合其他層和節(jié)點的分數(shù)得到。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


L2: 可鏈接推理問題回答

L2系統(tǒng)的核心功能在于其能夠高效檢索多個相關(guān)信息源并基于此進行復(fù)雜推理。為實現(xiàn)這一目標,L2系統(tǒng)集成了一個先進的知識提取模塊,全面識別并提取相關(guān)信息。此外,系統(tǒng)還實現(xiàn)了任務(wù)分解與協(xié)調(diào)模塊,將復(fù)雜任務(wù)分解為更小、更易管理的子任務(wù),從而提升系統(tǒng)處理任務(wù)的效率。

分塊文本包含多方面的信息,增加了檢索的復(fù)雜性。最近的研究集中于從分塊文本中提取三元組知識單元并構(gòu)建知識圖譜,以促進高效的信息檢索。然而,知識圖譜的構(gòu)建成本較高,且其內(nèi)在知識可能無法被完全挖掘。為了更好地呈現(xiàn)文檔中嵌入的知識,我們在知識提取階段提出將原始文檔原子化,這一過程我們稱為知識原子化。此外,工業(yè)任務(wù)通常需要多段知識,這隱含了對原始問題進行分解為多個順序或并行原子問題的能力需求。我們將此操作稱為任務(wù)分解。通過將提取的原子知識與原始分塊結(jié)合,我們構(gòu)建了一個原子化層次知識庫。每次分解任務(wù)時,層次知識庫都會提供可用知識的洞察,從而實現(xiàn)知識感知的任務(wù)分解。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)

知識原子化

我們認為,單個文檔塊通常包含多段知識。通常情況下,解決特定任務(wù)所需的信息僅代表整個知識的一個子集。因此,像傳統(tǒng)信息檢索那樣將這些知識片段整合在單個塊中,可能無法促進所需精確信息的高效檢索。為了使知識的粒度與任務(wù)解決過程中生成的查詢相匹配,我們提出了一種稱為知識原子化的方法。該方法利用大語言模型(LLMs)的上下文理解和內(nèi)容生成能力,自動為每個文檔塊中的原子知識片段打上標簽。需要注意的是,這些塊可以是原始參考文檔的片段、為表格、圖像、視頻生成的描述塊,甚至是整個章節(jié)或文檔的總結(jié)塊。

原子知識的呈現(xiàn)方式可以多種多樣。我們建議使用問題作為知識索引,而不是使用陳述句或主語-關(guān)系-賓語三元組,以進一步縮小存儲知識與查詢之間的差距。與語義標記過程不同,在知識原子化過程中,我們將文檔塊作為上下文輸入給LLM,要求其生成盡可能多的可以由給定塊回答的相關(guān)問題。這些生成的原子問題與給定塊一起保存為原子問題標簽。

知識感知的任務(wù)分解

任務(wù)分解模塊將復(fù)雜任務(wù)分解為更小的子任務(wù),以提高系統(tǒng)的處理效率。通過生成和評估原子問題提案,動態(tài)調(diào)整檢索和推理過程。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


知識感知任務(wù)分解器的訓(xùn)練

通過收集和訓(xùn)練數(shù)據(jù),使任務(wù)分解器能夠更好地理解和處理領(lǐng)域特定的知識。通過強化學(xué)習(xí)等方法,優(yōu)化任務(wù)分解和結(jié)果尋找過程。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


L3: 預(yù)測性問題回答

L3 專注于處理預(yù)測性問題,強調(diào)基于知識的預(yù)測能力。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)

在L3系統(tǒng)中,更加注重基于知識的預(yù)測能力,這需要有效的知識收集、組織以及構(gòu)建預(yù)測邏輯。為此,我們利用任務(wù)分解與協(xié)調(diào)模塊,基于從檢索知識中收集和組織的有序知識,構(gòu)建預(yù)測邏輯。L3系統(tǒng)的框架如上圖所示。為了確保檢索到的知識能夠為高級分析和預(yù)測做好準備,知識組織模塊增強了專門用于知識結(jié)構(gòu)化和組織的子模塊。這些子模塊簡化了將原始檢索知識轉(zhuǎn)化為結(jié)構(gòu)化、連貫格式的過程,從而優(yōu)化后續(xù)推理和預(yù)測任務(wù)。

鑒于大語言模型(LLMs)在應(yīng)用專業(yè)推理邏輯方面的局限性,其在預(yù)測任務(wù)中的有效性可能受到限制。為了克服這一問題,知識中心推理模塊增強了預(yù)測子模塊,使系統(tǒng)能夠基于輸入查詢和組織知識推斷結(jié)果。這一預(yù)測子模塊使系統(tǒng)不僅能夠基于歷史知識生成答案,還能進行預(yù)測,從而為復(fù)雜查詢提供更強大和動態(tài)的響應(yīng)。通過整合先進的知識結(jié)構(gòu)化和預(yù)測能力,L3系統(tǒng)能夠有效管理和利用更復(fù)雜和動態(tài)的知識庫。

L4: 創(chuàng)造性問題回答

L4 系統(tǒng)的實現(xiàn)特點在于集成了多智能體系統(tǒng),以促進多角度思考。解決創(chuàng)造性問題需要基于事實信息并理解基本原理和規(guī)則的創(chuàng)造性思維。在這個高級階段,主要挑戰(zhàn)包括從檢索到的知識中提取連貫的邏輯推理、在眾多影響因素中導(dǎo)航復(fù)雜的推理過程,以及評估對創(chuàng)造性、開放性問題的回答質(zhì)量。為了應(yīng)對這些挑戰(zhàn),系統(tǒng)協(xié)調(diào)多個智能體,每個智能體都貢獻獨特的見解和推理策略,如下所示。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)


這些智能體并行運作,綜合各種思維過程,生成全面且連貫的解決方案。這種多智能體架構(gòu)支持并行處理和整合不同的推理路徑,確保有效管理和應(yīng)對復(fù)雜查詢。通過模擬多樣化的觀點,L4 系統(tǒng)增強了處理創(chuàng)造性問題的能力,生成創(chuàng)新性想法而非預(yù)定義的解決方案。多個智能體的協(xié)調(diào)輸出不僅豐富了推理過程,還為用戶提供了全面的視角,促進創(chuàng)造性思維,并激發(fā)解決復(fù)雜問題的新穎方案。

測試結(jié)果

為了驗證我們提出方法的有效性,PIKE-RAG在開放域基準測試和特定領(lǐng)域基準測試上進行了實驗。

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)

從GraphRAG到PIKE-RAG,微軟發(fā)布復(fù)雜企業(yè)場景下的私域知識提取與推理新突破-AI.x社區(qū)



本文轉(zhuǎn)載自公眾號AI 博物院 作者:longyunfeigu

原文鏈接:??https://mp.weixin.qq.com/s/_WRlXG4-3KhyrnlMBnPs_Q??

?著作權(quán)歸作者所有,如需轉(zhuǎn)載,請注明出處,否則將追究法律責(zé)任
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦