終于等到你!港大首發(fā)「輕量級(jí)RAG神器」MiniRAG,1.5B手機(jī)端可用
傳統(tǒng)RAG架構(gòu)主要依賴大型語(yǔ)言模型(LLMs)的強(qiáng)大能力,但這種設(shè)計(jì)難以適應(yīng)小型語(yǔ)言模型(SLMs)的固有局限,特別是在復(fù)雜查詢理解、多步推理、語(yǔ)義匹配和信息合成等關(guān)鍵環(huán)節(jié)。
為此,MiniRAG重新設(shè)計(jì)了信息檢索和生成流程,以極簡(jiǎn)和高效為核心原則,通過(guò)創(chuàng)新的輕量級(jí)架構(gòu)設(shè)計(jì),成功實(shí)現(xiàn)了一個(gè)高效的知識(shí)增強(qiáng)系統(tǒng),無(wú)需依賴大型語(yǔ)言模型,在保證性能表現(xiàn)的同時(shí)有效保護(hù)用戶數(shù)據(jù)隱私。
主要設(shè)計(jì)思路基于對(duì)小型語(yǔ)言模型的三個(gè)關(guān)鍵發(fā)現(xiàn):
- 雖然在復(fù)雜語(yǔ)義理解上存在局限,但在模式匹配和局部文本處理方面表現(xiàn)優(yōu)異
- 通過(guò)引入顯式結(jié)構(gòu)信息,可有效彌補(bǔ)有限的語(yǔ)義理解能力
- 將復(fù)雜RAG任務(wù)分解為簡(jiǎn)單明確的子任務(wù),可在不依賴高級(jí)推理能力的情況下保持系統(tǒng)穩(wěn)定性
基于以上認(rèn)知,MiniRAG提出了兩個(gè)核心創(chuàng)新組件:異構(gòu)圖索引和輕量級(jí)基于圖的知識(shí)檢索,以實(shí)現(xiàn)高效精準(zhǔn)的信息檢索。
項(xiàng)目鏈接: https://github.com/HKUDS/MiniRAG
實(shí)驗(yàn)室主頁(yè): https://github.com/HKUDS
為了更好地評(píng)估MiniRAG在實(shí)際應(yīng)用場(chǎng)景中的表現(xiàn),研究團(tuán)隊(duì)同時(shí)推出了專門面向端側(cè)環(huán)境的評(píng)測(cè)數(shù)據(jù)集——LiHua-World。該數(shù)據(jù)集通過(guò)模擬真實(shí)的個(gè)人數(shù)據(jù),全面覆蓋了端側(cè)場(chǎng)景下常見(jiàn)的信息檢索和知識(shí)增強(qiáng)需求。
實(shí)驗(yàn)結(jié)果顯示,當(dāng)將大型語(yǔ)言模型(LLM)替換為小型語(yǔ)言模型(SLM)時(shí),各框架表現(xiàn)差異顯著:GraphRAG則因無(wú)法保證生成質(zhì)量而完全失效,LightRAG的性能斷崖式下降(最高降幅達(dá)45.43%)。
相比之下,MiniRAG展現(xiàn)出優(yōu)秀的穩(wěn)定性——性能降幅最大僅為21.26%,最小僅0.79%。更值得注意的是,MiniRAG僅使用了約1/4的存儲(chǔ)空間,便實(shí)現(xiàn)了這一出色表現(xiàn)。
MiniRAG框架設(shè)計(jì)
語(yǔ)義感知異構(gòu)圖索引
為應(yīng)對(duì)端側(cè)RAG的特殊挑戰(zhàn),MiniRAG提出了語(yǔ)義感知異構(gòu)圖索引機(jī)制。該機(jī)制通過(guò)系統(tǒng)性地整合文本塊和命名實(shí)體,構(gòu)建了一個(gè)富有層次的語(yǔ)義網(wǎng)絡(luò),實(shí)現(xiàn)高效精準(zhǔn)的信息檢索。具體而言,異構(gòu)圖包含兩類核心節(jié)點(diǎn):
實(shí)體節(jié)點(diǎn):包含從文本中提取的關(guān)鍵語(yǔ)義元素,如事件、地點(diǎn)、時(shí)間以及特定領(lǐng)域概念
文本塊節(jié)點(diǎn):保持原始文本的連貫性和完整上下文信息
這種雙層節(jié)點(diǎn)結(jié)構(gòu)設(shè)計(jì)使文本塊能在檢索階段直接參與匹配,有效確保檢索結(jié)果的相關(guān)性和準(zhǔn)確性。同時(shí),該方法也巧妙規(guī)避了小型語(yǔ)言模型在文本總結(jié)能力上的局限,最大程度減少信息失真。
輕量級(jí)知識(shí)檢索
考慮到端側(cè)RAG系統(tǒng)在計(jì)算能力和數(shù)據(jù)隱私方面的限制,無(wú)法使用大型語(yǔ)言模型和復(fù)雜文本嵌入模型。為此,MiniRAG設(shè)計(jì)了創(chuàng)新的圖式知識(shí)檢索機(jī)制,通過(guò)結(jié)合語(yǔ)義感知異構(gòu)圖和輕量級(jí)文本嵌入,實(shí)現(xiàn)高效精準(zhǔn)的知識(shí)獲取。
該檢索機(jī)制包含兩個(gè)核心設(shè)計(jì):
查詢語(yǔ)義映射在檢索階段,系統(tǒng)需要準(zhǔn)確識(shí)別查詢相關(guān)的文本元素,以支持模型生成精確響應(yīng)。MiniRAG充分利用小型語(yǔ)言模型在實(shí)體提取方面的優(yōu)勢(shì),通過(guò)簡(jiǎn)化的查詢解析流程,將用戶查詢高效映射到圖索引結(jié)構(gòu)中。
拓?fù)湓鰪?qiáng)檢索采用兩階段檢索策略,首先基于嵌入相似度確定初始種子實(shí)體,再利用異構(gòu)圖的拓?fù)浣Y(jié)構(gòu),沿著相關(guān)推理路徑發(fā)現(xiàn)更多相關(guān)信息。
模擬真實(shí)端側(cè)場(chǎng)景的評(píng)測(cè)數(shù)據(jù)集: 假如你是LiHua...
針對(duì)現(xiàn)有端側(cè)RAG評(píng)測(cè)數(shù)據(jù)集的局限,研究團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了LiHua-World數(shù)據(jù)集。該數(shù)據(jù)集通過(guò)模擬虛擬用戶「李華」一年的日常通訊記錄,真實(shí)還原了端側(cè)檢索增強(qiáng)生成的應(yīng)用場(chǎng)景。
數(shù)據(jù)集特點(diǎn):
- 全面覆蓋單跳查詢、多跳推理和信息總結(jié)等多類型問(wèn)題;
- 提供專業(yè)人工標(biāo)注的標(biāo)準(zhǔn)答案和支持文檔;
- 內(nèi)容涵蓋社交互動(dòng)、健身訓(xùn)練、娛樂(lè)活動(dòng)、生活事務(wù)等日常場(chǎng)景;
- 特別適配端側(cè)RAG系統(tǒng)的評(píng)測(cè)需求;
實(shí)驗(yàn)評(píng)估與分析
為全面驗(yàn)證MiniRAG在端側(cè)RAG場(chǎng)景下與小型語(yǔ)言模型結(jié)合的優(yōu)勢(shì),研究團(tuán)隊(duì)設(shè)計(jì)了系統(tǒng)化的評(píng)估方案,重點(diǎn)聚焦以下三個(gè)核心維度:
- 系統(tǒng)性能對(duì)比:通過(guò)與當(dāng)前主流RAG系統(tǒng)的對(duì)比實(shí)驗(yàn),全面評(píng)估MiniRAG在檢索準(zhǔn)確率、計(jì)算效率和資源消耗等關(guān)鍵指標(biāo)上的表現(xiàn)
- 組件效果分析:深入研究MiniRAG核心組件的性能貢獻(xiàn),包括語(yǔ)義感知異構(gòu)圖索引機(jī)制的檢索效果、輕量級(jí)檢索策略的計(jì)算開(kāi)銷,以及各模塊間的協(xié)同效應(yīng)
- 實(shí)際場(chǎng)景案例研究:選取多個(gè)具有代表性的應(yīng)用場(chǎng)景,重點(diǎn)驗(yàn)證系統(tǒng)在處理多步推理、復(fù)雜查詢等高挑戰(zhàn)任務(wù)時(shí)的實(shí)際表現(xiàn)。通過(guò)詳實(shí)的案例分析,展示MiniRAG在真實(shí)應(yīng)用環(huán)境中的優(yōu)勢(shì)與潛力。
系統(tǒng)性能對(duì)比
現(xiàn)有RAG系統(tǒng)的局限性
實(shí)驗(yàn)結(jié)果表明,現(xiàn)有RAG系統(tǒng)在遷移至小型語(yǔ)言模型(SLMs)時(shí)存在嚴(yán)重的性能瓶頸。具體而言,LightRAG的整體性能顯著下降(降幅達(dá)45.43%),而GraphRAG在小模型場(chǎng)景下甚至無(wú)法維持基本的生成能力。這些問(wèn)題充分暴露了傳統(tǒng)RAG架構(gòu)對(duì)大型語(yǔ)言模型的深度依賴。
MiniRAG的創(chuàng)新突破
相比之下,MiniRAG通過(guò)雙節(jié)點(diǎn)異構(gòu)圖索引結(jié)構(gòu)和拓?fù)湓鰪?qiáng)檢索機(jī)制,有效降低了對(duì)模型能力的依賴。實(shí)驗(yàn)數(shù)據(jù)顯示,在遷移至小型語(yǔ)言模型時(shí),MiniRAG的性能損失得到顯著控制 - 最大降幅僅為21.26%,最小降幅更是低至0.79%,展現(xiàn)出優(yōu)異的模型適應(yīng)性。
MiniRAG顯著的存儲(chǔ)優(yōu)化
實(shí)驗(yàn)評(píng)估顯示,MiniRAG在存儲(chǔ)效率優(yōu)化方面取得了突破性進(jìn)展。與采用gpt-4-mini的LightRAG基線系統(tǒng)相比,MiniRAG僅需25%的存儲(chǔ)空間即可達(dá)到相當(dāng)?shù)男阅芩?。這種在大幅降低存儲(chǔ)需求(節(jié)省75%)的同時(shí)還能保持高檢索準(zhǔn)確率的特性,不僅展現(xiàn)了MiniRAG在系統(tǒng)架構(gòu)設(shè)計(jì)上的創(chuàng)新,更為資源受限場(chǎng)景下的RAG應(yīng)用開(kāi)辟了新的可能性。
組件效果分析
為全面評(píng)估MiniRAG各組件的性能貢獻(xiàn),研究團(tuán)隊(duì)設(shè)計(jì)了兩組系統(tǒng)化的消融實(shí)驗(yàn)。第一組實(shí)驗(yàn)(-I)將MiniRAG的異構(gòu)圖索引替換為傳統(tǒng)的基于描述的索引方法,該方法與LightRAG和GraphRAG相似,主要依賴模型的語(yǔ)義理解能力來(lái)生成實(shí)體與關(guān)系描述。
第二組實(shí)驗(yàn)(-Ri)通過(guò)在圖檢索過(guò)程中選擇性停用特定功能模塊,以量化分析各模塊對(duì)系統(tǒng)整體表現(xiàn)的影響。這一嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)框架使我們能夠精確評(píng)估每個(gè)創(chuàng)新組件的實(shí)際貢獻(xiàn)。
基于小語(yǔ)言模型RAG的挑戰(zhàn)
消融實(shí)驗(yàn)結(jié)果明確顯示,當(dāng)使用傳統(tǒng)的文本語(yǔ)義驅(qū)動(dòng)索引技術(shù)(-II)替代MiniRAG的索引方法時(shí),系統(tǒng)性能出現(xiàn)顯著下降。這一發(fā)現(xiàn)有力驗(yàn)證了研究團(tuán)隊(duì)的初始假設(shè):小型語(yǔ)言模型(SLMs)在復(fù)雜知識(shí)圖譜生成和全面語(yǔ)義理解等方面存在固有局限。
Reasoning Path Discovery的有效性
結(jié)構(gòu)組件的關(guān)鍵性通過(guò)實(shí)驗(yàn)得到充分證實(shí)。無(wú)論是移除邊信息(-RedgeRedge)還是塊節(jié)點(diǎn)(-RchunkRchunk),都會(huì)導(dǎo)致系統(tǒng)性能明顯下降。這些組件展現(xiàn)出雙重價(jià)值:既通過(guò)查詢引導(dǎo)的推理路徑發(fā)現(xiàn)優(yōu)化了查詢匹配效果,又在數(shù)據(jù)索引階段有效彌補(bǔ)了SLMs的能力限制。
實(shí)際場(chǎng)景案例研究
MiniRAG通過(guò)一個(gè)復(fù)雜的餐廳識(shí)別案例,有力展示了其在實(shí)際應(yīng)用中的卓越性能,特別是在處理多約束查詢和克服小型語(yǔ)言模型局限性方面的優(yōu)勢(shì)。
挑戰(zhàn):復(fù)雜查詢解析的困境
研究團(tuán)隊(duì)選取了一個(gè)具有挑戰(zhàn)性的測(cè)試案例,查詢內(nèi)容為:Wolfgang和Li Hua為慶祝Wolfgang升職而共進(jìn)晚餐的那家意大利餐廳叫什么名字?這一查詢涉及多重約束條件,要求系統(tǒng)能從在線聊天數(shù)據(jù)中準(zhǔn)確識(shí)別特定意大利餐廳及其相關(guān)上下文。盡管LightRAG采用了phi-3.5-mini-instruct模型,但受限于小型語(yǔ)言模型的固有局限性,特別是在提取high-level信息和處理圖索引噪聲方面的不足,導(dǎo)致其檢索效果不夠理想。
MiniRAG:創(chuàng)新的知識(shí)發(fā)現(xiàn)機(jī)制
MiniRAG通過(guò)其獨(dú)特的查詢引導(dǎo)推理路徑發(fā)現(xiàn)機(jī)制成功應(yīng)對(duì)了上述挑戰(zhàn)。系統(tǒng)利用異構(gòu)圖索引結(jié)構(gòu),首先預(yù)測(cè)答案類型(如「社交互動(dòng)」或「地點(diǎn)」),然后通過(guò)策略性分解查詢要素(專注于「意大利場(chǎng)所」和「餐廳」語(yǔ)境),結(jié)合目標(biāo)實(shí)體匹配,實(shí)現(xiàn)了精確且具有上下文關(guān)聯(lián)的知識(shí)檢索。這種結(jié)構(gòu)化推理方法使MiniRAG能夠精確導(dǎo)航知識(shí)空間,最終成功定位目標(biāo)餐廳——Venedia Grancaffe。
結(jié)論
MiniRAG作為一種創(chuàng)新的檢索增強(qiáng)生成系統(tǒng),成功突破了小型語(yǔ)言模型(SLMs)在傳統(tǒng)RAG框架中的應(yīng)用瓶頸。
系統(tǒng)通過(guò)創(chuàng)新的異構(gòu)圖索引架構(gòu)和輕量級(jí)啟發(fā)式檢索機(jī)制,有效融合了文本與圖式RAG方法的優(yōu)勢(shì),同時(shí)顯著降低了對(duì)語(yǔ)言模型能力的依賴。
實(shí)驗(yàn)驗(yàn)證表明,即使采用SLMs,MiniRAG仍能達(dá)到與大語(yǔ)言模型方案相當(dāng)?shù)男阅芩?。為推?dòng)設(shè)備端RAG技術(shù)發(fā)展,研究團(tuán)隊(duì)還發(fā)布了首個(gè)針對(duì)性評(píng)估基準(zhǔn)數(shù)據(jù)集,特別關(guān)注個(gè)人通信場(chǎng)景和多約束查詢等實(shí)際應(yīng)用場(chǎng)景。
這些創(chuàng)新不僅標(biāo)志著設(shè)備端RAG系統(tǒng)研究的重要進(jìn)展,更為保護(hù)用戶隱私、提升資源效率的邊緣AI應(yīng)用開(kāi)辟了新的發(fā)展方向。