自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

終于等到你!港大首發(fā)「輕量級(jí)RAG神器」MiniRAG,1.5B手機(jī)端可用

人工智能 新聞
還在為部署RAG系統(tǒng)的龐大體積和高性能門檻困擾嗎?港大黃超教授團(tuán)隊(duì)最新推出的輕量級(jí)MiniRAG框架很好地解決了這一問(wèn)題。通過(guò)優(yōu)化架構(gòu)設(shè)計(jì),MiniRAG使得1.5B級(jí)別的小模型也能高效完成RAG任務(wù),為端側(cè)AI部署提供了更多可能性。

傳統(tǒng)RAG架構(gòu)主要依賴大型語(yǔ)言模型(LLMs)的強(qiáng)大能力,但這種設(shè)計(jì)難以適應(yīng)小型語(yǔ)言模型(SLMs)的固有局限,特別是在復(fù)雜查詢理解、多步推理、語(yǔ)義匹配和信息合成等關(guān)鍵環(huán)節(jié)。

為此,MiniRAG重新設(shè)計(jì)了信息檢索和生成流程,以極簡(jiǎn)和高效為核心原則,通過(guò)創(chuàng)新的輕量級(jí)架構(gòu)設(shè)計(jì),成功實(shí)現(xiàn)了一個(gè)高效的知識(shí)增強(qiáng)系統(tǒng),無(wú)需依賴大型語(yǔ)言模型,在保證性能表現(xiàn)的同時(shí)有效保護(hù)用戶數(shù)據(jù)隱私。

圖片

主要設(shè)計(jì)思路基于對(duì)小型語(yǔ)言模型的三個(gè)關(guān)鍵發(fā)現(xiàn):

  1. 雖然在復(fù)雜語(yǔ)義理解上存在局限,但在模式匹配和局部文本處理方面表現(xiàn)優(yōu)異
  2. 通過(guò)引入顯式結(jié)構(gòu)信息,可有效彌補(bǔ)有限的語(yǔ)義理解能力
  3. 將復(fù)雜RAG任務(wù)分解為簡(jiǎn)單明確的子任務(wù),可在不依賴高級(jí)推理能力的情況下保持系統(tǒng)穩(wěn)定性

基于以上認(rèn)知,MiniRAG提出了兩個(gè)核心創(chuàng)新組件:異構(gòu)圖索引和輕量級(jí)基于圖的知識(shí)檢索,以實(shí)現(xiàn)高效精準(zhǔn)的信息檢索。

圖片

項(xiàng)目鏈接: https://github.com/HKUDS/MiniRAG

實(shí)驗(yàn)室主頁(yè): https://github.com/HKUDS

為了更好地評(píng)估MiniRAG在實(shí)際應(yīng)用場(chǎng)景中的表現(xiàn),研究團(tuán)隊(duì)同時(shí)推出了專門面向端側(cè)環(huán)境的評(píng)測(cè)數(shù)據(jù)集——LiHua-World。該數(shù)據(jù)集通過(guò)模擬真實(shí)的個(gè)人數(shù)據(jù),全面覆蓋了端側(cè)場(chǎng)景下常見(jiàn)的信息檢索和知識(shí)增強(qiáng)需求。

圖片

實(shí)驗(yàn)結(jié)果顯示,當(dāng)將大型語(yǔ)言模型(LLM)替換為小型語(yǔ)言模型(SLM)時(shí),各框架表現(xiàn)差異顯著:GraphRAG則因無(wú)法保證生成質(zhì)量而完全失效,LightRAG的性能斷崖式下降(最高降幅達(dá)45.43%)。

相比之下,MiniRAG展現(xiàn)出優(yōu)秀的穩(wěn)定性——性能降幅最大僅為21.26%,最小僅0.79%。更值得注意的是,MiniRAG僅使用了約1/4的存儲(chǔ)空間,便實(shí)現(xiàn)了這一出色表現(xiàn)。

MiniRAG框架設(shè)計(jì)

語(yǔ)義感知異構(gòu)圖索引

為應(yīng)對(duì)端側(cè)RAG的特殊挑戰(zhàn),MiniRAG提出了語(yǔ)義感知異構(gòu)圖索引機(jī)制。該機(jī)制通過(guò)系統(tǒng)性地整合文本塊和命名實(shí)體,構(gòu)建了一個(gè)富有層次的語(yǔ)義網(wǎng)絡(luò),實(shí)現(xiàn)高效精準(zhǔn)的信息檢索。具體而言,異構(gòu)圖包含兩類核心節(jié)點(diǎn):

實(shí)體節(jié)點(diǎn):包含從文本中提取的關(guān)鍵語(yǔ)義元素,如事件、地點(diǎn)、時(shí)間以及特定領(lǐng)域概念

文本塊節(jié)點(diǎn):保持原始文本的連貫性和完整上下文信息

這種雙層節(jié)點(diǎn)結(jié)構(gòu)設(shè)計(jì)使文本塊能在檢索階段直接參與匹配,有效確保檢索結(jié)果的相關(guān)性和準(zhǔn)確性。同時(shí),該方法也巧妙規(guī)避了小型語(yǔ)言模型在文本總結(jié)能力上的局限,最大程度減少信息失真。

輕量級(jí)知識(shí)檢索

考慮到端側(cè)RAG系統(tǒng)在計(jì)算能力和數(shù)據(jù)隱私方面的限制,無(wú)法使用大型語(yǔ)言模型和復(fù)雜文本嵌入模型。為此,MiniRAG設(shè)計(jì)了創(chuàng)新的圖式知識(shí)檢索機(jī)制,通過(guò)結(jié)合語(yǔ)義感知異構(gòu)圖和輕量級(jí)文本嵌入,實(shí)現(xiàn)高效精準(zhǔn)的知識(shí)獲取。

該檢索機(jī)制包含兩個(gè)核心設(shè)計(jì):

查詢語(yǔ)義映射在檢索階段,系統(tǒng)需要準(zhǔn)確識(shí)別查詢相關(guān)的文本元素,以支持模型生成精確響應(yīng)。MiniRAG充分利用小型語(yǔ)言模型在實(shí)體提取方面的優(yōu)勢(shì),通過(guò)簡(jiǎn)化的查詢解析流程,將用戶查詢高效映射到圖索引結(jié)構(gòu)中。

拓?fù)湓鰪?qiáng)檢索采用兩階段檢索策略,首先基于嵌入相似度確定初始種子實(shí)體,再利用異構(gòu)圖的拓?fù)浣Y(jié)構(gòu),沿著相關(guān)推理路徑發(fā)現(xiàn)更多相關(guān)信息。

模擬真實(shí)端側(cè)場(chǎng)景的評(píng)測(cè)數(shù)據(jù)集: 假如你是LiHua...

圖片

針對(duì)現(xiàn)有端側(cè)RAG評(píng)測(cè)數(shù)據(jù)集的局限,研究團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了LiHua-World數(shù)據(jù)集。該數(shù)據(jù)集通過(guò)模擬虛擬用戶「李華」一年的日常通訊記錄,真實(shí)還原了端側(cè)檢索增強(qiáng)生成的應(yīng)用場(chǎng)景。

數(shù)據(jù)集特點(diǎn):

  1. 全面覆蓋單跳查詢、多跳推理和信息總結(jié)等多類型問(wèn)題;
  2. 提供專業(yè)人工標(biāo)注的標(biāo)準(zhǔn)答案和支持文檔;
  3. 內(nèi)容涵蓋社交互動(dòng)、健身訓(xùn)練、娛樂(lè)活動(dòng)、生活事務(wù)等日常場(chǎng)景;
  4. 特別適配端側(cè)RAG系統(tǒng)的評(píng)測(cè)需求;

實(shí)驗(yàn)評(píng)估與分析

為全面驗(yàn)證MiniRAG在端側(cè)RAG場(chǎng)景下與小型語(yǔ)言模型結(jié)合的優(yōu)勢(shì),研究團(tuán)隊(duì)設(shè)計(jì)了系統(tǒng)化的評(píng)估方案,重點(diǎn)聚焦以下三個(gè)核心維度:

  1. 系統(tǒng)性能對(duì)比:通過(guò)與當(dāng)前主流RAG系統(tǒng)的對(duì)比實(shí)驗(yàn),全面評(píng)估MiniRAG在檢索準(zhǔn)確率、計(jì)算效率和資源消耗等關(guān)鍵指標(biāo)上的表現(xiàn)
  2. 組件效果分析:深入研究MiniRAG核心組件的性能貢獻(xiàn),包括語(yǔ)義感知異構(gòu)圖索引機(jī)制的檢索效果、輕量級(jí)檢索策略的計(jì)算開(kāi)銷,以及各模塊間的協(xié)同效應(yīng)
  3. 實(shí)際場(chǎng)景案例研究:選取多個(gè)具有代表性的應(yīng)用場(chǎng)景,重點(diǎn)驗(yàn)證系統(tǒng)在處理多步推理、復(fù)雜查詢等高挑戰(zhàn)任務(wù)時(shí)的實(shí)際表現(xiàn)。通過(guò)詳實(shí)的案例分析,展示MiniRAG在真實(shí)應(yīng)用環(huán)境中的優(yōu)勢(shì)與潛力。

圖片

系統(tǒng)性能對(duì)比

現(xiàn)有RAG系統(tǒng)的局限性

實(shí)驗(yàn)結(jié)果表明,現(xiàn)有RAG系統(tǒng)在遷移至小型語(yǔ)言模型(SLMs)時(shí)存在嚴(yán)重的性能瓶頸。具體而言,LightRAG的整體性能顯著下降(降幅達(dá)45.43%),而GraphRAG在小模型場(chǎng)景下甚至無(wú)法維持基本的生成能力。這些問(wèn)題充分暴露了傳統(tǒng)RAG架構(gòu)對(duì)大型語(yǔ)言模型的深度依賴。

MiniRAG的創(chuàng)新突破

相比之下,MiniRAG通過(guò)雙節(jié)點(diǎn)異構(gòu)圖索引結(jié)構(gòu)和拓?fù)湓鰪?qiáng)檢索機(jī)制,有效降低了對(duì)模型能力的依賴。實(shí)驗(yàn)數(shù)據(jù)顯示,在遷移至小型語(yǔ)言模型時(shí),MiniRAG的性能損失得到顯著控制 - 最大降幅僅為21.26%,最小降幅更是低至0.79%,展現(xiàn)出優(yōu)異的模型適應(yīng)性。

圖片

MiniRAG顯著的存儲(chǔ)優(yōu)化

實(shí)驗(yàn)評(píng)估顯示,MiniRAG在存儲(chǔ)效率優(yōu)化方面取得了突破性進(jìn)展。與采用gpt-4-mini的LightRAG基線系統(tǒng)相比,MiniRAG僅需25%的存儲(chǔ)空間即可達(dá)到相當(dāng)?shù)男阅芩?。這種在大幅降低存儲(chǔ)需求(節(jié)省75%)的同時(shí)還能保持高檢索準(zhǔn)確率的特性,不僅展現(xiàn)了MiniRAG在系統(tǒng)架構(gòu)設(shè)計(jì)上的創(chuàng)新,更為資源受限場(chǎng)景下的RAG應(yīng)用開(kāi)辟了新的可能性。

組件效果分析

為全面評(píng)估MiniRAG各組件的性能貢獻(xiàn),研究團(tuán)隊(duì)設(shè)計(jì)了兩組系統(tǒng)化的消融實(shí)驗(yàn)。第一組實(shí)驗(yàn)(-I)將MiniRAG的異構(gòu)圖索引替換為傳統(tǒng)的基于描述的索引方法,該方法與LightRAG和GraphRAG相似,主要依賴模型的語(yǔ)義理解能力來(lái)生成實(shí)體與關(guān)系描述。

第二組實(shí)驗(yàn)(-Ri)通過(guò)在圖檢索過(guò)程中選擇性停用特定功能模塊,以量化分析各模塊對(duì)系統(tǒng)整體表現(xiàn)的影響。這一嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)框架使我們能夠精確評(píng)估每個(gè)創(chuàng)新組件的實(shí)際貢獻(xiàn)。

圖片

基于小語(yǔ)言模型RAG的挑戰(zhàn)

消融實(shí)驗(yàn)結(jié)果明確顯示,當(dāng)使用傳統(tǒng)的文本語(yǔ)義驅(qū)動(dòng)索引技術(shù)(-II)替代MiniRAG的索引方法時(shí),系統(tǒng)性能出現(xiàn)顯著下降。這一發(fā)現(xiàn)有力驗(yàn)證了研究團(tuán)隊(duì)的初始假設(shè):小型語(yǔ)言模型(SLMs)在復(fù)雜知識(shí)圖譜生成和全面語(yǔ)義理解等方面存在固有局限。

Reasoning Path Discovery的有效性

結(jié)構(gòu)組件的關(guān)鍵性通過(guò)實(shí)驗(yàn)得到充分證實(shí)。無(wú)論是移除邊信息(-RedgeRedge)還是塊節(jié)點(diǎn)(-RchunkRchunk),都會(huì)導(dǎo)致系統(tǒng)性能明顯下降。這些組件展現(xiàn)出雙重價(jià)值:既通過(guò)查詢引導(dǎo)的推理路徑發(fā)現(xiàn)優(yōu)化了查詢匹配效果,又在數(shù)據(jù)索引階段有效彌補(bǔ)了SLMs的能力限制。

實(shí)際場(chǎng)景案例研究

圖片

MiniRAG通過(guò)一個(gè)復(fù)雜的餐廳識(shí)別案例,有力展示了其在實(shí)際應(yīng)用中的卓越性能,特別是在處理多約束查詢和克服小型語(yǔ)言模型局限性方面的優(yōu)勢(shì)。

挑戰(zhàn):復(fù)雜查詢解析的困境

研究團(tuán)隊(duì)選取了一個(gè)具有挑戰(zhàn)性的測(cè)試案例,查詢內(nèi)容為:Wolfgang和Li Hua為慶祝Wolfgang升職而共進(jìn)晚餐的那家意大利餐廳叫什么名字?這一查詢涉及多重約束條件,要求系統(tǒng)能從在線聊天數(shù)據(jù)中準(zhǔn)確識(shí)別特定意大利餐廳及其相關(guān)上下文。盡管LightRAG采用了phi-3.5-mini-instruct模型,但受限于小型語(yǔ)言模型的固有局限性,特別是在提取high-level信息和處理圖索引噪聲方面的不足,導(dǎo)致其檢索效果不夠理想。

MiniRAG:創(chuàng)新的知識(shí)發(fā)現(xiàn)機(jī)制

MiniRAG通過(guò)其獨(dú)特的查詢引導(dǎo)推理路徑發(fā)現(xiàn)機(jī)制成功應(yīng)對(duì)了上述挑戰(zhàn)。系統(tǒng)利用異構(gòu)圖索引結(jié)構(gòu),首先預(yù)測(cè)答案類型(如「社交互動(dòng)」或「地點(diǎn)」),然后通過(guò)策略性分解查詢要素(專注于「意大利場(chǎng)所」和「餐廳」語(yǔ)境),結(jié)合目標(biāo)實(shí)體匹配,實(shí)現(xiàn)了精確且具有上下文關(guān)聯(lián)的知識(shí)檢索。這種結(jié)構(gòu)化推理方法使MiniRAG能夠精確導(dǎo)航知識(shí)空間,最終成功定位目標(biāo)餐廳——Venedia Grancaffe。

結(jié)論

MiniRAG作為一種創(chuàng)新的檢索增強(qiáng)生成系統(tǒng),成功突破了小型語(yǔ)言模型(SLMs)在傳統(tǒng)RAG框架中的應(yīng)用瓶頸。

系統(tǒng)通過(guò)創(chuàng)新的異構(gòu)圖索引架構(gòu)和輕量級(jí)啟發(fā)式檢索機(jī)制,有效融合了文本與圖式RAG方法的優(yōu)勢(shì),同時(shí)顯著降低了對(duì)語(yǔ)言模型能力的依賴。

實(shí)驗(yàn)驗(yàn)證表明,即使采用SLMs,MiniRAG仍能達(dá)到與大語(yǔ)言模型方案相當(dāng)?shù)男阅芩?。為推?dòng)設(shè)備端RAG技術(shù)發(fā)展,研究團(tuán)隊(duì)還發(fā)布了首個(gè)針對(duì)性評(píng)估基準(zhǔn)數(shù)據(jù)集,特別關(guān)注個(gè)人通信場(chǎng)景和多約束查詢等實(shí)際應(yīng)用場(chǎng)景。

這些創(chuàng)新不僅標(biāo)志著設(shè)備端RAG系統(tǒng)研究的重要進(jìn)展,更為保護(hù)用戶隱私、提升資源效率的邊緣AI應(yīng)用開(kāi)辟了新的發(fā)展方向。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2017-09-14 16:28:45

中安威士

2025-01-23 17:00:00

模型算力數(shù)據(jù)

2016-04-10 14:30:56

NETGEAR/ARL

2015-07-30 22:57:02

華為公有云/云計(jì)算

2018-08-21 16:58:24

匯智能通

2020-10-22 11:15:20

微軟Linux瀏覽器

2020-03-10 19:05:29

騰訊微信安卓

2021-06-30 14:44:13

鴻蒙HarmonyOS應(yīng)用

2016-12-14 09:50:28

2025-04-07 02:25:00

DeepSeek模型訓(xùn)練GRPO

2024-03-29 00:00:00

JSAPI網(wǎng)絡(luò)

2024-02-26 00:00:00

RAGGeminiLLM

2012-07-18 10:09:55

輕量級(jí)移動(dòng)客戶端開(kāi)發(fā)類庫(kù)

2024-10-14 14:45:00

數(shù)據(jù)模型

2025-02-06 08:06:05

2009-07-14 18:05:28

輕量級(jí)Swing組件

2009-07-17 14:38:51

輕量級(jí)Swing組件

2025-02-11 16:17:42

2019-05-07 14:42:03

深度學(xué)習(xí)編程人工智能

2011-12-22 11:02:04

輕量級(jí)Linux
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)