自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

終于等到你！港大首發(fā)「輕量級(jí)RAG神器」MiniRAG，1.5B手機(jī)端可用

作者：新智元 2025-01-16 14:38:10

人工智能新聞

還在為部署RAG系統(tǒng)的龐大體積和高性能門檻困擾嗎？港大黃超教授團(tuán)隊(duì)最新推出的輕量級(jí)MiniRAG框架很好地解決了這一問(wèn)題。通過(guò)優(yōu)化架構(gòu)設(shè)計(jì)，MiniRAG使得1.5B級(jí)別的小模型也能高效完成RAG任務(wù)，為端側(cè)AI部署提供了更多可能性。

傳統(tǒng)RAG架構(gòu)主要依賴大型語(yǔ)言模型(LLMs)的強(qiáng)大能力，但這種設(shè)計(jì)難以適應(yīng)小型語(yǔ)言模型(SLMs)的固有局限，特別是在復(fù)雜查詢理解、多步推理、語(yǔ)義匹配和信息合成等關(guān)鍵環(huán)節(jié)。

為此，MiniRAG重新設(shè)計(jì)了信息檢索和生成流程，以極簡(jiǎn)和高效為核心原則，通過(guò)創(chuàng)新的輕量級(jí)架構(gòu)設(shè)計(jì)，成功實(shí)現(xiàn)了一個(gè)高效的知識(shí)增強(qiáng)系統(tǒng)，無(wú)需依賴大型語(yǔ)言模型，在保證性能表現(xiàn)的同時(shí)有效保護(hù)用戶數(shù)據(jù)隱私。

主要設(shè)計(jì)思路基于對(duì)小型語(yǔ)言模型的三個(gè)關(guān)鍵發(fā)現(xiàn)：

雖然在復(fù)雜語(yǔ)義理解上存在局限，但在模式匹配和局部文本處理方面表現(xiàn)優(yōu)異
通過(guò)引入顯式結(jié)構(gòu)信息，可有效彌補(bǔ)有限的語(yǔ)義理解能力
將復(fù)雜RAG任務(wù)分解為簡(jiǎn)單明確的子任務(wù)，可在不依賴高級(jí)推理能力的情況下保持系統(tǒng)穩(wěn)定性

基于以上認(rèn)知，MiniRAG提出了兩個(gè)核心創(chuàng)新組件：異構(gòu)圖索引和輕量級(jí)基于圖的知識(shí)檢索，以實(shí)現(xiàn)高效精準(zhǔn)的信息檢索。

項(xiàng)目鏈接: https://github.com/HKUDS/MiniRAG

實(shí)驗(yàn)室主頁(yè): https://github.com/HKUDS

為了更好地評(píng)估MiniRAG在實(shí)際應(yīng)用場(chǎng)景中的表現(xiàn)，研究團(tuán)隊(duì)同時(shí)推出了專門面向端側(cè)環(huán)境的評(píng)測(cè)數(shù)據(jù)集——LiHua-World。該數(shù)據(jù)集通過(guò)模擬真實(shí)的個(gè)人數(shù)據(jù)，全面覆蓋了端側(cè)場(chǎng)景下常見(jiàn)的信息檢索和知識(shí)增強(qiáng)需求。

實(shí)驗(yàn)結(jié)果顯示，當(dāng)將大型語(yǔ)言模型(LLM)替換為小型語(yǔ)言模型(SLM)時(shí)，各框架表現(xiàn)差異顯著：GraphRAG則因無(wú)法保證生成質(zhì)量而完全失效，LightRAG的性能斷崖式下降(最高降幅達(dá)45.43%)。

相比之下，MiniRAG展現(xiàn)出優(yōu)秀的穩(wěn)定性——性能降幅最大僅為21.26%，最小僅0.79%。更值得注意的是，MiniRAG僅使用了約1/4的存儲(chǔ)空間，便實(shí)現(xiàn)了這一出色表現(xiàn)。

MiniRAG框架設(shè)計(jì)

語(yǔ)義感知異構(gòu)圖索引

為應(yīng)對(duì)端側(cè)RAG的特殊挑戰(zhàn)，MiniRAG提出了語(yǔ)義感知異構(gòu)圖索引機(jī)制。該機(jī)制通過(guò)系統(tǒng)性地整合文本塊和命名實(shí)體，構(gòu)建了一個(gè)富有層次的語(yǔ)義網(wǎng)絡(luò)，實(shí)現(xiàn)高效精準(zhǔn)的信息檢索。具體而言，異構(gòu)圖包含兩類核心節(jié)點(diǎn)：

實(shí)體節(jié)點(diǎn)：包含從文本中提取的關(guān)鍵語(yǔ)義元素，如事件、地點(diǎn)、時(shí)間以及特定領(lǐng)域概念

文本塊節(jié)點(diǎn)：保持原始文本的連貫性和完整上下文信息

這種雙層節(jié)點(diǎn)結(jié)構(gòu)設(shè)計(jì)使文本塊能在檢索階段直接參與匹配，有效確保檢索結(jié)果的相關(guān)性和準(zhǔn)確性。同時(shí)，該方法也巧妙規(guī)避了小型語(yǔ)言模型在文本總結(jié)能力上的局限，最大程度減少信息失真。

輕量級(jí)知識(shí)檢索

考慮到端側(cè)RAG系統(tǒng)在計(jì)算能力和數(shù)據(jù)隱私方面的限制，無(wú)法使用大型語(yǔ)言模型和復(fù)雜文本嵌入模型。為此，MiniRAG設(shè)計(jì)了創(chuàng)新的圖式知識(shí)檢索機(jī)制，通過(guò)結(jié)合語(yǔ)義感知異構(gòu)圖和輕量級(jí)文本嵌入，實(shí)現(xiàn)高效精準(zhǔn)的知識(shí)獲取。

該檢索機(jī)制包含兩個(gè)核心設(shè)計(jì)：

查詢語(yǔ)義映射在檢索階段，系統(tǒng)需要準(zhǔn)確識(shí)別查詢相關(guān)的文本元素，以支持模型生成精確響應(yīng)。MiniRAG充分利用小型語(yǔ)言模型在實(shí)體提取方面的優(yōu)勢(shì)，通過(guò)簡(jiǎn)化的查詢解析流程，將用戶查詢高效映射到圖索引結(jié)構(gòu)中。

拓?fù)湓鰪?qiáng)檢索采用兩階段檢索策略，首先基于嵌入相似度確定初始種子實(shí)體，再利用異構(gòu)圖的拓?fù)浣Y(jié)構(gòu)，沿著相關(guān)推理路徑發(fā)現(xiàn)更多相關(guān)信息。

模擬真實(shí)端側(cè)場(chǎng)景的評(píng)測(cè)數(shù)據(jù)集: 假如你是LiHua...

針對(duì)現(xiàn)有端側(cè)RAG評(píng)測(cè)數(shù)據(jù)集的局限，研究團(tuán)隊(duì)創(chuàng)新性地構(gòu)建了LiHua-World數(shù)據(jù)集。該數(shù)據(jù)集通過(guò)模擬虛擬用戶「李華」一年的日常通訊記錄，真實(shí)還原了端側(cè)檢索增強(qiáng)生成的應(yīng)用場(chǎng)景。

數(shù)據(jù)集特點(diǎn)：

全面覆蓋單跳查詢、多跳推理和信息總結(jié)等多類型問(wèn)題；
提供專業(yè)人工標(biāo)注的標(biāo)準(zhǔn)答案和支持文檔；
內(nèi)容涵蓋社交互動(dòng)、健身訓(xùn)練、娛樂(lè)活動(dòng)、生活事務(wù)等日常場(chǎng)景；
特別適配端側(cè)RAG系統(tǒng)的評(píng)測(cè)需求；

實(shí)驗(yàn)評(píng)估與分析

為全面驗(yàn)證MiniRAG在端側(cè)RAG場(chǎng)景下與小型語(yǔ)言模型結(jié)合的優(yōu)勢(shì)，研究團(tuán)隊(duì)設(shè)計(jì)了系統(tǒng)化的評(píng)估方案，重點(diǎn)聚焦以下三個(gè)核心維度：

系統(tǒng)性能對(duì)比：通過(guò)與當(dāng)前主流RAG系統(tǒng)的對(duì)比實(shí)驗(yàn)，全面評(píng)估MiniRAG在檢索準(zhǔn)確率、計(jì)算效率和資源消耗等關(guān)鍵指標(biāo)上的表現(xiàn)
組件效果分析：深入研究MiniRAG核心組件的性能貢獻(xiàn)，包括語(yǔ)義感知異構(gòu)圖索引機(jī)制的檢索效果、輕量級(jí)檢索策略的計(jì)算開(kāi)銷，以及各模塊間的協(xié)同效應(yīng)
實(shí)際場(chǎng)景案例研究：選取多個(gè)具有代表性的應(yīng)用場(chǎng)景，重點(diǎn)驗(yàn)證系統(tǒng)在處理多步推理、復(fù)雜查詢等高挑戰(zhàn)任務(wù)時(shí)的實(shí)際表現(xiàn)。通過(guò)詳實(shí)的案例分析，展示MiniRAG在真實(shí)應(yīng)用環(huán)境中的優(yōu)勢(shì)與潛力。

系統(tǒng)性能對(duì)比

現(xiàn)有RAG系統(tǒng)的局限性

實(shí)驗(yàn)結(jié)果表明，現(xiàn)有RAG系統(tǒng)在遷移至小型語(yǔ)言模型(SLMs)時(shí)存在嚴(yán)重的性能瓶頸。具體而言，LightRAG的整體性能顯著下降(降幅達(dá)45.43%)，而GraphRAG在小模型場(chǎng)景下甚至無(wú)法維持基本的生成能力。這些問(wèn)題充分暴露了傳統(tǒng)RAG架構(gòu)對(duì)大型語(yǔ)言模型的深度依賴。

MiniRAG的創(chuàng)新突破

相比之下，MiniRAG通過(guò)雙節(jié)點(diǎn)異構(gòu)圖索引結(jié)構(gòu)和拓?fù)湓鰪?qiáng)檢索機(jī)制，有效降低了對(duì)模型能力的依賴。實(shí)驗(yàn)數(shù)據(jù)顯示，在遷移至小型語(yǔ)言模型時(shí)，MiniRAG的性能損失得到顯著控制 - 最大降幅僅為21.26%，最小降幅更是低至0.79%，展現(xiàn)出優(yōu)異的模型適應(yīng)性。

MiniRAG顯著的存儲(chǔ)優(yōu)化

實(shí)驗(yàn)評(píng)估顯示，MiniRAG在存儲(chǔ)效率優(yōu)化方面取得了突破性進(jìn)展。與采用gpt-4-mini的LightRAG基線系統(tǒng)相比，MiniRAG僅需25%的存儲(chǔ)空間即可達(dá)到相當(dāng)?shù)男阅芩?。這種在大幅降低存儲(chǔ)需求(節(jié)省75%)的同時(shí)還能保持高檢索準(zhǔn)確率的特性，不僅展現(xiàn)了MiniRAG在系統(tǒng)架構(gòu)設(shè)計(jì)上的創(chuàng)新，更為資源受限場(chǎng)景下的RAG應(yīng)用開(kāi)辟了新的可能性。

組件效果分析

為全面評(píng)估MiniRAG各組件的性能貢獻(xiàn)，研究團(tuán)隊(duì)設(shè)計(jì)了兩組系統(tǒng)化的消融實(shí)驗(yàn)。第一組實(shí)驗(yàn)(-I)將MiniRAG的異構(gòu)圖索引替換為傳統(tǒng)的基于描述的索引方法，該方法與LightRAG和GraphRAG相似，主要依賴模型的語(yǔ)義理解能力來(lái)生成實(shí)體與關(guān)系描述。

第二組實(shí)驗(yàn)(-Ri)通過(guò)在圖檢索過(guò)程中選擇性停用特定功能模塊，以量化分析各模塊對(duì)系統(tǒng)整體表現(xiàn)的影響。這一嚴(yán)謹(jǐn)?shù)膶?shí)驗(yàn)框架使我們能夠精確評(píng)估每個(gè)創(chuàng)新組件的實(shí)際貢獻(xiàn)。

基于小語(yǔ)言模型RAG的挑戰(zhàn)

消融實(shí)驗(yàn)結(jié)果明確顯示，當(dāng)使用傳統(tǒng)的文本語(yǔ)義驅(qū)動(dòng)索引技術(shù)(-II)替代MiniRAG的索引方法時(shí)，系統(tǒng)性能出現(xiàn)顯著下降。這一發(fā)現(xiàn)有力驗(yàn)證了研究團(tuán)隊(duì)的初始假設(shè)：小型語(yǔ)言模型(SLMs)在復(fù)雜知識(shí)圖譜生成和全面語(yǔ)義理解等方面存在固有局限。

Reasoning Path Discovery的有效性

結(jié)構(gòu)組件的關(guān)鍵性通過(guò)實(shí)驗(yàn)得到充分證實(shí)。無(wú)論是移除邊信息(-RedgeRedge)還是塊節(jié)點(diǎn)(-RchunkRchunk)，都會(huì)導(dǎo)致系統(tǒng)性能明顯下降。這些組件展現(xiàn)出雙重價(jià)值：既通過(guò)查詢引導(dǎo)的推理路徑發(fā)現(xiàn)優(yōu)化了查詢匹配效果，又在數(shù)據(jù)索引階段有效彌補(bǔ)了SLMs的能力限制。

實(shí)際場(chǎng)景案例研究

MiniRAG通過(guò)一個(gè)復(fù)雜的餐廳識(shí)別案例，有力展示了其在實(shí)際應(yīng)用中的卓越性能，特別是在處理多約束查詢和克服小型語(yǔ)言模型局限性方面的優(yōu)勢(shì)。

挑戰(zhàn)：復(fù)雜查詢解析的困境

研究團(tuán)隊(duì)選取了一個(gè)具有挑戰(zhàn)性的測(cè)試案例，查詢內(nèi)容為：Wolfgang和Li Hua為慶祝Wolfgang升職而共進(jìn)晚餐的那家意大利餐廳叫什么名字？這一查詢涉及多重約束條件，要求系統(tǒng)能從在線聊天數(shù)據(jù)中準(zhǔn)確識(shí)別特定意大利餐廳及其相關(guān)上下文。盡管LightRAG采用了phi-3.5-mini-instruct模型，但受限于小型語(yǔ)言模型的固有局限性，特別是在提取high-level信息和處理圖索引噪聲方面的不足，導(dǎo)致其檢索效果不夠理想。

MiniRAG：創(chuàng)新的知識(shí)發(fā)現(xiàn)機(jī)制

MiniRAG通過(guò)其獨(dú)特的查詢引導(dǎo)推理路徑發(fā)現(xiàn)機(jī)制成功應(yīng)對(duì)了上述挑戰(zhàn)。系統(tǒng)利用異構(gòu)圖索引結(jié)構(gòu)，首先預(yù)測(cè)答案類型（如「社交互動(dòng)」或「地點(diǎn)」），然后通過(guò)策略性分解查詢要素（專注于「意大利場(chǎng)所」和「餐廳」語(yǔ)境），結(jié)合目標(biāo)實(shí)體匹配，實(shí)現(xiàn)了精確且具有上下文關(guān)聯(lián)的知識(shí)檢索。這種結(jié)構(gòu)化推理方法使MiniRAG能夠精確導(dǎo)航知識(shí)空間，最終成功定位目標(biāo)餐廳——Venedia Grancaffe。

結(jié)論

MiniRAG作為一種創(chuàng)新的檢索增強(qiáng)生成系統(tǒng)，成功突破了小型語(yǔ)言模型(SLMs)在傳統(tǒng)RAG框架中的應(yīng)用瓶頸。

系統(tǒng)通過(guò)創(chuàng)新的異構(gòu)圖索引架構(gòu)和輕量級(jí)啟發(fā)式檢索機(jī)制，有效融合了文本與圖式RAG方法的優(yōu)勢(shì)，同時(shí)顯著降低了對(duì)語(yǔ)言模型能力的依賴。

實(shí)驗(yàn)驗(yàn)證表明，即使采用SLMs，MiniRAG仍能達(dá)到與大語(yǔ)言模型方案相當(dāng)?shù)男阅芩?。為推?dòng)設(shè)備端RAG技術(shù)發(fā)展，研究團(tuán)隊(duì)還發(fā)布了首個(gè)針對(duì)性評(píng)估基準(zhǔn)數(shù)據(jù)集，特別關(guān)注個(gè)人通信場(chǎng)景和多約束查詢等實(shí)際應(yīng)用場(chǎng)景。

這些創(chuàng)新不僅標(biāo)志著設(shè)備端RAG系統(tǒng)研究的重要進(jìn)展，更為保護(hù)用戶隱私、提升資源效率的邊緣AI應(yīng)用開(kāi)辟了新的發(fā)展方向。

責(zé)任編輯：張燕妮來(lái)源：新智元

AI 模型訓(xùn)練

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<ruby id="7r9yo"></ruby>

^{<blockquote id="7r9yo"></blockquote>}

<legend id="7r9yo"><track id="7r9yo"></track></legend>

<sub id="7r9yo"></sub>