微軟LazyGraphRAG來了,700倍成本壓縮!
微軟最新又改版了一波GraphRAG,這波把知識圖譜丟了,只剩下無向圖了。
帶來的優(yōu)勢是:
- LazyGraphRAG 數(shù)據(jù)索引成本與向量 RAG 相同,且為全圖 RAG 成本的 0.1%。
- 對于與向量 RAG 相當(dāng)?shù)牟樵兂杀?,LazyGraphRAG 在局部查詢中優(yōu)于所有競爭方法,包括LongRAG 和 GraphRAG DRIFT 搜索以及 GraphRAG 局部搜索。
- 相同的 LazyGraphRAG 配置在全局查詢方面也顯示出與 GraphRAG 全局搜索相當(dāng)?shù)拇鸢纲|(zhì)量,但查詢成本降低了 700 多倍。
- 對于 GraphRAG 全局搜索的 4%查詢成本,LazyGraphRAG 在本地和全局查詢類型上,包括 C2 級別的 GraphRAG 全局搜索(大多數(shù)應(yīng)用推薦的三級社區(qū)層次)上,顯著優(yōu)于所有競爭方法。
圖 1. 展示 LazyGraphRAG 在(100,500,1,500)相關(guān)性測試預(yù)算下,相對于每個(gè)(局部,全局)查詢和(全面性,多樣性,賦權(quán))指標(biāo)組合的競爭條件下的勝率簇狀柱狀圖
二者區(qū)別:
- 放棄實(shí)體關(guān)系抽取(關(guān)系太吃token了),抽取概念,構(gòu)建無向概念圖。再次基礎(chǔ)上,層次化社區(qū)構(gòu)建
- 放棄社區(qū)報(bào)告,推理時(shí)處理
- query做sub-q,做遍歷,涉及到一些排序的策略,比如根據(jù)文本塊的相關(guān)性去篩選社區(qū)。然后又判斷社區(qū)的前k個(gè)文本塊的相關(guān)性,決定是否要去篩選子社區(qū)。 大概就是沒有社區(qū)報(bào)告了,從文本來入手了。
- 生成答案差不多,map-reduce, 每個(gè)sub-q針對檢索結(jié)果,生成結(jié)果,最后總結(jié)結(jié)果。
本文轉(zhuǎn)載自 ??NLP前沿??
贊
收藏
回復(fù)
分享
微博
QQ
微信
舉報(bào)

回復(fù)
相關(guān)推薦