RAG 的未來 - 自動文檔檢索
嘿,大家好!這里是一個專注于AI智能體的頻道~
今天給家人們分享一個新RAG技巧,隨著LLMs能力的變強,檢索整個文檔而不是文檔塊已經(jīng)逐漸成為 RAG 的新規(guī)范。但是如何從大量文檔中找出正確的文檔呢?
最近 @akshay_pachaar 大佬,開源了一個改變游戲規(guī)則的方法,它將 RAG 與結(jié)構(gòu)化查詢相結(jié)合,以實現(xiàn)精確的文檔檢索。方法的秘密是:
- 建索引的每個文檔塊附帶上文檔的信息
- 執(zhí)行塊搜索,從而可以獲取到相關的文檔的元數(shù)據(jù)
- 使用檢索到的元數(shù)據(jù)作為樣例,填充進auto-retriever的提示詞中,得到文檔過濾策略,如下圖
代碼開源地址:??https://github.com/run-llama/llamacloud-demo/blob/main/examples/advanced_rag/auto_retrieval.ipynb??
運行的日志如下:
贊
收藏
回復
分享
微博
QQ
微信
舉報

回復
相關推薦