自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="id44q"></style>

<blockquote id="id44q"><i id="id44q"></i></blockquote>

<u id="id44q"></u>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

下一代RAG：MemoRAG

發(fā)布于 2024-9-11 14:13

瀏覽

0收藏

MemoRAG是一個建立在高效、超長記憶模型之上的創(chuàng)新 RAG（Retrieval-Augmented Generation）框架，由智源研究院（北京人工智能研究院）與中國人民大學高瓴人工智能學院聯(lián)合推出并開源。

MemoRAG：通過記憶啟發(fā)的知識發(fā)現(xiàn)邁向下一代RAG，為 RAG 提供基于內(nèi)存的數(shù)據(jù)接口，適用于多種用途的應用程序！

下一代RAG：MemoRAG-AI.x社區(qū)

MemoRAG與主要處理具有明確信息需求查詢的標準 RAG 不同，MemoRAG利用其記憶模型實現(xiàn)對整個數(shù)據(jù)庫的全局理解。通過從記憶中回憶與查詢相關(guān)的線索，MemoRAG增強了證據(jù)檢索，從而產(chǎn)生更準確、更豐富的上下文響應。

在處理需要對整個數(shù)據(jù)庫進行高級理解的查詢時，標準RAG與MemoRAG之間的比較，以《哈利·波特》書籍作為數(shù)據(jù)庫。左側(cè)圖，由于輸入查詢的隱含性質(zhì)，標準RAG難以準確定位所需的證據(jù)，導致答案不夠準確。右側(cè)圖，MemoRAG構(gòu)建了覆蓋整個數(shù)據(jù)庫的全局記憶。當提出查詢時，MemoRAG 首先回憶相關(guān)線索，使有用的信息得以檢索，從而得到一個精確且全面的答案。

下一代RAG：MemoRAG-AI.x社區(qū)

MemoRAG特點

下一代RAG：MemoRAG-AI.x社區(qū)

全局記憶：在單個上下文中處理高達100萬個token，為龐大的數(shù)據(jù)集提供全面的了解。
可優(yōu)化與靈活：輕松適應新任務，僅需幾個小時的額外訓練即可實現(xiàn)優(yōu)化性能。
上下文線索：從全局記憶中生成精確線索，將原始輸入與答案連接起來，并從復雜數(shù)據(jù)中解鎖隱藏的洞察。
高效緩存：通過支持緩存分塊、索引和編碼，將上下文預填充速度提高多達30倍。
上下文重用：一次性編碼長上下文，并支持重復使用，提高需要重復數(shù)據(jù)訪問的任務的效率。

在三個基準上測試了MemoRAG，使用了三種不同的生成器（Llama3-8B-Instruct-8K、Phi-3-mini-128K、Mistral-7B-Instruct-v0.2-32K），得出以下結(jié)論：

主要實驗結(jié)果。每個版塊中最好的結(jié)果以粗體顯示。這些實驗中使用的記憶模型是基于 Mistral-7B-Instruct-v0.2-32K 訓練的，可在 HuggingFace 上獲取。

下一代RAG：MemoRAG-AI.x社區(qū)

MemoRAG 在所有數(shù)據(jù)集上的表現(xiàn)都超過了所有基線模型，展示了其強大的領(lǐng)域泛化能力。
直接將完整上下文輸入到大型語言模型（LLMs）通常比其他 RAG 方法（BGE-M3、Stella-v5 和 HyDE）表現(xiàn)更好。這一發(fā)現(xiàn)揭示了標準 RAG 系統(tǒng)在處理長上下文和高級問題方面的困難。
相比之下，MemoRAG 一貫超越了直接使用完整上下文的性能，展示了其有效彌合處理超長上下文和解決復雜任務之間差距的能力。
MemoRAG 在三個領(lǐng)域內(nèi)數(shù)據(jù)集上展示了卓越的性能，這表明其潛力可以通過更多樣化的訓練數(shù)據(jù)進一步增強。

MemoRAG使用

可以直接用 HuggingFace 模型初始化。通過該MemoRAG.memorize()方法，記憶模型可以在較長的輸入上下文中構(gòu)建全局記憶。

TommyChien/memorag-qwen2-7b-inst可以處理最多400K個token的上下文，
TommyChien/memorag-mistral-7b-inst可以管理最多128K個token的上下文。
通過增加參數(shù)beacon_ratio，可以擴展模型處理更長上下文的能力。例如，TommyChien/memorag-qwen2-7b-inst可以處理最多一百萬個tokenbeacon_ratio=16。

from memorag import MemoRAG


# Initialize MemoRAG pipeline
pipe = MemoRAG(
    mem_model_name_or_path="TommyChien/memorag-mistral-7b-inst",
    ret_model_name_or_path="BAAI/bge-m3", 
    gen_model_name_or_path="mistralai/Mistral-7B-Instruct-v0.2", # Optional: if not specify, use memery model as the generator
    cache_dir="path_to_model_cache",  # Optional: specify local model cache directory
    access_token="hugging_face_access_token",  # Optional: Hugging Face access token
    beacon_ratio=4
)


context = open("examples/harry_potter.txt").read()
query = "How many times is the Chamber of Secrets opened in the book?"


# Memorize the context and save to cache
pipe.memorize(context, save_dir="cache/harry_potter/", print_stats=True)


# Generate response using the memorized context
res = pipe(cnotallow=context, query=query, task_type="memorag", max_new_tokens=256)
print(f"MemoRAG generated answer: \n{res}")

運行上述代碼時，編碼后的鍵值 (KV) 緩存、Faiss 索引和分塊段落都存儲在指定的中save_dir。之后，如果再次使用相同的上下文，則可以快速從磁盤加載數(shù)據(jù)：

pipe.load("cache/harry_potter/", print_stats=True)

通常，加載緩存權(quán)重非常高效。例如，使用內(nèi)存模型對200K令牌上下文進行編碼、分塊和索引大約需要35秒，但從緩存文件加載時只需1.5秒。

摘要任務

要執(zhí)行摘要任務，請使用以下腳本：

res = pipe(cnotallow=context, task_type="summarize", max_new_tokens=512)
print(f"MemoRAG summary of the full book:\n {res}")

https://github.com/qhjqhj00/MemoRAG
https://arxiv.org/pdf/2409.05591
MemoRAG: Moving Towards Next-Gen RAG Via Memory-Inspired Knowledge Discovery

本文轉(zhuǎn)載自??PaperAgent??

標簽

贊

收藏

回復

舉報

回復

相關(guān)推薦

今日arXiv最熱NLP大模型論文：微軟重磅：AgentAI，下一代人工智能的關(guān)鍵

pangguiyu ? 4685瀏覽 ? 0回復
ICLR 2024 | 脈沖神經(jīng)網(wǎng)絡的meta架構(gòu)設(shè)計：啟發(fā)下一代神經(jīng)形態(tài)芯片設(shè)計

laokugonggao ? 2882瀏覽 ? 0回復
閉環(huán)的生成式AI：將LLM和GPT集成到下一代網(wǎng)絡中

xuxiangda ? 3583瀏覽 ? 0回復
閉環(huán)的生成式AI：將LLM和GPT集成到下一代網(wǎng)絡中

xuxiangda ? 2561瀏覽 ? 0回復
YOLOv9：深度解析新一代實時目標檢測王者

sword_hero ? 5563瀏覽 ? 0回復
微軟重磅開源 GraphRAG：新一代 RAG 技術(shù)來了！

玄姐聊AGI ? 5452瀏覽 ? 0回復
扎克伯格的下一代產(chǎn)品：Llama4、社交推薦以及“去TMD”的讓人爆粗的封閉平臺

51CTO技術(shù)棧 ? 2456瀏覽 ? 0回復
蜘蛛俠妖嬈起舞，下一代ControlNet來了！賈佳亞團隊推出，即插即用，還能控制視頻生成

Crystalcxt ? 1876瀏覽 ? 0回復
使用人工智能增強 IaC以提高下一代基礎(chǔ)設(shè)施的效率

51CTO內(nèi)容精選 ? 1885瀏覽 ? 0回復
微軟內(nèi)部工程師突爆料：OpenAI下一代模型11月即將上架，今天離職的AGI顧問：今天Lastday

51CTO技術(shù)棧 ? 1669瀏覽 ? 0回復
人類如何培養(yǎng)出下一代聰明且安全的AI技術(shù)

51CTO技術(shù)棧 ? 2146瀏覽 ? 0回復
OpenAI內(nèi)部員工爆料下一代模型Orion性能堪憂

51CTO技術(shù)棧 ? 1942瀏覽 ? 0回復
Voyage AI 推出 voyage-code-3：專為代碼檢索而優(yōu)化的全新下一代嵌入模型

Halo咯咯 ? 3198瀏覽 ? 0回復
為什么多模態(tài)AI是下一個風口？深度解讀新一代LLM

芝士AI吃魚 ? 4248瀏覽 ? 0回復
Hume AI 推出 OCTAVE：下一代語音語言模型，具有動態(tài)語音和個性創(chuàng)建等新的新興功能

Halo咯咯 ? 1623瀏覽 ? 0回復
神秘“Seed Edge”項目被曝光，已設(shè)置5大研究方向，探索下一代AI技術(shù)，算力不用愁！

51CTO技術(shù)棧 ? 1835瀏覽 ? 0回復
Manus 架構(gòu)設(shè)計揭秘：解構(gòu)下一代 AI Agent 多智能體架構(gòu)

玄姐聊AGI ? 2716瀏覽 ? 0回復
別搞 GraphRAG 了，擁抱新一代 RAG 范式 DeepSearcher

玄姐聊AGI ? 2096瀏覽 ? 0回復
講講推動下一代人工智能推理的五種途徑

51CTO內(nèi)容精選 ? 883瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

OpenAI大佬：AI上半場忙著開發(fā)新訓練方法和模型GPT-4/o1/o3，下半場呢？ 9天前發(fā)布
CPU推理僅29ms，微軟開源第一個原生 1 bit 大模型，內(nèi)存只需Qwen 1.5B的1/15 9天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點：替代人干真活！ 1回復

王炸！MCP 架構(gòu)設(shè)計深度剖析 & 使用 Spring AI + MCP 四步教你實現(xiàn) Agent 智能體開發(fā) 0回復

Dify從入門到高階系列二：手把手教學！超詳細的Dify知識庫配置全攻略 0回復

Crawl4AI：GitHub榜首40K星標！LLM專屬極速開源爬蟲神器 0回復

只需5分鐘，教你用Python搭建MCP Server 0回復

上一篇： Open LLM集中爆發(fā)的一周，卷瘋了！

下一篇： RAG+RAU：對檢索增強型語言模型（RALM）進行全面、深入綜述

社區(qū)精華內(nèi)容

目錄

<rt id="roosd"></rt>

<cite id="roosd"></cite>

<cite id="roosd"></cite>

<s id="roosd"><track id="roosd"><menuitem id="roosd"></menuitem></track></s>