自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗

大模型自然語(yǔ)言處理

發(fā)布于 2024-11-26 10:43

瀏覽

0收藏

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

（a1）mR2AG帶檢索：這個(gè)過(guò)程包括：a）檢索反思，用于確定是否需要檢索；b）相關(guān)性反思，用于識(shí)別證據(jù)段落；c）對(duì)多個(gè)候選答案進(jìn)行后處理。（a2）mR2AG不帶檢索：當(dāng)不需要檢索時(shí)的生成過(guò)程。（b）無(wú)反思的樸素mRAG：一種沒(méi)有反思的基線方法。

在基于知識(shí)的視覺(jué)問(wèn)答（Knowledge-based VQA）任務(wù)中，輸入通常是一對(duì)圖像和問(wèn)題，并且依賴于可訪問(wèn)的知識(shí)庫(kù)。文章提出的框架通過(guò)兩個(gè)新穎的反思操作來(lái)解耦生成過(guò)程，從而提高答案的質(zhì)量。將生成過(guò)程分為三個(gè)步驟：執(zhí)行檢索反思（Retrieval-Reflection）以確定是否需要檢索，執(zhí)行相關(guān)性反思（Relevance-Reflection）以識(shí)別證據(jù)段落并生成答案，以及后處理多個(gè)候選答案。

方法

檢索反思

用戶查詢可以根據(jù)輸入(I,Q)分為依賴視覺(jué)的和基于知識(shí)的。為了指導(dǎo)模型區(qū)分不同類型的查詢，定義了兩個(gè)特殊標(biāo)記：[Retrieval] 和 [No Retrieval]，用于執(zhí)行檢索反思。具體步驟如下：

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

相關(guān)性反思

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

答案后處理

在一個(gè)文章中可能存在多個(gè)證據(jù)段落，導(dǎo)致生成多個(gè)候選答案。因此，后處理是必要的，以便得出一個(gè)最終的答案。

層級(jí)后處理：使用層級(jí)后處理來(lái)通過(guò)整合三個(gè)級(jí)別的分?jǐn)?shù)對(duì)候選答案進(jìn)行排序：

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

最后，三個(gè)級(jí)別的分?jǐn)?shù)綜合考慮了答案生成過(guò)程中的每一個(gè)步驟，分別在條目、段落和答案級(jí)別評(píng)估候選答案的可靠性。通過(guò)計(jì)算這三個(gè)分?jǐn)?shù)的乘積來(lái)整合它們的效果，作為排序候選答案的最終標(biāo)準(zhǔn)。模型輸出基于此標(biāo)準(zhǔn)得分最高的答案。

實(shí)驗(yàn)

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

mR^2AG：基于知識(shí)的多模態(tài)檢索-反思增強(qiáng)生成方法淺嘗-AI.x社區(qū)

參考文獻(xiàn)

mR2AG: Multimodal Retrieval-Reflection-Augmented Generation for Knowledge-Based VQA，https://arxiv.org/pdf/2411.15041

本文轉(zhuǎn)載自公眾號(hào)大模型自然語(yǔ)言處理作者：余俊暉

原文鏈接：??https://mp.weixin.qq.com/s/TV8MV0mXdO1TWoq5uqlNkg??

標(biāo)簽

多模態(tài)

已于2024-11-28 18:50:31修改

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

以自組織映射算法促進(jìn)高效的LLM檢索增強(qiáng)生成

51CTO內(nèi)容精選 ? 3403瀏覽 ? 0回復(fù)
通過(guò)檢索增強(qiáng)生成(RAG) 增強(qiáng)LLM的實(shí)戰(zhàn)演練

51CTO內(nèi)容精選 ? 3227瀏覽 ? 0回復(fù)
面向大語(yǔ)言模型的檢索增強(qiáng)生成(RAG)技術(shù)：綜述

angel ? 4711瀏覽 ? 0回復(fù)
一起聊聊圖檢索增強(qiáng)生成

sbf_2000 ? 2583瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

玄姐聊AGI ? 2425瀏覽 ? 0回復(fù)
P-RAG: 漸進(jìn)式檢索增強(qiáng)生成方法在具身日常任務(wù)規(guī)劃中的應(yīng)用

芝士AI吃魚 ? 3374瀏覽 ? 0回復(fù)
15種先進(jìn)的檢索增強(qiáng)生成（RAG）技術(shù)

Halo咯咯 ? 1851瀏覽 ? 0回復(fù)
多模態(tài)RAG-VisRAG：基于視覺(jué)的檢索增強(qiáng)生成在多模態(tài)文檔上的應(yīng)用

大模型自然語(yǔ)言處理 ? 2419瀏覽 ? 0回復(fù)
再談大模型檢索增強(qiáng)生成——RAG

AI探索時(shí)代 ? 1845瀏覽 ? 0回復(fù)
提升RAG性能的全攻略：優(yōu)化檢索增強(qiáng)生成系統(tǒng)的策略大揭秘

Halo咯咯 ? 5201瀏覽 ? 0回復(fù)
基于長(zhǎng)期記憶的檢索增強(qiáng)生成新范式-MemoRAG

大模型自然語(yǔ)言處理 ? 2156瀏覽 ? 0回復(fù)
LightRAG：提升檢索增強(qiáng)生成的效率與準(zhǔn)確性

Halo咯咯 ? 3538瀏覽 ? 0回復(fù)
RAG檢索增強(qiáng)生成和大模型微調(diào)的抉擇

AI探索時(shí)代 ? 1979瀏覽 ? 0回復(fù)
大模型檢索增強(qiáng)生成之向量數(shù)據(jù)庫(kù)的問(wèn)題

AI探索時(shí)代 ? 2082瀏覽 ? 0回復(fù)
九種不同類型的檢索增強(qiáng)生成 (RAG)

Halo咯咯 ? 2385瀏覽 ? 0回復(fù)
基于AG2+ChromaDB開發(fā)多代理RAG系統(tǒng)

51CTO內(nèi)容精選 ? 2009瀏覽 ? 0回復(fù)
什么是檢索增強(qiáng)生成 (RAG)？

Halo咯咯 ? 1611瀏覽 ? 0回復(fù)
萬(wàn)字解析非結(jié)構(gòu)化文檔中的隱藏價(jià)值：多模態(tài)檢索增強(qiáng)生成（RAG）的前景

柏企閱文 ? 918瀏覽 ? 0回復(fù)
NodeRAG：以圖結(jié)構(gòu)革新檢索增強(qiáng)生成

PyTorch研習(xí)社 ? 242瀏覽 ? 0回復(fù)

大模型自然語(yǔ)言處理

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Kimi-VL開源多模態(tài)大模型結(jié)構(gòu)、訓(xùn)練方法、訓(xùn)練數(shù)據(jù)淺析 2025-04-16 07:08:19發(fā)布
十大PDF解析工具在不同文檔類別中的比較研究 2025-04-07 06:31:37發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： OPEN-RAG：利用開源大模型增強(qiáng)檢索增強(qiáng)推理

下一篇：文本文字識(shí)別、公式識(shí)別、表格文字識(shí)別核心算法及思路及實(shí)踐-DBNet、CRNN、TrOCR

社區(qū)精華內(nèi)容

目錄

<style id="2yyxv"></style>

<blockquote id="2yyxv"><p id="2yyxv"></p></blockquote>

<sub id="2yyxv"></sub>