自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<meter id="edgdk"></meter>

<sub id="edgdk"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性

發(fā)布于 2025-3-4 10:28

瀏覽

0收藏

一、概述

title：You Truly Understand What I Need : Intellectual and Friendly Dialogue Agents grounding Knowledge and Persona

論文地址：https://aclanthology.org/2022.findings-emnlp.75/

代碼地址：https://github.com/dlawjddn803/INFO

1.1 Motivation

以前的研究將知識或個(gè)人資料混合融入預(yù)先訓(xùn)練的語言模型。其同時(shí)考慮知識和人物角色的能力仍然是有限的，導(dǎo)致生成結(jié)果出現(xiàn)幻覺，并且使用人物角色的方法也很被動。

1.2 Methods

提出一種有效的agent，同時(shí)基于外部知識和persona來生成回復(fù)。
選擇合適的知識和persona生成回答，利用poly-encoder的方法來實(shí)現(xiàn)候選打分。
實(shí)施了人物角色級別指標(biāo)，以考慮微妙的人物角色基礎(chǔ)的多種人物角色選擇。
利用檢索的方式來增強(qiáng)query，其包含知識-角色的增強(qiáng)信息，使其生成的回復(fù)少幻覺，多參與性。

總結(jié)：

1）先計(jì)算persona和knowledge的分?jǐn)?shù)

2）選擇合適的persona+knowledge

3）結(jié)合2+query，利用faiss檢索相近的paragraphs

4）生成更具信息量，更多參與度的responses。

1.3 Conclusion

提出了INFO (Intellectual and Friendly dialOg agents)，在persona-knowledge chat數(shù)據(jù)集自動評估m(xù)etrics上取得sota。
人工評估也顯示其少幻覺，多參與性。
相對于之前的檢索器件retrievers，證明了我們r(jià)etrievers的有效性，也比較了multiple candidate scoring的方法。

1.4 limitation

缺乏真實(shí)的知識和persona候選，導(dǎo)致在現(xiàn)實(shí)環(huán)境不可用。
評估幻覺的cases數(shù)量還比較少。
需要高的GPU計(jì)算資源（ since it marginalizes loss at the token level ）

二、大綱

LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性 -AI.x社區(qū)

三、詳細(xì)內(nèi)容

3.1 整體架構(gòu)圖

主旨思想：利用對話歷史信息，挖掘出最相近的背景信息，然后利用該信息檢索出更多額外知識，進(jìn)而提高生成結(jié)果的質(zhì)量。

U：人類和機(jī)器的歷史對話數(shù)據(jù)。

cand：每個(gè)候選，感覺是knowledge的候選 or persona的候選，目的是排序后選擇分?jǐn)?shù)最高的。

KPEQ（knowledge persona enhanced query）：增強(qiáng)后的query

Retriever（Non parameters）：非參數(shù)的，相當(dāng)于是檢索出相關(guān)文檔，輔助額外的知識來提升回復(fù)效果。

3.2 語義檢索效果比較:相對于bi-encoder雙塔和cross-encoder，poly這種交互模式效果最好

LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性 -AI.x社區(qū)

3.3 實(shí)驗(yàn)結(jié)果

Generation：生成效果評估

Grounding：persona和knowledge分類預(yù)測的精度（挑選分?jǐn)?shù)最高的persona和knowledge的精度嗎？）

RAG：token級別生成效果好，sequence級別分類效果好

LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性 -AI.x社區(qū)

3.4 人工評估：效果碾壓其他的

LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性 -AI.x社區(qū)

3.5 實(shí)驗(yàn)設(shè)置

LMEDR對話模型：引入自然語言推理數(shù)據(jù)提升對話模型的連貫性和一致性 -AI.x社區(qū)

本文轉(zhuǎn)載自??PaperWeekly??，作者：胡翔 ??NLP ??

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

揭秘大語言模型的判斷一致性挑戰(zhàn)

zhangyannni ? 4739瀏覽 ? 0回復(fù)
拋棄自回歸，連接一致性Diffusion和LLM！UCSD上交新作熱度緊追AF 3

duhorse ? 2350瀏覽 ? 0回復(fù)
自我一致性提升大模型中的思維鏈推理能力

AIRoobt ? 4851瀏覽 ? 0回復(fù)
基于Llama 3和LangChain，使用自然語言進(jìn)行SQL查詢

小虎哦哦 ? 4411瀏覽 ? 0回復(fù)
人工智能的一致性推理悖論

xuxiangda ? 2845瀏覽 ? 0回復(fù)
多智能體大模型協(xié)作中的角色不一致性：一致性、虛構(gòu)性和模仿性

xuxiangda ? 2773瀏覽 ? 0回復(fù)
小紅書開源StoryMaker：個(gè)性化圖像生成模型，實(shí)現(xiàn)角色一致性與背景變化的完美結(jié)合

angel ? 6138瀏覽 ? 0回復(fù)
人工智能與人類情感的交匯點(diǎn)：一致性評估方法的探索

xuxiangda ? 5194瀏覽 ? 0回復(fù)
智能對話新紀(jì)元：大模型推理服務(wù)

AI論文解讀 ? 1765瀏覽 ? 0回復(fù)
中科大重磅開源StableV2V：專注于「人機(jī)交互一致性」的視頻編輯方法

angel ? 2196瀏覽 ? 0回復(fù)
字節(jié)&上交&北大開源StoryTeller：生成一致性高的長視頻描述

angel ? 2088瀏覽 ? 0回復(fù)
RARE: 提升LLM推理準(zhǔn)確性和事實(shí)完整性的檢索增強(qiáng)框架思路淺嘗

大模型自然語言處理 ? 2314瀏覽 ? 0回復(fù)
推進(jìn)可解釋性自然語言生成（NLG）：技術(shù)、挑戰(zhàn)和應(yīng)用

51CTO內(nèi)容精選 ? 2619瀏覽 ? 0回復(fù)
即插即用，無縫集成各種模型，港科大&螞蟻等發(fā)布Edicho：圖像編輯一致性最新成果！

angel ? 1906瀏覽 ? 0回復(fù)
艾倫圖靈研究所最新成果：多智能體博弈中的可糾正性和一致性

xuxiangda ? 2599瀏覽 ? 0回復(fù)
對話數(shù)據(jù)合成：清華利用多Agent合成大量醫(yī)療對話數(shù)據(jù)顯著提升LLM在醫(yī)療場景效果

arnoldzhw ? 2118瀏覽 ? 0回復(fù)
技術(shù)前沿：CHASE-SQL與XiYan-SQL，解鎖自然語言與數(shù)據(jù)庫對話的奧秘！

Halo咯咯 ? 663瀏覽 ? 0回復(fù)
多模態(tài)MLLM都是怎么實(shí)現(xiàn)的—如何保持text2video的連續(xù)一致性

熵減AI ? 296瀏覽 ? 0回復(fù)
字節(jié)提出一致性視頻生成方法Phantom：通過跨模態(tài)對齊生成主題一致的視頻，超多應(yīng)用場景

AIGCStudio ? 147瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

香港科技大學(xué)聯(lián)合DeepSeek-AI推出CODEI/O：讓AI學(xué)會“濃縮”推理模式 9天前發(fā)布
中國科大認(rèn)知全重實(shí)驗(yàn)室發(fā)布Agent-R1訓(xùn)練框架，支持自主思考與工具調(diào)用！ 2025-04-09 06:29:20發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：小而美！1B模型如何通過測試時(shí)優(yōu)化逆襲405B LLM？

下一篇：利用LLM做論文review到哪一步了？來看看DeepReview吧！

社區(qū)精華內(nèi)容

目錄

<legend id="h26ad"><track id="h26ad"></track></legend>

^{<sub id="h26ad"></sub>}

<style id="h26ad"></style>