自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Entropix，終于找到了真正解決幻覺(jué)的方法了

發(fā)布于 2024-10-15 15:06

瀏覽

0收藏

最近，神秘大佬開(kāi)源一個(gè)框架entropix, 2周不到收獲2.4k star。

Entropix，終于找到了真正解決幻覺(jué)的方法了-AI.x社區(qū)

Entropix的核心思想是通過(guò)量化模型的不確定性，來(lái)做出更多的“思考”，從而獲得更好的效果。

當(dāng)大模型在預(yù)測(cè)下一個(gè)詞時(shí)，模型會(huì)為每個(gè)詞分配一個(gè)可能的概率。如果模型特別篤定的那個(gè)token的概率都很低，也就是不確定性很高的時(shí)候，熵越高。

很多時(shí)候，想減少模型的幻覺(jué)時(shí)，可能會(huì)將模型的采樣超參數(shù)如temperature設(shè)為 0。但是這樣做并不一定能提高模型不產(chǎn)生幻覺(jué)輸出的概率，只是迫使它對(duì)相對(duì)于其他單詞而言的一個(gè)單詞賦予更高的概率。

但是在 Entropix 和之前google的內(nèi)置cot研究驗(yàn)證了，事實(shí)恰恰相反，采用貪婪解碼，反而可能會(huì)讓結(jié)果變得更壞。

google的研究，前不久發(fā)的推文：??cot-decoding，谷歌把o1的底褲都開(kāi)源了??

那如何衡量結(jié)果不確定性呢？在這個(gè)google的研究中使用的是top1和top2的token概率的差值。在Entropix中用到的是entropy和varentropy，varentropy是衡量entropy的方差的，提供了一個(gè)關(guān)于跨不同token不確定性的度量。

低varentropy意味著模型的不確定性在token間是恒定的，高則意味著token間不確定性很大。

Entropix，終于找到了真正解決幻覺(jué)的方法了-AI.x社區(qū)

Entropix 方法中的采樣過(guò)程如下，核心思想是根據(jù)模型的不確定性調(diào)整其選擇策略：

當(dāng)模型有信心（低entropy和低varentropy）時(shí)，它就會(huì)按常規(guī)進(jìn)行。
當(dāng)模型不確定（高entropy和/或高varentropy）時(shí)，它會(huì)探索替代標(biāo)記或推理路徑。

Entropix，終于找到了真正解決幻覺(jué)的方法了-AI.x社區(qū)

這種自適應(yīng)方法是在模擬思維鏈過(guò)程，當(dāng)模型不確定時(shí)，它會(huì)“更努力的思考”，從而可能產(chǎn)生更準(zhǔn)確連貫的輸出。

本文轉(zhuǎn)載自 ??NLP前沿??，作者：熱愛(ài)AI的

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

CVPR 2024 | 多模態(tài)大模型幻覺(jué)原因找到了！

zhangyannni ? 4713瀏覽 ? 0回復(fù)
AI重塑社交，誰(shuí)才是C端敘事正解？

liutao988 ? 1916瀏覽 ? 0回復(fù)
除了RAG，還有這五種方法消除大模型幻覺(jué)

51CTO技術(shù)棧 ? 4747瀏覽 ? 0回復(fù)
比Transformer更快更省，Mamba終于卷到網(wǎng)絡(luò)領(lǐng)域了

arnoldzhw ? 6040瀏覽 ? 0回復(fù)
開(kāi)發(fā)者終于可以定制自己的GPT-4o了！

51CTO技術(shù)棧 ? 2231瀏覽 ? 0回復(fù)
解決大型多模態(tài)模型的幻覺(jué)問(wèn)題，新方法AITuning助力AI更可靠

AI論文解讀 ? 2552瀏覽 ? 0回復(fù)
RAG真正的難點(diǎn)不是向量數(shù)據(jù)庫(kù)，而是實(shí)時(shí)企業(yè)數(shù)據(jù)管道！這家公司做到了

51CTO技術(shù)棧 ? 2148瀏覽 ? 0回復(fù)
Kimi 我的神，它終于更新了！這個(gè)探索版，有點(diǎn)牛！

wsp_ping ? 2631瀏覽 ? 0回復(fù)
Auto-RAG開(kāi)源，復(fù)雜多跳問(wèn)題就這么解決了！

PaperAgent ? 2689瀏覽 ? 0回復(fù)
Agent驅(qū)動(dòng)的AI編程，終于找到了PMF！

探索AGI ? 1904瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)—終于把梯度下降搞明白了！

人工智能訓(xùn)練營(yíng) ? 1878瀏覽 ? 0回復(fù)
減少LLM幻覺(jué)的五大技巧和方法

51CTO內(nèi)容精選 ? 1897瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了！

人工智能訓(xùn)練營(yíng) ? 1644瀏覽 ? 0回復(fù)
復(fù)旦大學(xué) METASQL：NL2SQL終于有候選排序了

AIGC前沿技術(shù)追蹤 ? 1882瀏覽 ? 0回復(fù)
什么是神經(jīng)網(wǎng)絡(luò)-終于把神經(jīng)網(wǎng)絡(luò)參數(shù)更新搞明白了反向傳播詳解

人工智能訓(xùn)練營(yíng) ? 1872瀏覽 ? 0回復(fù)
大型語(yǔ)言模型是否解決了搜索問(wèn)題？

51CTO內(nèi)容精選 ? 1948瀏覽 ? 0回復(fù)
連續(xù)嘗試了18種RAG技術(shù)之后，我找到了最優(yōu)的那個(gè)

PyTorch研習(xí)社 ? 784瀏覽 ? 0回復(fù)
不再只是建議：Augment Agent 想成為真正幫你干活的 AI 開(kāi)發(fā)伙伴！

墨風(fēng)如雪小站 ? 1905瀏覽 ? 0回復(fù)
扔掉你的“提示詞大全”吧，來(lái)聊聊語(yǔ)言模型真正詭異的地方

草臺(tái)AI ? 641瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

推理大模型并非一定要推理 7天前發(fā)布
llama 4，開(kāi)源！ 2025-04-10 07:06:26發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開(kāi)發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫(kù)配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開(kāi)源爬蟲(chóng)神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：現(xiàn)實(shí)再次給大模型帶來(lái)沉重打擊

下一篇： RAG遇上知識(shí)沖突，Google祭出終極大招！

社區(qū)精華內(nèi)容

目錄