自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<legend id="fucg9"><track id="fucg9"><dfn id="fucg9"></dfn></track></legend>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破

發(fā)布于 2025-4-8 00:38

瀏覽

0收藏

Anthropic連發(fā)兩篇相互關(guān)聯(lián)的大模型內(nèi)部機(jī)制研究報(bào)告【文獻(xiàn)1、文獻(xiàn)2】：

構(gòu)建了AI“顯微鏡”，并用它追蹤了大模型思維，這是繼去年?揭秘大模型黑盒之后的重大進(jìn)展。

【文獻(xiàn)1】構(gòu)建了替代模型（replacement model）作為AI“顯微鏡”

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

通過這個(gè)替代模型，亦步亦趨的捕獲針對(duì)每一個(gè)提示語的歸因圖（attribution graph）

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

歸因圖用于描述模型在特定輸入提示下生成目標(biāo)詞元輸出時(shí)所經(jīng)歷的推理步驟。

歸因圖的邊表征節(jié)點(diǎn)間的線性影響關(guān)系，節(jié)點(diǎn)代表以下對(duì)象：

激活的特征
輸入提示中的詞元嵌入
重構(gòu)誤差
輸出邏輯值

每個(gè)特征的活動(dòng)強(qiáng)度由其輸入邊的權(quán)重之和決定。

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

歸因圖展示了特征如何在特定輸入提示下相互作用以生成模型輸出。

而特征在所有上下文環(huán)境中交互的全局圖景更值得關(guān)注，全局交互由模型權(quán)重決定：

相鄰層神經(jīng)元間的直接影響就是它們之間的連接權(quán)重；若神經(jīng)元間隔較遠(yuǎn)，則影響會(huì)通過中間層傳遞。

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

這本質(zhì)上是筆者在?降低大模型幻覺的必由之路中描述的 Transformer視角下的范疇中采樣，即在復(fù)雜高維的對(duì)象米田嵌入圖中的采樣路徑。

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū) 圖片

學(xué)者們接著在【文獻(xiàn)2】中應(yīng)用此AI“顯微鏡”對(duì)自家大模型Claude 3.5 Haiku在多種情景下內(nèi)部機(jī)制做了“生物學(xué)”探查，非常有趣。

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

筆者關(guān)注到兩個(gè)情景：詩歌中的規(guī)劃和多語言電路，很有感觸和共鳴。

詩歌規(guī)劃，研究發(fā)現(xiàn)大模型在寫詩行時(shí)提前計(jì)劃其輸出：

在開始編寫每一行之前，模型會(huì)識(shí)別可能出現(xiàn)在末尾的押韻單詞，預(yù)先選擇的押韻選項(xiàng)將決定模型構(gòu)建整行的方式。

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

這顛覆了大模型僅僅做下一個(gè)詞元預(yù)測(cè)的流行的行業(yè)錯(cuò)誤認(rèn)知，大模型是這么學(xué)習(xí)語料的，但不代表也是這么推理生成的。

詩詞韻律規(guī)劃更符合筆者在?MIT對(duì)大模型數(shù)理原理的強(qiáng)有力證明中描述的采樣過程：

“在外部感官輸入下（被提示置于某種上下文），大模型內(nèi)部將限定在相應(yīng)的高維語言概率空間的子空間內(nèi)推理；推理是在子空間中采樣，類比時(shí)跨范疇采樣；

采樣不斷進(jìn)行，基于內(nèi)部概率化了的世界模型（預(yù)訓(xùn)練獲得的先驗(yàn)），針對(duì)感官輸入（提示），做變分推斷，最小化自由能，獲取最佳采樣分布q*，作為對(duì)導(dǎo)致感官輸入的外部后驗(yàn)的預(yù)測(cè)?！?/p>

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū) 圖片

多語言電路，研究發(fā)現(xiàn)大模型混合使用了“特定于語言的”，和“抽象的、獨(dú)立于語言的”電路，更大的模型中，“抽象的、獨(dú)立于語言的”成分更突出。

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

這非常貼切的印證了筆者??在 DeepSeek R1 & R2 技術(shù)原理??中，對(duì)大模型中不同層次/尺度語言處理機(jī)制的描述：

揭秘AI內(nèi)部機(jī)制：AI理解的重大突破-AI.x社區(qū)

人類與大模型的語言體系中具有共通的三層結(jié)構(gòu)：自下而上，基礎(chǔ)“信息概率分布”處理體系；自然語言如語音或詞句文章；符號(hào)語言如代碼、數(shù)學(xué)公式等。

而推理不過是在LLM構(gòu)建的高維概率語言空間里，對(duì)信息概率分布采樣做變分；

這個(gè)過程可以映射到不同的上層自然語言，以及對(duì)應(yīng)的語音，甚至進(jìn)一步映射到某種符號(hào)語言 - 代碼或數(shù)學(xué)公式；

而抽象的符號(hào)語言也可以用自然語言描述，從而進(jìn)一步轉(zhuǎn)換為對(duì)信息概率分布的處理過程。

Anthropic團(tuán)隊(duì)對(duì)大模型內(nèi)部機(jī)制的探索不斷取得重要進(jìn)展，越來越接近模型本質(zhì)的機(jī)理。與目前來自Nature，Science，學(xué)術(shù)界，企業(yè)界的幾十項(xiàng)研究成果一樣，均指向這一?數(shù)理認(rèn)知框架。

文獻(xiàn)1 https://transformer-circuits.pub/2025/attribution-graphs/methods.html

文獻(xiàn)2 ?https://transformer-circuits.pub/2025/attribution-graphs/biology.html

本文轉(zhuǎn)載自???清熙???，作者：王慶法

標(biāo)簽

內(nèi)部機(jī)制

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

重大突破！IDAdapter：首個(gè)無需微調(diào)，單張圖像生成多樣和個(gè)性化頭像方案(北大&格靈深瞳）

angel ? 5275瀏覽 ? 0回復(fù)
AI下一個(gè)重大飛躍是理解情感！第一個(gè)具有情商的對(duì)話型AI來了

duhorse ? 2674瀏覽 ? 0回復(fù)
揭秘多模態(tài)：人工智能領(lǐng)域的新突破

sword_hero ? 2988瀏覽 ? 0回復(fù)
突破AI性能瓶頸！揭秘LLaMA-MoE模型的高效神經(jīng)元分配策略

AI論文解讀 ? 2553瀏覽 ? 0回復(fù)
AI界的新寵：揭秘Llama 3.1如何革新AI合成技術(shù)

ermulong ? 2154瀏覽 ? 0回復(fù)
長視頻生成又有重大突破！DreamFactory：一致、連貫且引人入勝的長視頻生成框架

angel ? 8005瀏覽 ? 0回復(fù)
剛剛，OpenAI發(fā)布sCM提升50倍效率，擴(kuò)散模型重大技術(shù)突破！

玄姐聊AGI ? 1856瀏覽 ? 0回復(fù)
327個(gè)樣本打破常規(guī)，這個(gè)"OpenAI o1復(fù)制之旅"有點(diǎn)燃 | RAG系統(tǒng)迎來重大突破！

sbf_2000 ? 2019瀏覽 ? 0回復(fù)
AI2驚艷發(fā)布OneDiffusion：突破性大規(guī)模擴(kuò)散模型，支持多任務(wù)生成與理解，重塑視覺AI應(yīng)用

angel ? 2754瀏覽 ? 0回復(fù)
谷歌發(fā)布雙思維AI Agent：像人類一樣思考，重大技術(shù)突破！

Aceryt ? 1816瀏覽 ? 0回復(fù)
Bert重大創(chuàng)新，RAG突破512長度限制

CourseAI ? 1932瀏覽 ? 0回復(fù)
詳解AI代理的內(nèi)部工作機(jī)理

51CTO內(nèi)容精選 ? 1709瀏覽 ? 0回復(fù)
泛AI架構(gòu)設(shè)計(jì)：理解AI云原生

魯班模錘1 ? 1750瀏覽 ? 0回復(fù)
AI Agents-1 | 深度揭秘AI智能體：開篇導(dǎo)論

Halo咯咯 ? 1411瀏覽 ? 0回復(fù)
AI Agents-6 | AI智能體架構(gòu)大揭秘：從基礎(chǔ)知識(shí)到前沿模式

Halo咯咯 ? 1743瀏覽 ? 0回復(fù)
【人工智能】AI如何精準(zhǔn)匹配RAG知識(shí)庫？揭秘混合檢索的奧秘！

唐克 ? 1418瀏覽 ? 0回復(fù)
內(nèi)部評(píng)估作用有限：通用人工智能需要第三方缺陷披露機(jī)制

上堵吟1 ? 832瀏覽 ? 0回復(fù)
ICLR 2025 | 被AI“洗圖”也能識(shí)別版權(quán)！水印技術(shù)重大突破：VINE模型全面碾壓舊方法!

angel ? 1238瀏覽 ? 0回復(fù)
AI微調(diào)后變"壞"也有解法：揭秘LLM對(duì)齊技術(shù)新突破

sbf_2000 ? 451瀏覽 ? 0回復(fù)

這個(gè)用戶很懶，還沒有個(gè)人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

d1：通過GRPO在擴(kuò)散LLM中縮放推理 12h前發(fā)布
語言與擴(kuò)散模型的精準(zhǔn)控制 1天前發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識(shí)庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇： DeepSeek R1 & R2 技術(shù)原理

下一篇：哈佛大學(xué)：高維回歸中的Scaling Law是重整化的自然結(jié)果

社區(qū)精華內(nèi)容

目錄

<p id="nqjso"><track id="nqjso"><menuitem id="nqjso"></menuitem></track></p>