自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

GPT4技術(shù)原理:大模型的幻覺,解鈴還須系鈴人

發(fā)布于 2024-6-12 11:03
瀏覽
0收藏

阿爾伯特·愛因斯坦曾經(jīng)說過:

像我們這樣相信物理學的人都知道,過去、現(xiàn)在和未來之間的區(qū)別只是一種頑固執(zhí)著的幻覺。換句話說,時間是一種幻覺。

筆者覺得,此種意義上說,光也是一種幻覺,你能看到可見光,卻對紅外光和紫外光“熟視無睹”。而這一切不過是同一種形式的波或者粒子。

人類的幻覺

人類的幻覺無處不在,無時不有。只是絕大多數(shù)情境下,你覺察不到而已,像紅紫外光。

幻覺(Hallucination)是一種在沒有外部刺激的情況下的感知,具有真實感知的特性?;糜X是生動的、實質(zhì)的,并且被認為位于外部客觀空間。

幻覺可以發(fā)生在任何感官模式中—視覺、聽覺、嗅覺、味覺、體感、本體感覺、平衡覺、傷害感受、溫度感受和時間知覺等等。

“感覺是外部和內(nèi)部共同驅(qū)動的世界。” 一如柏拉圖的洞穴寓言中的先民,將其看到的墻上的影子,認知為事物的外部真實存在。

150年前,馮 · 亥姆霍茲(1867)提出了感知的"無意識推理"概念。2005年Karl Friston將這種亥姆霍茲感知概念數(shù)學形式化。

知覺的原理

Friston假設(shè)大腦構(gòu)建了一個世界模型,其中先驗的“信念”(即概率分布)用以指導概率推理:從大腦接收到的嘈雜和模糊的感官輸入中,推斷出其蘊含的外部原因。

將“先驗”與新的感官輸入(“似然”)相結(jié)合,產(chǎn)生感知(“后驗”),是大腦對內(nèi)外部兩個信息源的整合,并按其相對精度(逆不確定性)進行了加權(quán)。這是知覺的基本原理。

換句話說,一個人的先驗信念相對于感官輸入的精度越高,感知(后驗)就越受先驗支配。這意味著先驗信念或感覺數(shù)據(jù)在神經(jīng)元上的精確表達方式的生物異常會導致異常的知覺推理。這是人類幻覺的本質(zhì)。

Friston 的感知概念數(shù)學形式如下,反映了大腦的感知其實是在做變分推斷。

F(s,u) = - log(p(s|m)) + Dkl [ q(Φ|u) || p(Φ|s,m) ]

變分推斷

p(s|m) 是客觀世界導致感官輸入s 的概率,也是客觀的,因而該項是常數(shù);Dkl [ q(Φ|u) || p(Φ|s,m) ] 是 q 和 p 的散度,也稱為 q,p的KL距離,衡量 q, p 之間的逼近程度。

大腦會不斷從 u 中采樣出 q, 逼近p,從而使得 p, q 距離最小化,即自由能 F(s,u) 最小化。反過來看,如果我們找到 F(s,u)最小化,此時的 Φ* 就是對Φ 的最佳近似。

在”漂亮國的核潛艇與深度學習的內(nèi)卷“文中,筆者總結(jié)過:變分推斷核心思想是將求解概率分布問題,轉(zhuǎn)換成距離最小化的優(yōu)化問題。

Friston 的這個感知概念數(shù)學形式,也被稱為貝葉斯大腦。

貝葉斯大腦

“ChatGPT是第一個真正意義的人工通用智能” 文中,筆者首先總結(jié)了大腦的工作方式:

大腦不斷從外部世界接收感官信息,用來更新其內(nèi)部世界模型,并對未來事件做出預測。內(nèi)部世界模型是關(guān)于外部世界的先驗信念或假設(shè);

大腦的主要目標是預測和控制外界的信息,以最大限度地降低不確定性和內(nèi)部熵。信息熵代表大腦關(guān)于世界的內(nèi)部模型的隨機性或不確定性;

大腦努力將其內(nèi)部模型與基于感官輸入的預測誤差最小化,減少信息熵可以對世界做出更準確的預測,這等于使系統(tǒng)的自由能最小化。

大模型認知框架

本系列“GPT4技術(shù)原理”的文章:學習語言需要相變,相變與涌現(xiàn),重整化群與生成式AI,重整化群流作為最優(yōu)輸運,已經(jīng)梳理出來大模型認知框架:

GPT4技術(shù)原理:大模型的幻覺,解鈴還須系鈴人-AI.x社區(qū)

海量的文本或者多模態(tài)語料組成了大模型需要認知的外部世界的基本信息;嵌入構(gòu)建高維概率化的語言空間,用來建模語言文字圖像以及音視頻,并對連續(xù)變量做離散化;

預訓練以重整化群流的方式進行,在不同尺度上提煉語料數(shù)據(jù)中的信息概率分布;重整化群流的每一步流動(自回歸預測逼近訓練語料概率分布),都沿著最優(yōu)輸運的成本最低方向進行;

重整化群在不動點附近因新語料帶來微擾而發(fā)生對稱性破缺,滑入不同的相空間;不同的相空間,對應(yīng)某種意義上的范疇,可形象化為信息的結(jié)晶;這是大模型從語料中學到的內(nèi)部世界模型;

在外部感官輸入下(被提示置于某種上下文),大模型內(nèi)部將限定在相應(yīng)的高維語言概率空間的子空間內(nèi)推理;推理是在子空間中采樣,類比時跨范疇采樣;

采樣不斷進行,基于內(nèi)部概率化了的世界模型(預訓練獲得的先驗),針對感官輸入(提示),做變分推斷,最小化自由能,獲取最佳采樣分布q*,作為對導致感官輸入的外部后驗的預測。

大模型的認知框架,看起來十分接近Friston 描繪的貝葉斯大腦(維基百科上的示意圖):

GPT4技術(shù)原理:大模型的幻覺,解鈴還須系鈴人-AI.x社區(qū)

大模型幻覺

先驗信念或感覺數(shù)據(jù)在神經(jīng)元上的精確表達方式的生物異常會導致異常的知覺推理。這導致了人類的幻覺。大模型不僅也有類似的幻覺,而且成了實用的最大障礙。

當模型生成的文本不遵循原文(Faithfulness)或者不符合事實(Factualness),人們就可以認為模型出現(xiàn)了幻覺的問題。參考 Survey of Hallucination in Natural Language Generation ( arxiv.org/abs/2202.03629 )。

有研究(結(jié)論見下圖)凸顯了這個問題的嚴重性,以及解決大模型中幻覺的緊迫性和重要性,以確保負責任的大模型技術(shù)應(yīng)用。

GPT4技術(shù)原理:大模型的幻覺,解鈴還須系鈴人-AI.x社區(qū)

幻覺的來源

大模型的幻覺又來自哪里呢?從上文大模型的認知框架不難分析,框架中每一個關(guān)鍵環(huán)節(jié)都可能導致大模型產(chǎn)生幻覺。

語料中的偏差與錯誤,讓大模型學的就是扭曲的外部信息;嵌入構(gòu)建高維概率語言空間,精度不足會導致概率向量混淆;

重整化提煉語料信息概率分布,無法確保自由能不變,因而是有損提取;自回歸預測僅僅是逼近訓練語料概率分布,籍此構(gòu)建的內(nèi)部概率先驗不完全精確;

重整化群因微擾而發(fā)生對稱性破缺,內(nèi)部模型發(fā)生相變,目前沒有預知與控制的方法,帶來內(nèi)部世界模型結(jié)構(gòu)的不確定性;

寬泛模糊的提示語,加之上下文的關(guān)聯(lián)影響下,大模型內(nèi)部采樣選取的用于推理的子空間會存在某些偏差;

推理采樣在有偏差的子空間進行,可能偏離最佳采樣分布q*很遠;變分推斷獲取的嚴重有偏采樣分布,成了對外部后驗的預測。

如何管控幻覺

解鈴還須系鈴人,有針對性的為幻覺來源對癥下藥,將是今后管控幻覺的關(guān)鍵措施。這里沒用“消除”一詞,從上文認知框架筆者推斷,可將幻覺降低到“不可見”范圍,但很難消除為零。

針對語料中的偏差與錯誤,語料的全面數(shù)據(jù)治理十分必要,既要豐富詳實,又要不偏不倚;加大算力提高模型精度,增強嵌入及后續(xù)訓練的信息區(qū)分度;

改進Transformer-Attention歸一化算法,優(yōu)化降低自由能損失,最大程度降低信息折損;自回歸預測將受益于歸一化優(yōu)化,從而提升內(nèi)部概率先驗精確性;

構(gòu)建重整化流的數(shù)學公式,推導出其流動的方向,并計算可能的不動點,從而借助新語料,對不動點做微擾,促進其進入更有序的相空間,實現(xiàn)可控的可預測的涌現(xiàn);

RLHF訓練結(jié)合提示工程探索不同上下文有效提示語,改進decoder模型,促進大模型內(nèi)部采樣使用Wasserstein距離作為概率分布近似的度量;

探測研究內(nèi)部世界模型結(jié)構(gòu),進而可以控制模型溫度,指導動態(tài)Bayes推理更貼切的采樣概率分布,進一步亦可通過檢索增強生成(RAG)效果,提高自一致自評估能力。

還可以做整體解決方案的安全架構(gòu)與治理設(shè)計,請參考此篇:復雜企業(yè)的生成式人工智能解決方案架構(gòu),做最終的人工審核與確認。?

寫在最后

因博弈論獲得諾獎的數(shù)學家約翰納什,曾因為幻聽、幻覺被確診為嚴重的精神分裂癥,多次診治多次復發(fā),最后得以徹底治愈。

精神分裂癥是一種可能以貝葉斯腦推理異常為特征的疾病。貝葉斯腦認知框架,范式優(yōu)雅,建模方法強大,可用以分析診斷感知推理的多種潛在異常,成為當前重要的精神分裂診療理論參考。

筆者梳理的大模型認知框架,與Friston 的感知概念數(shù)學形式即貝葉斯腦神似,為分析與管控大模型幻覺,找到了系統(tǒng)的探索途徑。大模型幻覺未來必定可控。

大名鼎鼎的哲學家和數(shù)學家笛卡爾有個經(jīng)典的問題:如果我們的感覺不能總是被信任,那如何區(qū)別幻覺與現(xiàn)實?

大模型如何作答呢?如何發(fā)揮人們的想象力,駕馭大模型這種特殊的"想象力",安全放心的應(yīng)用于關(guān)鍵性質(zhì)的任務(wù)呢?

本文轉(zhuǎn)載自??清熙??,作者: 王慶法 ????

收藏
回復
舉報
回復
相關(guān)推薦