自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

清華新研究解密信息繭房!全新信息動(dòng)力學(xué)理論,登Nature子刊

人工智能 新聞
推薦系統(tǒng)如果只推薦用戶喜歡的內(nèi)容,會(huì)降低活躍用戶的信息熵,觀點(diǎn)也會(huì)逐漸走向極端。

新一代信息與智能技術(shù)的迅猛發(fā)展推動(dòng)著人類逐步邁入智能社會(huì)。在數(shù)字技術(shù)和智能推薦算法的加持下,媒體和平臺(tái)越來(lái)越貼心,總是能最快最準(zhǔn)的地契合人們的個(gè)性化偏好和需求。

然而,與此同時(shí),智能精準(zhǔn)推薦致使「信息繭房」現(xiàn)象不斷發(fā)酵,觀點(diǎn)相似的人群在網(wǎng)絡(luò)空間組成團(tuán)體,特定價(jià)值偏好在群體中匯集放大,逐漸形成極端的觀點(diǎn)。

針對(duì)名人或社會(huì)事件的每一種極端觀點(diǎn)都能夠被利用成為意識(shí)形態(tài)加入和影響的工具,在網(wǎng)絡(luò)空間和現(xiàn)實(shí)世界中推波助瀾,掀起「洶洶民意」。

然而,即便如此,我們對(duì)于信息繭房仍所知甚少:真實(shí)線上系統(tǒng)中的信息繭房究竟有多嚴(yán)重?缺乏大規(guī)模實(shí)證研究;信息繭房的形成機(jī)理是什么?缺乏基礎(chǔ)理論支撐;如何解決信息繭房問(wèn)題?缺乏行之有效的手段。

最近,清華大學(xué)電子系城市科學(xué)與計(jì)算研究中心與公管學(xué)院跨學(xué)科合作,通過(guò)大規(guī)模實(shí)證研究與信息動(dòng)力學(xué)理論建模,首次大規(guī)模數(shù)據(jù)實(shí)證及理論揭示了信息媒體上信息繭房涌現(xiàn)的內(nèi)在機(jī)理與相變邊界,為理解當(dāng)下智能社會(huì)中人-智交互復(fù)雜社會(huì)系統(tǒng)提供了全新思路。

該成果以「人-智自適應(yīng)動(dòng)力學(xué)驅(qū)動(dòng)信息繭房涌現(xiàn)」(Human–AI adaptive dynamics drives the emergence of information cocoons)為題在《自然·機(jī)器智能》(Nature Machine Intelligence)上在線發(fā)表。

論文鏈接:https://www.nature.com/articles/s42256-023-00731-4

代碼及數(shù)據(jù)鏈接:https://github.com/tsinghua-fib-lab/Adaptive-Information-Dynamic-Model

該成果聚焦于新聞與視頻兩個(gè)典型場(chǎng)景,通過(guò)分析5.7億用戶行為數(shù)據(jù)和使用信息熵度量信息繭房嚴(yán)重程度,發(fā)現(xiàn)在一年交互后,超過(guò)57%的活躍用戶均經(jīng)歷了不同程度的信息熵下降,標(biāo)志著現(xiàn)實(shí)系統(tǒng)中信息繭房的嚴(yán)重性。

在實(shí)證發(fā)現(xiàn)的基礎(chǔ)上,該成果提出了人-智自適應(yīng)信息動(dòng)力學(xué)模型,以建模人類與推薦算法之間的關(guān)鍵反饋回路,并通過(guò)系統(tǒng)信息熵的演化規(guī)律來(lái)刻畫(huà)信息繭房相變過(guò)程。

該模型從非平衡態(tài)統(tǒng)計(jì)力學(xué)視角揭示了「多樣化-部分信息繭房-深度信息繭房」復(fù)雜系統(tǒng)的相變過(guò)程及相變邊界,為控制人-智交互復(fù)雜社會(huì)系統(tǒng)中的信息繭房問(wèn)題提供了理論基礎(chǔ),并啟發(fā)后續(xù)設(shè)計(jì)通過(guò)平衡系統(tǒng)正反饋與負(fù)反饋以及算法精準(zhǔn)推送與用戶自由探索,破除信息繭房,進(jìn)而實(shí)現(xiàn)負(fù)責(zé)任的推薦算法。

論文概述

人工智能作為一種新興顛覆性技術(shù),正在深刻改變著人類的生產(chǎn)、生活方式和思維方式,對(duì)經(jīng)濟(jì)發(fā)展與社會(huì)進(jìn)步產(chǎn)生著重大而深遠(yuǎn)的影響。其中,推薦算法作為人工智能技術(shù)最廣泛應(yīng)用的一種,能夠有效緩解信息過(guò)載問(wèn)題,極大程度地影響著人們的所見(jiàn)所聞與所思所想。

然而,推薦算法也是一把雙刃劍,其所提供的個(gè)性化推薦會(huì)使人們所接觸的信息變得越來(lái)越同質(zhì)化,逐漸困于信息繭房之中。而這些同質(zhì)化的信息,不但會(huì)限制人們的眼界,使其遠(yuǎn)離集體、疏離社會(huì),而且還會(huì)助長(zhǎng)社會(huì)矛盾與分裂。

因此,為了遏制信息繭房的產(chǎn)生,理解其背后的產(chǎn)生機(jī)理是首要一步。

已有對(duì)于信息同質(zhì)化問(wèn)題的研究[1-5],大多聚焦于人類行為或是智能算法。通過(guò)實(shí)證研究方法,研究指出社交媒體上同質(zhì)人群聚集的潛在因素或是算法過(guò)濾效應(yīng),然而由于數(shù)據(jù)與方法論的限制,僅能夠提供相關(guān)性結(jié)論。

最近,一些實(shí)證研究[25,26]進(jìn)行了因果性的分析。然而,這些研究仍未提供內(nèi)在機(jī)理性的分析與解釋。更進(jìn)一步地,當(dāng)前推薦算法大多基于黑盒的人工智能深度學(xué)習(xí)方法,而其背后的數(shù)以億計(jì)的參數(shù)量,使得我們更加難以洞察信息繭房的根源。

針對(duì)信息繭房根源未知的問(wèn)題,研究團(tuán)隊(duì)聚焦于新聞與視頻兩個(gè)典型場(chǎng)景,通過(guò)大規(guī)模實(shí)證研究發(fā)現(xiàn),在一年交互過(guò)程中,超過(guò)57%的活躍用戶均經(jīng)歷了不同程度的信息多樣性的下降,并指出基于相似度匹配與正負(fù)反饋是影響信息同質(zhì)化過(guò)程的關(guān)鍵要素。

進(jìn)一步,基于實(shí)證發(fā)現(xiàn)與推薦算法領(lǐng)域?qū)嵺`,研究團(tuán)隊(duì)受隨機(jī)熱力學(xué)思想啟發(fā),創(chuàng)造性地提出了人-智自適應(yīng)信息動(dòng)力學(xué)模型。

該模型通過(guò)刻畫(huà)基于相似度匹配與反饋利用兩個(gè)基本機(jī)制,機(jī)理性地建模了人類與推薦算法之間的關(guān)鍵反饋回路,并通過(guò)系統(tǒng)信息熵的演化來(lái)刻畫(huà)系統(tǒng)相變過(guò)程。

通過(guò)仿真實(shí)驗(yàn)與理論分析,揭示了「多樣化-部分信息繭房-深度信息繭房」復(fù)雜系統(tǒng)的相變過(guò)程及相變邊界,為控制人-智交互復(fù)雜社會(huì)系統(tǒng)中的信息繭房問(wèn)題提供了理論基礎(chǔ)與實(shí)用方法。

人-智自適應(yīng)信息動(dòng)力學(xué)模型

技術(shù)要點(diǎn)

研究團(tuán)隊(duì)聚焦于新聞與視頻兩個(gè)內(nèi)容推薦典型場(chǎng)景,通過(guò)大規(guī)模真實(shí)數(shù)據(jù)的實(shí)證分析,刻畫(huà)了真實(shí)世界信息繭房的嚴(yán)重程度及其影響因素。

具體而言,研究團(tuán)隊(duì)使用信息熵來(lái)刻畫(huà)用戶所接收信息的多樣性,發(fā)現(xiàn)超過(guò)57%的活躍用戶都經(jīng)歷了不同程度的信息多樣性的下降,其視野被推薦算法逐漸局限于狹窄的信息繭房。

通過(guò)進(jìn)一步分析,研究團(tuán)隊(duì)發(fā)現(xiàn)推薦算法基于相似度匹配的強(qiáng)度以及正負(fù)反饋是影響信息繭房產(chǎn)生的關(guān)鍵要素。該實(shí)證研究不僅首次量化了真實(shí)大規(guī)模在線信息系統(tǒng)中信息繭房的嚴(yán)重程度,而且為后續(xù)理論模型的提出奠定了基礎(chǔ)。

 

(a-c)聚焦于新聞與視頻兩個(gè)典型場(chǎng)景,量化真實(shí)世界信息繭房嚴(yán)重程度;(d-f)相似度匹配強(qiáng)度、正負(fù)反饋是影響信息繭房形成的重要因素。

 基于實(shí)證結(jié)論與推薦算法領(lǐng)域?qū)嵺`,結(jié)合隨機(jī)熱力學(xué)理論,研究團(tuán)隊(duì)創(chuàng)造性地提出了人-智自適應(yīng)信息動(dòng)力學(xué)模型。

該模型采用信息熵來(lái)表示用戶所接觸信息的多樣性,并使用系統(tǒng)信息熵分布來(lái)表示系統(tǒng)所處狀態(tài)。

與依靠數(shù)以億計(jì)參數(shù)的深度學(xué)習(xí)模型不同,所提出的模型僅依靠基于相似度匹配與用戶反饋兩個(gè)基本機(jī)制,機(jī)理性地建模了人類與推薦算法之間的關(guān)鍵反饋回路,并使用隨機(jī)動(dòng)力學(xué)方程刻畫(huà)人-智復(fù)雜動(dòng)力學(xué)交互過(guò)程。

其中,圖片代表用戶l已被觀測(cè)到的興趣分布,圖片代表物品k的特征分布,圖片分別代表基于相似度匹配強(qiáng)度、正反饋利用率、負(fù)反饋利用率、自由探索強(qiáng)度。

基于上式能夠推導(dǎo)出描述關(guān)于用戶在各類主題上已被觀測(cè)到的偏好的???普朗克方程,進(jìn)一步通過(guò)平均場(chǎng)近似方法,最終能夠推導(dǎo)出用戶所接收的信息熵在人群上的分布。

研究團(tuán)隊(duì)指出,在不同參數(shù)空間下,該人-智交互復(fù)雜社會(huì)系統(tǒng)存在多樣化、部分信息繭房與深度信息繭房三種狀態(tài),而這三種系統(tǒng)狀態(tài)分別被三種不同的信息熵分布所刻畫(huà)。

大規(guī)模的仿真實(shí)驗(yàn)與實(shí)證分析進(jìn)一步驗(yàn)證了所提出模型的解釋力與有效性。

 

隨著(a)基于相似度匹配強(qiáng)度或(b)正反饋利用率的增加,人-智交互復(fù)雜社會(huì)系統(tǒng)經(jīng)歷了從多樣化狀態(tài)到部分信息繭房狀態(tài),再到深度信息繭房狀態(tài)的相變過(guò)程。紅色虛線為理論線,柱狀圖為仿真線。

研究團(tuán)隊(duì)發(fā)現(xiàn),隨著基于相似度匹配強(qiáng)度或正反饋利用率的增加,該復(fù)雜系統(tǒng)呈現(xiàn)出了從多樣化狀態(tài)到部分信息繭房狀態(tài),再到深度信息繭房狀態(tài)的相變過(guò)程。

然而,如果提升負(fù)反饋利用率或自由探索強(qiáng)度,系統(tǒng)則會(huì)經(jīng)歷一個(gè)逆相變過(guò)程,即從深度信息繭房到部分信息繭房,最后到多樣化狀態(tài)。上述四個(gè)相變過(guò)程經(jīng)過(guò)理論分析與大規(guī)模仿真實(shí)驗(yàn)的一致驗(yàn)證。

隨著(a)負(fù)反饋利用率的增加或(b)自由探索強(qiáng)度的增加,人-智交互復(fù)雜社會(huì)系統(tǒng)經(jīng)歷了從深度信息繭房狀態(tài)到部分信息繭房狀態(tài),再到多樣化狀態(tài)的逆相變過(guò)程。紅色虛線為理論線,柱狀圖為仿真線。

通過(guò)聯(lián)合分析,研究團(tuán)隊(duì)展示了在基于相似度推薦、正負(fù)反饋利用以及自由探索四個(gè)要素聯(lián)合驅(qū)動(dòng)下的整體系統(tǒng)的相變圖,并揭示了在信息繭房涌現(xiàn)的內(nèi)在機(jī)理。

具體而言,基于相似性匹配作為有效力場(chǎng),推動(dòng)復(fù)雜交互系統(tǒng)從多樣化走向同質(zhì)化。正反饋進(jìn)一步放大了這一力場(chǎng),導(dǎo)致信息多樣性下降。

而負(fù)反饋和自由探索通過(guò)抵制有效力場(chǎng)的作用,為系統(tǒng)引入擾動(dòng),從而促進(jìn)信息多樣性。

關(guān)于相變邊界,理論預(yù)測(cè)結(jié)果與仿真實(shí)驗(yàn)結(jié)果呈現(xiàn)出高度一致性,同時(shí),通過(guò)大量仿真實(shí)驗(yàn)與實(shí)證分析,例如替換函數(shù)、測(cè)量信息熵分布等,進(jìn)一步驗(yàn)證了所提出模型的穩(wěn)健性與有效性。

系統(tǒng)相變圖,(a-b)基于視頻與新聞場(chǎng)景數(shù)據(jù)的三維系統(tǒng)相變圖,(c-e)基于視頻場(chǎng)景數(shù)據(jù)的二維系統(tǒng)相變圖,(f-h)基于新聞場(chǎng)景數(shù)據(jù)的二維系統(tǒng)相變圖。

隨著人工智能技術(shù)的廣泛應(yīng)用,人類與智能系統(tǒng)之間的復(fù)雜交互構(gòu)成了一個(gè)涉及多個(gè)實(shí)體與多種反饋的復(fù)雜人智交互系統(tǒng)。

當(dāng)前人工智能大多基于深度學(xué)習(xí)技術(shù),而其黑盒屬性進(jìn)一步阻礙了深入理解該類復(fù)雜交互系統(tǒng)中的動(dòng)態(tài)特性和涌現(xiàn)行為。

研究團(tuán)隊(duì)所提出的自適應(yīng)信息動(dòng)力學(xué)模型通過(guò)提供對(duì)信息繭房涌現(xiàn)行為的機(jī)理性建模,為深入研究各類復(fù)雜人-智交互系統(tǒng)提供了有力的理論工具。此外,所提出的理論模型對(duì)于負(fù)責(zé)任的推薦算法設(shè)計(jì)具有實(shí)際指導(dǎo)意義。

該研究指出兩個(gè)信息繭房的有效方法,即促進(jìn)負(fù)反饋的有效利用,從學(xué)習(xí)用戶的負(fù)反饋這一全新視角來(lái)建模用戶偏好;以及促進(jìn)用戶自由探索,通過(guò)增大用戶對(duì)于自身內(nèi)容消費(fèi)的自由度與自主權(quán),來(lái)拓寬信息視野。

綜上所述,該研究成果不僅為推薦算法設(shè)計(jì)指明了實(shí)際改進(jìn)方向,而且還為理解人-智交互復(fù)雜社會(huì)系統(tǒng)提供了理論工具,以啟發(fā)后續(xù)Complex System for AI的相關(guān)研究。

作者介紹

清華大學(xué)電子系城市科學(xué)與計(jì)算研究中心博士生樸景華與博士后劉家臻為論文共同第一作者,李勇副教授為通信作者;清華公共管理學(xué)院張芳助理教授、蘇竣教授為共同作者。

該研究成果得到科技創(chuàng)新2030—「新一代人工智能」重大項(xiàng)目與自然科學(xué)基金項(xiàng)目的支持。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2023-03-06 13:59:38

模型參數(shù)

2023-03-13 13:24:34

智能Nature

2025-04-24 09:16:00

2025-01-13 13:00:00

AI模型訓(xùn)練

2020-11-27 10:10:52

大數(shù)據(jù)

2023-06-29 17:42:55

AI檢測(cè)

2024-06-26 13:23:59

2023-12-19 17:44:29

模型訓(xùn)練

2011-07-28 16:08:15

2024-06-11 07:40:00

2023-04-12 15:58:58

2025-02-04 19:26:41

2022-07-20 14:59:51

機(jī)器狗算法

2022-02-23 14:36:31

AI數(shù)據(jù)研究

2024-04-22 07:30:00

藥物分子模型

2023-02-06 08:55:12

學(xué)習(xí)語(yǔ)言模型

2020-11-16 10:41:29

推薦系統(tǒng)信息

2022-07-12 14:56:30

AI模型研究

2024-01-07 18:00:33

AI模型特點(diǎn)

2022-08-29 14:43:24

斯坦福大學(xué)李飛飛AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)