自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

清華大學(xué)崔鵬:因果推斷技術(shù)最新的發(fā)展趨勢

原創(chuàng) 精選
人工智能 算法
近日,美團(tuán)技術(shù)團(tuán)隊(duì)特別邀請到清華大學(xué)計(jì)算機(jī)學(xué)院長聘副教授崔鵬老師,為美團(tuán)內(nèi)部同學(xué)介紹了因果推斷技術(shù)最新的發(fā)展趨勢,以及現(xiàn)階段取得的一些成果。

作者 | 求真務(wù)實(shí)的

隨著人工智能的不斷發(fā)展,安全及合規(guī)問題變得越來越重要。當(dāng)前機(jī)器學(xué)習(xí)比較大的一個(gè)局限性在于其學(xué)習(xí)模型都是基于關(guān)聯(lián)框架,這種框架存在樣本選擇偏差的問題,且其穩(wěn)定性也較差。而因果推理模型的出現(xiàn),給機(jī)器學(xué)習(xí)打開了一個(gè)新的思路。

近日,美團(tuán)技術(shù)團(tuán)隊(duì)特別邀請到清華大學(xué)計(jì)算機(jī)學(xué)院長聘副教授崔鵬老師,為美團(tuán)內(nèi)部同學(xué)介紹了因果推斷技術(shù)最新的發(fā)展趨勢,以及現(xiàn)階段取得的一些成果。本文系崔鵬老師分享內(nèi)容的文字實(shí)錄整理,希望能對大家有所幫助或者啟發(fā)。

崔鵬,清華大學(xué)計(jì)算機(jī)系長聘副教授,博士生導(dǎo)師

研究興趣聚焦于大數(shù)據(jù)驅(qū)動(dòng)的因果推理和穩(wěn)定預(yù)測、大規(guī)模網(wǎng)絡(luò)表征學(xué)習(xí)等。在數(shù)據(jù)挖掘及人工智能領(lǐng)域頂級國際會議發(fā)表論文100余篇,先后5次獲得頂級國際會議或期刊論文獎(jiǎng),并先后兩次入選數(shù)據(jù)挖掘領(lǐng)域頂級國際會議KDD最佳論文專刊。擔(dān)任IEEE TKDE、ACM TOMM、ACM TIST、IEEE TBD等國際頂級期刊編委。曾獲得國家自然科學(xué)二等獎(jiǎng)、教育部自然科學(xué)一等獎(jiǎng)、電子學(xué)會自然科學(xué)一等獎(jiǎng)、北京市科技進(jìn)步一等獎(jiǎng)、中國計(jì)算機(jī)學(xué)會青年科學(xué)家獎(jiǎng)、國際計(jì)算機(jī)協(xié)會(ACM)杰出科學(xué)家。

背景

人工智能在很多風(fēng)險(xiǎn)敏感的領(lǐng)域有越來越廣泛的應(yīng)用,包括互聯(lián)網(wǎng)、醫(yī)療、司法、生產(chǎn)、金融科技等等。風(fēng)險(xiǎn)不僅來自場景本身,也來自越來越嚴(yán)格的法律和監(jiān)管。因此,人工智能技術(shù)所帶來的風(fēng)險(xiǎn)值得重視。對人工智能風(fēng)險(xiǎn)的防控,可謂“只知其然,不知其所以然”。大家知道怎樣去做預(yù)測,但很難去回答“Why”,比如為什么要做這樣的決策?什么時(shí)候可以相信系統(tǒng)的判斷?很多問題的模型我們都無法給出一個(gè)相對準(zhǔn)確的答案。這樣的話,就會帶來一系列的問題。首先是不可解釋性,這也導(dǎo)致了“人機(jī)協(xié)同”模式很難在現(xiàn)實(shí)世界中落地,比如人工智能技術(shù)很難應(yīng)用于醫(yī)療行業(yè),因?yàn)獒t(yī)生不知道系統(tǒng)判斷的依據(jù)是什么,所以目前人工智能技術(shù)在落地時(shí)有很大的局限性。第二,當(dāng)前主流的人工智能方法基于獨(dú)立同分布的假設(shè),這要求模型的訓(xùn)練集數(shù)據(jù)和測試集數(shù)據(jù)來自同一分布,而在實(shí)際應(yīng)用中,很難保證模型會被應(yīng)用于什么樣的數(shù)據(jù)中,因?yàn)槟P妥罱K的性能取決于訓(xùn)練集和測試集分布的擬合度有多高。第三,人工智能技術(shù)在應(yīng)用于社會性問題時(shí)會引入公平性風(fēng)險(xiǎn),比如在美國,收入、教育等背景完全一致的兩個(gè)人,系統(tǒng)判斷黑人的犯罪率可能是白人的十倍。最后是不可回溯性,無法通過調(diào)整輸入來獲取想要的輸出,因?yàn)橥评砗皖A(yù)測的過程是不可回溯的。

圖 1

而出現(xiàn)以上問題的主要根源在于:當(dāng)前人工智能是基于關(guān)聯(lián)的框架。在基于關(guān)聯(lián)的框架下,可以得出收入-犯罪率和膚色-犯罪率都是強(qiáng)關(guān)聯(lián)關(guān)系。而在基于因果的框架下,當(dāng)我們需要判斷某個(gè)變量T對輸出Y是否有因果效果時(shí),不是直接度量T和Y的關(guān)聯(lián)關(guān)系,而是在控制住X的情況下去看T和Y之間的關(guān)聯(lián)關(guān)系。比如,在兩組對照組中X(收入水平)是分布是一樣的(要么都有錢,要么都沒錢),然后再通過調(diào)整T(膚色)去觀察兩組的Y(犯罪率)是否會有顯著的差異,然后我們會發(fā)現(xiàn)黑人和白人的犯罪率并沒有顯著性的差異。那么,為什么在基于關(guān)聯(lián)的框架中會得出膚色與犯罪率是強(qiáng)關(guān)聯(lián)關(guān)系呢?這是因?yàn)榇蟛糠趾谌说氖杖攵急容^低,從而導(dǎo)致整體的犯罪率偏高,但這并不是由膚色導(dǎo)致的。

圖 2

究其根本,問題并不是出在關(guān)聯(lián)模型上,而是出在如何使用機(jī)器學(xué)習(xí)的方式上。總的來說,產(chǎn)生關(guān)聯(lián)一共有三種方式,第一種是因果機(jī)制,因果關(guān)系是穩(wěn)定、可解釋且可回溯的。第二種是混淆效應(yīng),如果X同時(shí)導(dǎo)致了T和Y,T和Y之間就會產(chǎn)生虛假關(guān)聯(lián)。第三種是樣本選擇偏差。比如在狗和草地的案例中,當(dāng)更換了沙灘環(huán)境之后,模型無法識別出狗,這是由于我們選擇了大量草地環(huán)境下的狗作為樣本,所以模型會認(rèn)為狗和草地之間存在關(guān)聯(lián)關(guān)系,這也是一種虛假關(guān)聯(lián)。

在以上三種方式中,除了因果關(guān)系產(chǎn)生的關(guān)聯(lián)關(guān)系是靠譜的,其他兩種方式產(chǎn)生的關(guān)聯(lián)都不太靠譜。但目前的機(jī)器學(xué)習(xí)領(lǐng)域并沒有區(qū)分這三種產(chǎn)生關(guān)聯(lián)的方式,其中存在著很多的虛假關(guān)聯(lián),這就導(dǎo)致了模型的可解釋性、穩(wěn)定性、公平性、可回溯性都存在一定的問題。如果想要從根本上突破當(dāng)前機(jī)器學(xué)習(xí)的局限性,就需要用一種更嚴(yán)格的統(tǒng)計(jì)邏輯,比如使用因果統(tǒng)計(jì)去替代原來的關(guān)聯(lián)統(tǒng)計(jì)。

圖 3

把因果推理應(yīng)用到機(jī)器學(xué)習(xí)層面面臨著很多挑戰(zhàn),因?yàn)橐蚬评碓狙芯康姆秶饕窃诮y(tǒng)計(jì)領(lǐng)域(包括哲學(xué)領(lǐng)域),這些領(lǐng)域所面向的環(huán)境都是小數(shù)據(jù)的控制環(huán)境,整個(gè)數(shù)據(jù)的產(chǎn)生過程是可控的。比如一個(gè)檢測疫苗是否有效的行為學(xué)實(shí)驗(yàn),我們可以控制哪些人打疫苗,哪些人不打疫苗。但是在機(jī)器學(xué)習(xí)中,數(shù)據(jù)的產(chǎn)生過程是不可控的。在一個(gè)大數(shù)據(jù)的觀測研究中,我們需要考慮大數(shù)據(jù)的高維、高噪聲、弱先驗(yàn)性等因素,數(shù)據(jù)的產(chǎn)生過程是不可知的,這些對傳統(tǒng)的因果推理框架都帶來了非常大的挑戰(zhàn)。另外,因果推理和機(jī)器學(xué)習(xí)的目標(biāo)也存在很大的區(qū)別:因果推理需要去理解數(shù)據(jù)的產(chǎn)生機(jī)制,而機(jī)器學(xué)習(xí)(包括在互聯(lián)網(wǎng)領(lǐng)域的很多的應(yīng)用)主要是去預(yù)知未來到底會發(fā)生什么樣的變化。

圖 4

那么,怎樣去彌合因果推理和機(jī)器學(xué)習(xí)之間的鴻溝呢?我們提出了一個(gè)因果啟發(fā)的學(xué)習(xí)推理和決策評估的一套方法體系。第一個(gè)要解決的問題是如何在大規(guī)模數(shù)據(jù)中識別出其中的因果結(jié)構(gòu)。第二個(gè)要解決的問題是在有了因果結(jié)構(gòu)后怎樣去和機(jī)器學(xué)習(xí)做融合,現(xiàn)在的因果啟發(fā)的穩(wěn)定學(xué)習(xí)模型、公平無偏見的學(xué)習(xí)模型都是以此為目標(biāo)。第三個(gè)要解決的問題是從預(yù)測問題進(jìn)一步到設(shè)計(jì)決策機(jī)制,怎樣利用這些因果結(jié)構(gòu)去幫助我們做決策上的優(yōu)化,也就是反事實(shí)推理和決策優(yōu)化機(jī)制。

因果推理的兩個(gè)基本范式

結(jié)構(gòu)因果模型

圖 5

因果推理有兩個(gè)基本范式。第一種范式是結(jié)構(gòu)因果模型(Structure Causal Model),這個(gè)框架的核心是怎樣在一個(gè)已知的因果圖中去做推理。比如怎樣去識別其中的任意一個(gè)變量,這個(gè)變量對另一個(gè)變量的影響程度是多少。目前已有較為成熟的判斷準(zhǔn)則如后門準(zhǔn)則(Back Door)、前門準(zhǔn)則(Front Door)等去除其中的混淆,通過Do-Calculus方式進(jìn)行因果估計(jì)(Causal Estimation)。目前這種方法面對的核心問題是我們無法在做觀測研究時(shí)定義因果圖,雖然在一些領(lǐng)域(比如考古)可以通過專家知識來定義因果圖,但這就又走到了“專家系統(tǒng)”的老路上??偟膩碚f,核心問題還是怎樣去發(fā)現(xiàn)因果結(jié)構(gòu)。

圖 6

這里有一個(gè)衍生技術(shù)是因果發(fā)現(xiàn)(Causal Discovery),可以基于條件獨(dú)立性檢測和現(xiàn)有的數(shù)據(jù)去定義因果圖,使用現(xiàn)有的變量去頻繁地做條件獨(dú)立性等一系列的獨(dú)立性判斷來定義因果圖,這是一個(gè)NP問題,可能會出現(xiàn)組合爆炸的問題。這是結(jié)構(gòu)因果模型應(yīng)用于大規(guī)模數(shù)據(jù)時(shí)所面臨的一個(gè)瓶頸,最近也有一些研究比如使用可微分因果發(fā)現(xiàn)去解決這個(gè)問題。

潛在結(jié)果框架

第二種范式是潛在結(jié)果框架(Potential Outcome Framework),這個(gè)框架的核心是不需要知道所有變量的因果結(jié)構(gòu),而只需要知道其中一個(gè)變量對于輸出是否有因果影響,對于其他變量之間的影響不在意,但我們需要知道這個(gè)變量和輸出之間有哪些干擾因素(Confounders),并假設(shè)其中所有的干擾因素都已經(jīng)被觀測到。

圖 7

以上就是一些背景知識和理論方面的介紹。接下來,主要講一下我們最近的一些思考和嘗試,以及如何把這兩個(gè)范式結(jié)合到具體的問題中去。

可微分因果發(fā)現(xiàn)以及在推薦系統(tǒng)中的應(yīng)用

因果發(fā)現(xiàn)和問題定義

因果發(fā)現(xiàn)的定義是對于給定的一組樣本,其中每個(gè)樣本都由一些變量去表征,我們希望通過一些可觀測數(shù)據(jù)去找到這些變量之間的因果結(jié)構(gòu)。找到的因果圖,可以認(rèn)為是一個(gè)圖模型,從生成式模型的角度來講,我們希望找到一個(gè)因果圖使得它能夠按照其中的因果結(jié)構(gòu)去生成這樣的一組樣本,這組樣本的似然性是最高的。

圖 8

這里引入一個(gè)叫做Functional Causal Model(FCMs)的概念,所謂的FCM就是,對于某一類變量X,由于因果圖是一個(gè)有向無環(huán)圖(DAG),這個(gè)變量一定有它的父節(jié)點(diǎn),那它的值一定是由它所有的父節(jié)點(diǎn)通過一個(gè)函數(shù)的作用再加上噪聲來生成的。比如在線性框架下,這個(gè)問題就變成:怎樣找到一組W,使得X的重構(gòu)是最優(yōu)的。有向無環(huán)圖的優(yōu)化一直是一個(gè)開放性問題,2018年的一篇論文[1]提出來了一個(gè)優(yōu)化方法:可以在全空間的有向無環(huán)圖內(nèi)去做梯度優(yōu)化,通過增加DAG限制和稀疏限制(l1或l2正則),使得最終X的重構(gòu)誤差最小。

圖 9

圖 10

我們在具體實(shí)施這個(gè)框架時(shí)發(fā)現(xiàn)了一些問題,這個(gè)框架的基本假設(shè)是所有變量的噪聲必須是高斯分布,且噪聲的規(guī)模應(yīng)該差不多,如果不滿足這個(gè)假設(shè)就會出現(xiàn)一些問題,比方說擁有最小重構(gòu)誤差的結(jié)構(gòu)可能并不是真實(shí)值(Ground Truth),這是可微分因果發(fā)現(xiàn)方法的一個(gè)局限性。我們可以通過施加一個(gè)獨(dú)立性限制去解決這個(gè)問題,把獨(dú)立性判斷準(zhǔn)則轉(zhuǎn)化為可優(yōu)化的形式去進(jìn)行優(yōu)化。具體的實(shí)現(xiàn)細(xì)節(jié)在這里不再贅述,感興趣的同學(xué)可以閱讀論文[2]。

可微分因果發(fā)現(xiàn)在推薦系統(tǒng)中的應(yīng)用

整個(gè)推薦系統(tǒng)存在I.I.D(Independent and Identically Distributed, 獨(dú)立同分布)的假設(shè),也就是說用戶和物品的訓(xùn)練集、測試集需要來自同一個(gè)分布,但實(shí)際上推薦系統(tǒng)中存在各種各樣的OOD(Out Of Distribution, 分布外)問題。第一種是自然偏移(Natural Shift),比如基于北京、上海的數(shù)據(jù)訓(xùn)練得到的模型,在面向重慶的用戶時(shí)就不一定有效。第二種是由推薦系統(tǒng)機(jī)制引起的非自然偏移(Artificial Shift)。我們希望能提出一種比較通用的方式,去抵抗推薦系統(tǒng)中存在的各種OOD問題或者偏差問題的推薦算法。針對這個(gè)問題,我們也做了一些研究工作[3]。在OOD推薦系統(tǒng)中存在一個(gè)不變性假設(shè)——一個(gè)人看到了一個(gè)商品后是否購買是不會隨著環(huán)境變化而改變的。因此只要保證用戶對物品的偏好不變,就可以使得這樣的不變性假設(shè)成立,從而給出比較合理的推薦結(jié)果,這是解決OOD問題的核心。

圖 11

如何保證用戶偏好是不變的?有一個(gè)基本共識是,不變性和因果關(guān)系是存在某種等價(jià)性的轉(zhuǎn)化關(guān)系的。如果可以保證一個(gè)結(jié)構(gòu)在各種各樣的環(huán)境下都具有同等的預(yù)測效應(yīng),那么這個(gè)結(jié)構(gòu)一定是一個(gè)因果結(jié)構(gòu),而且一個(gè)因果結(jié)構(gòu)在各種環(huán)境下的性能都是相對穩(wěn)定的。因此,找到不變的用戶偏好,就轉(zhuǎn)化為一個(gè)因果偏好學(xué)習(xí)的問題。在推薦系統(tǒng)中有一個(gè)特殊的結(jié)構(gòu)叫做二部圖,我們需要基于這樣的特殊結(jié)構(gòu)去設(shè)計(jì)因果發(fā)現(xiàn)的方法。在這個(gè)最終學(xué)到的模型中,只需要輸入用戶的表征,就可以知道這個(gè)用戶會喜歡什么樣的物品。

圖 12

圖 13

很顯然,這種方法對于提升推薦系統(tǒng)的可解釋性、透明性以及穩(wěn)定性都會一定的好處,我們也和很多的方法進(jìn)行了對比,可以看到,它都有比較明顯的性能提升。

關(guān)于OOD泛化和穩(wěn)定學(xué)習(xí)的一些思考

OOD問題是機(jī)器學(xué)習(xí)中一個(gè)非常基本的問題,之前做的基本上都是基于I.I.D.的假設(shè),雖然遷移學(xué)習(xí)做了自適應(yīng),但因?yàn)檫w移學(xué)習(xí)假設(shè)測試集是已知的,所以它的主體還是I.I.D.的理論框架。我們從2018年開始在OOD這個(gè)方向做了一些研究,首先,OOD的定義是訓(xùn)練集和測試集不是來自同一個(gè)分布,如果訓(xùn)練集和測試集來自同一個(gè)分布那么就是I.I.D.。OOD又可分為兩種情況,如果測試集的分布是已知或部分已知的,就是OOD Adaptation,也就是遷移學(xué)習(xí)/領(lǐng)域自適應(yīng)。如果測試集的分布未知,才是真正的OOD泛化問題。這里的“泛化”和機(jī)器學(xué)習(xí)中的“泛化”概念有所不同。機(jī)器學(xué)習(xí)中的“泛化”更多的是在談內(nèi)插問題,訓(xùn)練數(shù)據(jù)內(nèi)部的插值問題都是“內(nèi)插”問題,如果要對超出了插值域的X進(jìn)行預(yù)測就是“外插”問題?!巴獠濉笔且患容^危險(xiǎn)的事情,在什么情況下可以做“外插”呢?如果能夠找到其中的不變性(invariance),就可以做“外插”這件事情。以前在做機(jī)器學(xué)習(xí)的時(shí)候,都是在做I.I.D.也就是數(shù)據(jù)擬合,只需要防止過擬合/欠擬合就好了。而現(xiàn)在如果要解決OOD問題,就要找到其中的不變性。找到不變性有兩個(gè)路徑,第一個(gè)路徑是因果推斷,因果關(guān)系和不變性之間存在等價(jià)性,也就是說只要找到了因果結(jié)構(gòu)就可以保證不變性,實(shí)際上因果推斷本身就是關(guān)于不變性的科學(xué)。穩(wěn)定學(xué)習(xí),在某種程度上就是希望模型在做學(xué)習(xí)和預(yù)測時(shí)是基于因果推斷的。我們發(fā)現(xiàn),通過對樣本進(jìn)行重加權(quán)就可以使得所有的變量變得獨(dú)立,使得一個(gè)基于關(guān)聯(lián)的模型變成基于因果的模型,大家如果感興趣的話,可以去看看相關(guān)的論文。第二個(gè)路徑是從差異性中找到不變性。在統(tǒng)計(jì)中有一個(gè)概念是異質(zhì)性,比方說一個(gè)狗的分布有兩個(gè)峰,一個(gè)峰是沙灘上的狗,一個(gè)峰是草地上的狗,既然這兩個(gè)峰都代表狗,那么其中一定存在著不變性,不變的那部分就具有OOD泛化能力。數(shù)據(jù)的異質(zhì)性是不能被預(yù)定義的,我們希望通過數(shù)據(jù)驅(qū)動(dòng)的方式去找到其中隱含的異質(zhì)性,在隱含的異質(zhì)性中找到其中的不變性,而這二者的學(xué)習(xí)是互相促進(jìn)的。

圖 14

所謂的穩(wěn)定學(xué)習(xí),就是使用一種分布的訓(xùn)練集和多種不同的未知分布的測試集,優(yōu)化的目標(biāo)是最小化準(zhǔn)確率的方差。也就是說假設(shè)有一個(gè)訓(xùn)練分布,它內(nèi)在具有一定的異質(zhì)性,但沒有對它的異質(zhì)性進(jìn)行人為的劃分,在這種情況下我們希望學(xué)出一個(gè)能夠在各種未知分布下有較好性能表現(xiàn)的模型。我們在去年寫了一篇關(guān)于OOD泛化的Survery[4],對這個(gè)問題做了比較系統(tǒng)的分析,感興趣的同學(xué)可以進(jìn)行參考。

責(zé)任編輯:張燕妮 來源: 美團(tuán)技術(shù)團(tuán)隊(duì)
相關(guān)推薦

2023-05-04 07:39:33

2010-12-13 16:58:53

綜合布線測試

2010-08-31 10:46:20

2021-08-26 20:18:56

區(qū)塊鏈區(qū)塊鏈技術(shù)

2009-11-02 15:54:49

無線接入技術(shù)

2009-04-27 15:40:53

Linux技術(shù)熱點(diǎn)發(fā)展趨勢

2024-01-11 15:27:53

人工智能數(shù)字孿生量子計(jì)算

2016-05-13 15:13:02

平安城市

2024-12-09 00:00:06

2022-08-10 11:10:35

AR數(shù)字信息

2019-12-20 10:33:38

云計(jì)算IT技術(shù)物聯(lián)網(wǎng)

2009-10-29 17:36:20

無線接入技術(shù)

2009-12-27 21:53:33

中國機(jī)柜技術(shù)發(fā)展趨勢

2020-08-25 10:11:04

云原生運(yùn)維容器

2020-06-28 10:26:38

網(wǎng)絡(luò)安全網(wǎng)絡(luò)犯罪安全技術(shù)

2013-09-27 17:29:16

清華大學(xué)IT運(yùn)維RIIL

2023-04-17 19:12:19

2023-12-11 10:29:11

自動(dòng)駕駛系統(tǒng)

2011-10-26 10:57:56

EqualLogic戴爾存儲

2009-10-29 11:31:28

光纖接入技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號