自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

ICLR 2024 Oral | 應(yīng)對(duì)隨時(shí)間變化的分布偏移,西安大略大學(xué)等提出學(xué)習(xí)時(shí)序軌跡方法

人工智能 新聞
我們提出了一種新的方法 SDE-EDG,它通過(guò)連續(xù)插值樣本收集數(shù)據(jù)分布的無(wú)限細(xì)分網(wǎng)格演變軌跡(IFGET),以克服過(guò)擬合的問(wèn)題。

本文作者曾秋皓,加拿大西安大略大學(xué)計(jì)算機(jī)系博士研究生,本科畢業(yè)于哈爾濱工業(yè)大學(xué),碩士畢業(yè)于新加坡國(guó)立大學(xué)。在王博予教授和凌曉峰院士的指導(dǎo)下,博士期間主要圍繞隨時(shí)間變化的分布的問(wèn)題展開(kāi)理論、方法和應(yīng)用的研究。目前已在 ICLR/AAAI/IEEE TNNLS 發(fā)表多篇學(xué)術(shù)論文。

個(gè)人主頁(yè):https://hardworkingpearl.github.io/

在現(xiàn)實(shí)世界的機(jī)器學(xué)習(xí)應(yīng)用中,隨時(shí)間變化的分布偏移是常見(jiàn)的問(wèn)題。這種情況被構(gòu)建為時(shí)變域泛化(EDG),目標(biāo)是通過(guò)學(xué)習(xí)跨領(lǐng)域的潛在演變模式,并利用這些模式,使模型能夠在時(shí)間變化系統(tǒng)中對(duì)未見(jiàn)目標(biāo)域進(jìn)行良好的泛化。然而,由于 EDG 數(shù)據(jù)集中時(shí)間戳的數(shù)量有限,現(xiàn)有方法在捕獲演變動(dòng)態(tài)和避免對(duì)稀疏時(shí)間戳的過(guò)擬合方面遇到了挑戰(zhàn),這限制了它們對(duì)新任務(wù)的泛化和適應(yīng)性。

為了解決這個(gè)問(wèn)題,我們提出了一種新的方法 SDE-EDG,它通過(guò)連續(xù)插值樣本收集數(shù)據(jù)分布的無(wú)限細(xì)分網(wǎng)格演變軌跡(IFGET),以克服過(guò)擬合的問(wèn)題。此外,通過(guò)利用隨機(jī)微分方程(SDEs)捕獲連續(xù)軌跡的固有能力,我們提出了將 SDE 建模的軌跡通過(guò)最大似然估計(jì)與 IFGET 的軌跡對(duì)齊,從而實(shí)現(xiàn)捕獲分布演變趨勢(shì)。

圖片

  • 論文標(biāo)題:Latent Trajectory Learning for Limited Timestamps under Distribution Shift over Time
  • 論文鏈接:https://openreview.net/pdf?id=bTMMNT7IdW
  • 項(xiàng)目鏈接:https://github.com/HardworkingPearl/SDE-EDG-iclr2024

方法

核心思想

為了克服這一挑戰(zhàn),SDE-EDG 提出了一種新穎的方法,通過(guò)構(gòu)建無(wú)限細(xì)分網(wǎng)格演變軌跡(Infinitely Fined-Grid Evolving Trajectory, IFGET),在潛在表示空間中創(chuàng)建連續(xù)插值樣本,以彌合時(shí)間戳之間的間隔。此外,SDE-EDG 利用隨機(jī)微分方程(Stochastic Differential Equations, SDEs)的內(nèi)在能力來(lái)捕捉連續(xù)的軌跡動(dòng)態(tài),通過(guò)路徑對(duì)齊正則化器將 SDE 建模的軌跡與 IFGET 對(duì)齊,從而實(shí)現(xiàn)跨域捕獲演變分布趨勢(shì)。

方法細(xì)節(jié)

1. 構(gòu)建 IFGET:

首先,SDE-EDG 在潛在表示空間中為每個(gè)樣本建立樣本到樣本的對(duì)應(yīng)關(guān)系,收集每個(gè)個(gè)體樣本的演變軌跡。對(duì)于圖片時(shí)刻的每個(gè)類別 k 的任一樣本圖片,我們搜索圖片時(shí)刻在特征空間離其最近的圖片為其在圖片的對(duì)應(yīng)樣本:

圖片

這里圖片是計(jì)算兩個(gè)向量之間的距離,圖片是從下個(gè)領(lǐng)域圖片采樣的圖片個(gè)樣本的集合。

然后,利用這種對(duì)應(yīng)關(guān)系生成連續(xù)插值樣本,旨在連接時(shí)間戳間隔之間的時(shí)間間隙,避免對(duì)稀疏時(shí)間戳的過(guò)擬合,

圖片

這里圖片采樣自 Beta 分布。通過(guò)收集通過(guò)以上方式產(chǎn)生的樣本的時(shí)序軌跡圖片,我們得到 IFGET。

2. 使用 SDE 建模軌跡:

SDE-EDG 采用神經(jīng) SDE 來(lái)模擬數(shù)據(jù)在潛在空間中的連續(xù)時(shí)間軌跡。與傳統(tǒng)的基于離散時(shí)間戳的模型不同, SDE 天然適合于模擬連續(xù)的時(shí)間軌跡。SDE-EDG 建模了時(shí)序軌跡,可以通過(guò)圖片時(shí)刻的樣本預(yù)測(cè)任意未來(lái)時(shí)刻圖片的樣本:

圖片

這里特征空間變量圖片是由圖片時(shí)刻的樣本預(yù)測(cè)得到,圖片是 drift function,圖片是 diffusion function。

3. 路徑對(duì)齊與最大似然估計(jì):

SDE-EDG 通過(guò)最大化 IFGET 的似然估計(jì)來(lái)訓(xùn)練模型,

圖片

最終訓(xùn)練函數(shù)是圖片,第一項(xiàng)是預(yù)測(cè)分類任務(wù)誤差損失函數(shù)。

4. 實(shí)驗(yàn)

  • 下表展示了 SDE-EDG 與其他基線方法在多個(gè)數(shù)據(jù)集上分類準(zhǔn)確率的比較。這些數(shù)據(jù)集包括 Rotated Gaussian (RG), Circle (Cir), Rotated MNIST (RM), Portraits (Por), Caltran (Cal), PowerSupply (PS), 和 Ocular Disease (OD)。結(jié)果顯示,SDE-EDG 在所有數(shù)據(jù)集上的平均準(zhǔn)確率均優(yōu)于其他方法。

圖片


  • 下圖提供了一個(gè)直觀的比較,展示了 SDE-EDG 算法(左)與傳統(tǒng) DG 方法 IRM(右)在特征表示方面的差異。通過(guò)數(shù)據(jù)特征空間的可視化,我們可以觀察到 SDE-EDG 學(xué)習(xí)到的特征表示具有明顯的決策邊界,其中不同類別的數(shù)據(jù)點(diǎn)被清晰地區(qū)分開(kāi)來(lái),以不同形狀表示,并且不同域的數(shù)據(jù)以彩虹條的顏色區(qū)分。這表明 SDE-EDG 能夠成功捕捉數(shù)據(jù)隨時(shí)間演變的動(dòng)態(tài),并在特征空間中保持類別的可分性。相比之下,IRM 的特征表示則傾向于將數(shù)據(jù)點(diǎn)坍縮到單一方向,導(dǎo)致決策邊界不明顯,這反映出 IRM 在捕捉時(shí)變分布趨勢(shì)方面的不足。

  • 下圖通過(guò)一系列子圖深入展示了 SDE-EDG 算法在捕捉數(shù)據(jù)隨時(shí)間演變的能力方面的優(yōu)勢(shì)。子圖 (a) 提供了 Sine 數(shù)據(jù)集的真實(shí)標(biāo)簽分布,其中正例和負(fù)例用不同顏色的點(diǎn)表示,為后續(xù)的比較提供了基準(zhǔn)。接著,子圖 (b) 和 (c) 分別展示了基于 ERM 的傳統(tǒng)方法和 SDE-EDG 算法對(duì)同一數(shù)據(jù)集的預(yù)測(cè)結(jié)果,通過(guò)對(duì)比可以看出 SDE-EDG 在捕捉數(shù)據(jù)演變模式上的明顯優(yōu)勢(shì)。子圖 (d) 和 (e) 進(jìn)一步揭示了 SDE-EDG 學(xué)習(xí)到的演變路徑,其中 (d) 展示了應(yīng)用了路徑對(duì)齊損失(最大似然損失函數(shù))后的路徑,而 (e) 展示了未應(yīng)用該損失時(shí)的路徑。通過(guò)這一對(duì)比,可以直觀地看到路徑對(duì)齊損失對(duì)于確保模型能夠正確捕捉和表征數(shù)據(jù)隨時(shí)間變化的重要性。

圖片

  • 下圖子圖 (a) 展示了在 Portraits 數(shù)據(jù)集上,使用不同算法進(jìn)行訓(xùn)練時(shí)的準(zhǔn)確率收斂軌跡。這個(gè)子圖提供了一個(gè)直觀的視角,用以比較 SDE-EDG 算法與其他基線方法(如 ERM、MLDG、GI)在訓(xùn)練過(guò)程中性能的變化情況。通過(guò)觀察訓(xùn)練準(zhǔn)確率隨時(shí)間推移的增長(zhǎng)趨勢(shì),我們可以評(píng)估不同算法的學(xué)習(xí)能力和收斂速度。SDE-EDG 算法的收斂軌跡尤其值得關(guān)注,因?yàn)樗沂玖嗽撍惴ㄔ谶m應(yīng)不斷演變的數(shù)據(jù)分布時(shí)的效率和穩(wěn)定性。

    下圖子圖 (b) 和 (c) 分別展示了 RMNIST 和 Circle 數(shù)據(jù)集上,SDE-EDG 算法在這些數(shù)據(jù)集上的表現(xiàn)顯示出其在處理時(shí)變分布時(shí)的優(yōu)越性,即使在面對(duì)較大時(shí)間跨度的目標(biāo)域時(shí),也能保持較高的準(zhǔn)確率,這表明了 SDE-EDG 算法在捕捉和適應(yīng)數(shù)據(jù)演變模式方面的強(qiáng)大能力。

    下圖子圖 (d) 和 (e) 探討了最大似然損失(Maximum Likelihood Loss)在 RMNIST 和 PowerSupply 數(shù)據(jù)集上對(duì) SDE-EDG 性能的影響。通過(guò)改變正則化權(quán)重 α 的值,這兩個(gè)子圖展示了不同 α 設(shè)置對(duì)模型性能的具體影響。實(shí)驗(yàn)結(jié)果表明,適當(dāng)?shù)?α 值可以顯著提高 SDE-EDG 在特定數(shù)據(jù)集上的性能,這強(qiáng)調(diào)了在實(shí)際應(yīng)用中根據(jù)數(shù)據(jù)集特性和任務(wù)需求調(diào)整超參數(shù)的重要性。

結(jié)論

論文作者提出了一種新的 SDE-EDG 方法,用于建模時(shí)變域泛化(EDG)問(wèn)題。方法涉及通過(guò)識(shí)別樣本到樣本的對(duì)應(yīng)關(guān)系并生成連續(xù)插值樣本來(lái)構(gòu)建 IFGET。隨后,作者采用隨機(jī)微分方程(SDE)并將其與 IFGET 對(duì)齊進(jìn)行訓(xùn)練。文章的貢獻(xiàn)在于揭示了通過(guò)收集個(gè)體的時(shí)間軌跡來(lái)捕獲演變模式的重要性,以及在時(shí)間間隔之間進(jìn)行插值以減輕源時(shí)間戳數(shù)量有限的問(wèn)題,這有效地防止了 SDE-EDG 對(duì)有限時(shí)間戳的過(guò)擬合。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-03-21 10:08:37

2024-12-26 15:30:00

模型深度學(xué)習(xí)AI

2025-03-18 09:33:13

2024-11-21 13:40:00

AI數(shù)據(jù)

2025-02-25 10:04:10

2024-05-23 09:28:23

模型蛋白質(zhì)

2024-01-18 15:18:48

數(shù)據(jù)模型

2022-03-07 10:04:09

機(jī)器學(xué)習(xí)訓(xùn)練模型

2024-02-04 13:43:49

模型訓(xùn)練

2024-07-19 10:39:38

2025-02-27 14:10:00

模型AI訓(xùn)練

2023-06-13 10:27:58

2024-04-07 07:40:00

2024-12-30 07:11:00

大型視覺(jué)語(yǔ)言模型VLMs人工智能

2017-11-29 15:21:35

數(shù)字貿(mào)易

2025-02-21 09:35:00

3DAI生成

2021-07-08 15:39:50

機(jī)器學(xué)習(xí)人工智能計(jì)算

2022-04-01 15:30:18

語(yǔ)言模型自然語(yǔ)言AI

2025-04-03 08:40:00

自動(dòng)駕駛AI模型

2025-04-02 09:35:00

模型AI訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)