自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

ICLR Spotlight!清華提出時序異常檢測算法,連刷五個SOTA

人工智能 機器學(xué)習(xí) 新聞
時序數(shù)據(jù)的異常檢測是高端裝備行業(yè)的關(guān)鍵問題,清華大學(xué)軟件學(xué)院機器學(xué)習(xí)實驗室從全新的關(guān)聯(lián)差異視角分析此問題,從模型、訓(xùn)練策略、異常判據(jù)全鏈路提供了完整的解決方法,被ICLR接收為Spotlight(亮點)文章。

現(xiàn)實世界的系統(tǒng)在運行過程中會產(chǎn)生大量的時序數(shù)據(jù)。

通過這些時序數(shù)據(jù)發(fā)現(xiàn)系統(tǒng)中可能存在的異?,F(xiàn)象對于保障系統(tǒng)安全、設(shè)備平穩(wěn)運行以及避免經(jīng)濟損失都有著非常重大的意義,例如大規(guī)模服務(wù)器、地空、水電設(shè)備的監(jiān)測等。

因此,來自清華大學(xué)軟件學(xué)院的團隊重點研究了無監(jiān)督時序異常檢測問題,并被ICLR 2022接收為Spotlight。

作者:徐介暉*、吳海旭*、王建民、龍明盛

論文鏈接:
?https://openreview.net/forum?id=LzQQ89U1qm_

在實際應(yīng)用中,時序數(shù)據(jù)的異常檢測極其困難,它需要從占主導(dǎo)地位的正常數(shù)據(jù)中發(fā)掘出異常點或者異常時間模式,其中涉及兩個核心問題:

(1) 如何通過網(wǎng)絡(luò)獲取更具信息含量的表征,從而使得異常的表征不會被「淹沒」于正常數(shù)據(jù)中;

(2) 如何基于學(xué)習(xí)的表征定義更加具有區(qū)分性的判據(jù),用于篩選異常。

1. 動機

從時間序列的本質(zhì)屬性出發(fā),我們發(fā)現(xiàn)每一個時間點都可以由其與整個序列的關(guān)聯(lián)關(guān)系來表示,即表示為其在時間維度上的關(guān)聯(lián)權(quán)重分布。相比于點級別的特征,這種關(guān)聯(lián)關(guān)系暗含了序列的模式信息,比如周期、趨勢等,因此更具信息含量。

同時,與正常點相比較,異常點很難與正常模式主導(dǎo)的整個序列都建立強關(guān)聯(lián)關(guān)系,它們往往更加關(guān)注鄰近區(qū)域(由于連續(xù)性)。因此,這種與整體序列、鄰近先驗之間的關(guān)聯(lián)差異,為異常檢測提供了一個天然的、強區(qū)分度的判據(jù)。

基于以上觀察,我們提出了Anomaly Transformer模型,實現(xiàn)了基于關(guān)聯(lián)差異(Association Discrepancy)的時序異常檢測。其包含Anomaly-Attention機制用于分別建模兩種形式的關(guān)聯(lián),同時以極小極大(Minimax)關(guān)聯(lián)學(xué)習(xí)策略進一步增大正常點與異常點之間差別。

值得一提的是,在不同領(lǐng)域的5個數(shù)據(jù)集上,Anomaly Transformer都取得了SOTA的效果。

2. 方法

2.1 Anomaly Transformer

2.1.1 整體架構(gòu)

相比于標準的Transformer模型,Anomaly Transformer中在每層中都新設(shè)計了一個Anomaly-Attention單元,用于從多層次的深度特征中學(xué)習(xí)潛在的時序關(guān)聯(lián)。

整體架構(gòu)如上圖所示,Anomaly-Attention(左)同時建模了數(shù)據(jù)的先驗關(guān)聯(lián)(Prior-Association,即更關(guān)注鄰近區(qū)域的先驗)和序列關(guān)聯(lián)(Series-Association,即從數(shù)據(jù)中挖掘的依賴)。

除了序列重建任務(wù)之外,我們的模型還采用了極小極大策略(Minimax)用于進一步增大異常點和正常點所具有的關(guān)聯(lián)差異的差距,從而使得異常點能夠被更加容易的檢測出來。

2.1.2 Anomaly-Attention

為了計算關(guān)聯(lián)差異,我們提出的一種全新的注意力機制Anomaly-Attention,用于統(tǒng)一建模先驗關(guān)聯(lián)和序列關(guān)聯(lián)。

(1)先驗關(guān)聯(lián)用于表示由于時間序列連續(xù)性帶來的,每個時刻更多地關(guān)注其鄰近區(qū)域的先驗。我們采用了一個具有可學(xué)習(xí)尺度參數(shù)的高斯核函數(shù)來表示。高斯核函數(shù)的中心位于對應(yīng)時間點的索引上,由于高斯分布本身所具有的單峰分布的特性,這樣的設(shè)計能夠幫助學(xué)習(xí)到的權(quán)重天然的集中于對應(yīng)時間點的鄰域內(nèi)。同時,自適應(yīng)的尺度參數(shù)可以幫助先驗關(guān)聯(lián)動態(tài)適應(yīng)不同的時序模式。

(2)序列關(guān)聯(lián)用于表示直接從序列數(shù)據(jù)中挖掘出的依賴。其計算方式與標準Transformer的注意力矩陣計算方式類似,注意力矩陣中每一行的權(quán)重分布都對應(yīng)了一個時間點的序列關(guān)聯(lián)。同時,為了更好的完成序列重建任務(wù),模型會自動挖掘到合理的時序依賴。

通過上述設(shè)計,模型可以分別捕捉到先驗關(guān)聯(lián)和序列關(guān)聯(lián),相較于過往的模型這種基于關(guān)聯(lián)的表征蘊含著更加豐富的信息。

2.1.3 關(guān)聯(lián)差異(Association Discrepancy)

我們將關(guān)聯(lián)差異定義為這兩者之間的差異,作為后續(xù)異常檢測的判據(jù),它由各個層次的先驗關(guān)聯(lián)、序列關(guān)聯(lián)之間的對稱KL距離計算得到:

2.2 極小極大關(guān)聯(lián)學(xué)習(xí)

除了無監(jiān)督任務(wù)廣泛使用的重建誤差外,我們還引入了一個額外的關(guān)聯(lián)差異損失用于增大正常點和異常點之間的差距(如下所示)。

得益于先驗關(guān)聯(lián)的單峰特性,新增的關(guān)聯(lián)差異損失會驅(qū)使序列關(guān)聯(lián)更加關(guān)注非鄰近的區(qū)域,這會使得異常點的重建更加的艱難,進而正常點和異常點之間的辨別更加容易。

然而,在實驗中發(fā)現(xiàn),若直接最小化關(guān)聯(lián)差異將使得先驗分布中可學(xué)習(xí)的尺度參數(shù)急劇變小,造成模型退化。因此,我們使用了極小極大(Minimax)策略用于更好的控制關(guān)聯(lián)學(xué)習(xí)的過程。

(1) 在最小化階段,固定序列關(guān)聯(lián),讓先驗關(guān)聯(lián)近似,這樣可以使先驗關(guān)聯(lián)適應(yīng)不同的時序模式。

(2) 在最大化階段,固定先驗關(guān)聯(lián),優(yōu)化序列關(guān)聯(lián)以最大化關(guān)聯(lián)之間的差異,該過程可以讓序列關(guān)聯(lián)更加關(guān)注于非臨接、全局的點,從而使得異常點的重建更加困難。

最終,我們將標準化后的關(guān)聯(lián)差異與重建誤差結(jié)合起來,定義了新的異常檢測判據(jù)

3. 實驗

我們在5個標準數(shù)據(jù)集上進行了模型驗證,涵蓋服務(wù)檢測、地空探索等多個應(yīng)用。Anomaly Transformer在5個基準中均實現(xiàn)了SOTA的效果。更多基準模型及數(shù)據(jù)說明請見論文。

3.1 消融實驗

我們設(shè)計消融實驗驗證了提出的先驗關(guān)聯(lián)、訓(xùn)練策略、新的異常判據(jù)的有效性。

3.2 判據(jù)分析

針對時序異常的5種類型,我們可視化了其在不同異常判據(jù)下的區(qū)分性。可以發(fā)現(xiàn)基于關(guān)聯(lián)差異的異常評判曲線有著更加準確的可區(qū)分性。

3.3 先驗關(guān)聯(lián)分析

針對上述不同的異常類別,我們也提供了先驗關(guān)聯(lián)中學(xué)到參數(shù)的可視化。如圖所示,異常點處的相較于序列中別的點往往會比較小,這代表了它與非臨接部分的關(guān)聯(lián)較弱,這也印證了異常點很難與整個序列構(gòu)建強關(guān)聯(lián)的先驗。

4. 總結(jié)

本文關(guān)注無監(jiān)督時序異常檢測問題,提出了基于關(guān)聯(lián)差異的異常檢測模型Anomaly transformer,并通過一個極小極大(Minimax)關(guān)聯(lián)學(xué)習(xí)策略大幅提高了模型的異常檢測能力。

Anomaly transformer在服務(wù)器監(jiān)測、地空探索、水流觀測等應(yīng)用中均展現(xiàn)出了優(yōu)秀的異常檢測結(jié)果,具有很強的應(yīng)用落地價值。

責(zé)任編輯:張燕妮 來源: 新智元
相關(guān)推薦

2021-07-08 15:39:50

機器學(xué)習(xí)人工智能計算

2023-02-23 13:35:27

模型任務(wù)

2018-09-17 15:30:05

機器學(xué)習(xí)密度異常值

2024-12-24 10:30:00

2020-12-24 19:01:14

iForest大數(shù)據(jù)檢測算法

2024-04-28 11:42:39

Python模型數(shù)據(jù)

2023-03-13 13:35:00

幾何算法矩形碰撞檢測

2025-01-08 09:00:00

訓(xùn)練數(shù)據(jù)研究

2020-10-18 07:15:53

Python異常檢測算法開發(fā)

2021-12-13 16:16:42

Java開發(fā)工具

2023-07-14 07:15:13

2024-10-12 10:57:39

2025-03-21 10:08:37

2017-09-20 16:25:00

深度學(xué)習(xí)視覺領(lǐng)域計算機

2024-05-23 09:28:23

模型蛋白質(zhì)

2025-04-28 09:00:00

2025-02-25 10:04:10

2020-11-02 13:44:35

算法數(shù)據(jù)科學(xué)Python

2024-12-27 10:00:00

數(shù)據(jù)自動駕駛

2024-08-08 15:58:35

點贊
收藏

51CTO技術(shù)棧公眾號