自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法

發(fā)布于 2024-11-26 14:55
瀏覽
0收藏

在現(xiàn)實(shí)世界中,觀測到的時(shí)間序列通常表現(xiàn)出復(fù)雜多樣的多尺度時(shí)間模式。盡管基于Transformer的方法在多尺度時(shí)間模式交互建模中取得了顯著成功,但是兩個(gè)關(guān)鍵問題限制了其在時(shí)間序列預(yù)測中的進(jìn)一步發(fā)展。一方面,單個(gè)的時(shí)間點(diǎn)包含的語義信息較少,利用attention建模pair-wise交互會(huì)造成信息利用瓶頸。另一方面,時(shí)間模式中存在多種固有的時(shí)序變化,這些時(shí)序變化相互糾纏,為建模多尺度時(shí)間模式交互帶來了較大的挑戰(zhàn)。

針對(duì)上述問題,本文介紹一篇來自浙大研究團(tuán)隊(duì)的最新相關(guān)研究工作,該工作目前已被NeurIPS2024接收。作者提出了一種基于自適應(yīng)多尺度超圖Transformer的框架(Ada-MSHyper),用于時(shí)間序列預(yù)測。具體而言,作者通過設(shè)計(jì)自適應(yīng)超圖學(xué)習(xí)模塊,為建模group-wise交互提供基礎(chǔ)。然后通過設(shè)計(jì)多尺度交互模塊,賦予Transformer建模不同尺度時(shí)間模式間group-wise交互的能力。此外作者還引入了節(jié)點(diǎn)和超邊約束機(jī)制,用于聚集具有相似語義信息的節(jié)點(diǎn),并區(qū)分每個(gè)尺度內(nèi)的時(shí)序變化。在11個(gè)真實(shí)世界數(shù)據(jù)集上的結(jié)果顯示,Ada-MSHyper達(dá)到了SOTA效果。

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

論文標(biāo)題:Ada-MSHyper: Adaptive Multi-Scale Hypergraph Transformer for Time Series Forecasting

下載地址:??https://arxiv.org/pdf/2410.23992??

1.研究背景

時(shí)間序列預(yù)測在眾多領(lǐng)域中展現(xiàn)了其廣泛的應(yīng)用價(jià)值,例如能源消耗規(guī)劃、交通與經(jīng)濟(jì)預(yù)測,以及疾病傳播預(yù)測等。在這些實(shí)際應(yīng)用中,觀測到的時(shí)間序列通常表現(xiàn)出復(fù)雜多樣的多尺度時(shí)間模式。例如,由于周期性的人類活動(dòng),交通流量和電力消耗會(huì)呈現(xiàn)出顯著的天模式、周模式以及月模式。

得益于建模pair-wise交互以及提取序列多尺度表示的能力,Transformer被廣泛應(yīng)用到時(shí)間序列預(yù)測中。雖然基于Transformer的方法在多尺度時(shí)間模式交互建模中取得了顯著成功,但是兩個(gè)關(guān)鍵問題限制了Transformer在時(shí)間序列預(yù)測中的進(jìn)一步發(fā)展。

語義信息稀疏性:不同于自然語言處理和計(jì)算機(jī)視覺,時(shí)間序列中單個(gè)的時(shí)間點(diǎn)包含較少的語義信息。為了解決語義信息稀疏性的問題,之前的方法通過劃分Path或者預(yù)定義超圖結(jié)構(gòu)的方法增強(qiáng)局部信息并建模group-wise交互,但是簡單劃分Patch或者預(yù)定義的超圖結(jié)構(gòu)容易引入噪聲干擾,且難以捕獲隱式交互。

時(shí)間變化糾纏:由于真實(shí)世界時(shí)間序列的復(fù)雜性和非平穩(wěn)性,觀察到的時(shí)間序列模式通常包含大量固有的變化,這些變化可能相互混合和重疊。特別是在不同尺度上存在不同的時(shí)間模式時(shí),多種時(shí)序變化深度糾纏,為時(shí)間序列預(yù)測帶來了極大的挑戰(zhàn)。

2.建模方法

為了解決上述問題,作者提出了一種基于自適應(yīng)多尺度超圖Transformer的框架(Ada-MSHyper),Ada-MSHyper的核心在于建模不同尺度時(shí)間模式間group-wise交互。Ada-MSHyper首先將輸入序列映射為多尺度特征表示,然后通過將多尺度特征表示視為節(jié)點(diǎn),引入了一種自適應(yīng)多尺度結(jié)構(gòu),以發(fā)掘不同尺度下節(jié)點(diǎn)間豐富而隱含的group-wise交互。Ada-MSHyper主要由四個(gè)主要部分組成:多尺度特征提取模塊,自適應(yīng)超圖學(xué)習(xí)模塊,多尺度交互模塊,和多尺度融合模塊

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

多尺度特征提取模塊:多尺度特征提取模塊用來將原始輸入序列映射為多尺度特征表示,這種多尺度結(jié)構(gòu)可以使模型在不同尺的上觀察時(shí)間序列表示。具體來說,小尺度可以反映局部變化模式(如天模式),而大尺度可以反應(yīng)全局變化模式(如周模式和月模式)。多尺度特征提取模塊模塊由多個(gè)映射函數(shù)組成,每個(gè)映射函數(shù)將前一個(gè)尺度的子序列作為輸入,并生成更大尺度的子序列作為輸出,映射函數(shù)可以由1D卷積或average pooling實(shí)現(xiàn)。

自適應(yīng)超圖學(xué)習(xí)模塊:模塊通過學(xué)習(xí)點(diǎn)邊關(guān)聯(lián)矩陣來捕獲每個(gè)尺度下節(jié)點(diǎn)間group-wise的交互。但是,作者認(rèn)為純數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)方式存在兩大局限:(1)難以有效聚集具有相似語義信息的節(jié)點(diǎn)(2)難以有效區(qū)分每個(gè)尺度內(nèi)的時(shí)序變化。為了解決上述問題,作者在自適應(yīng)超圖學(xué)習(xí)的過程中引入了節(jié)點(diǎn)和超邊約束(Node and Hyperedge Constraint,NHC)機(jī)制,其具體結(jié)構(gòu)如下圖。在每個(gè)尺度內(nèi),NHC機(jī)制首先根據(jù)點(diǎn)邊關(guān)聯(lián)矩陣,通過聚合超邊所連接的節(jié)點(diǎn)特征得到超邊特征表示。如圖(b)所示,節(jié)點(diǎn)約束損失通過計(jì)算超邊特征表示和節(jié)點(diǎn)特征表示之間的差異得到。如圖(c)所示,超邊約束損失通過計(jì)算超邊特征表示間的歐式距離和余弦相似性得到。通過最小化超邊約束損失和節(jié)點(diǎn)約束損失,NHC機(jī)制可以聚集具有相似語義信息的節(jié)點(diǎn)并區(qū)分每個(gè)尺度內(nèi)的時(shí)序變化。

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

多尺度交互模塊:在得到超圖結(jié)構(gòu)以后,為了建模不同尺度上的時(shí)間模式交互,一種直觀的方法是混合不同尺度的節(jié)點(diǎn)特征表示。然而,作者認(rèn)為,尺度內(nèi)交互和尺度間交互反應(yīng)了時(shí)間模式交互的不同方面,其中尺度內(nèi)交互主要描述具有相似語義信息的節(jié)點(diǎn)間細(xì)粒度的交互,而尺度間交互則更強(qiáng)調(diào)宏觀變化交互。因此,作者提出了多尺度交互模塊,分別處理尺度內(nèi)交互和尺度間交互。具體而言,尺度內(nèi)交互模塊通過超圖卷積attention計(jì)算每個(gè)尺度內(nèi)具有相似語義信息的節(jié)點(diǎn)特征間group-wise交互,尺度間交互模塊通過attention計(jì)算不同尺度間超邊特征間的交互。

多尺度融合模塊:在通過多尺度交互模塊得到更新后的節(jié)點(diǎn)特征和超邊特征后,多尺度融合模塊通過拼接操作將這些特征拼接起來,并送入線性層得到最終輸出。

3.實(shí)驗(yàn)效果

Ada-MSHyper在11個(gè)真實(shí)時(shí)間序列數(shù)據(jù)集上和15個(gè)基線方法進(jìn)行了比較。實(shí)驗(yàn)結(jié)果顯示,Ada-MSHyper在多個(gè)預(yù)測任務(wù)上都取得了SOTA性能,對(duì)于長時(shí),短時(shí)和超長時(shí)時(shí)間序列預(yù)測,Ada-MSHyper的均方誤差(MSE)相比于最優(yōu)基線分別降低了4.56%,10.38%和4.97%。

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

作者在ETTh1數(shù)據(jù)集上進(jìn)行了消融實(shí)驗(yàn)。結(jié)果顯示,去掉AHL模塊或者NHC機(jī)制會(huì)顯著降低模型性能,實(shí)驗(yàn)結(jié)果驗(yàn)證了AHL模塊和NHC機(jī)制的有效性。

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

作者在Electricity數(shù)據(jù)集上的可視化結(jié)果如圖3所示。為了進(jìn)一步驗(yàn)證NHC機(jī)制的有效性,作者根據(jù)節(jié)點(diǎn)值的大小將節(jié)點(diǎn)分為四組,相同顏色的節(jié)點(diǎn)表示其具有相似的語義信息。如圖(a)所示,對(duì)于目標(biāo)節(jié)點(diǎn)來說,其他顏色的節(jié)點(diǎn)被視為噪聲。如圖(b)所示,由于缺乏節(jié)點(diǎn)約束,-w/o NHC 只能捕獲目標(biāo)節(jié)點(diǎn)及其鄰居節(jié)點(diǎn)間的交互,無法區(qū)分細(xì)微的噪聲干擾。而在(c)中,通過引入節(jié)點(diǎn)約束,-w/o HC不僅可以聚集鄰居節(jié)點(diǎn)還能聚集距離較遠(yuǎn)但具有較強(qiáng)相關(guān)性的節(jié)點(diǎn)。最后在圖(d)中,通過NHC機(jī)制,Ada-MSHyper不僅可以聚集具有相似語義信息的節(jié)點(diǎn),還能區(qū)分時(shí)序變化。

NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時(shí)間序列預(yù)測方法-AI.x社區(qū)

4.總結(jié)

本文提出了Ada-MSHyper,一種基于自適應(yīng)多尺度超圖的時(shí)間序列預(yù)測方法。通過引入AHL模塊和多尺度交互模塊,Ada-MSHyper能夠建模更全面的group-wise交互,從而解決語義信息稀疏性的問題。實(shí)驗(yàn)結(jié)果顯示,Ada-MSHyper實(shí)現(xiàn)了SOTA的性能,在長時(shí)、短時(shí)和超長時(shí)時(shí)間序列預(yù)測中,Ada-MSHyper的均方誤差(MSE)相比于最優(yōu)基線分別降低了4.56%,10.38%和4.97%。此外,可視化分析和消融實(shí)驗(yàn)進(jìn)一步驗(yàn)證了NHC機(jī)制在聚類具有相似語義信息節(jié)點(diǎn)以及解決時(shí)間變化糾纏問題上的有效性。

收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦