自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="xkni9"></style><li id="xkni9"><mark id="xkni9"></mark></li>

<style id="xkni9"><li id="xkni9"></li></style>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專業(yè)IT技術(shù)創(chuàng)作平臺

51CTO學(xué)堂

IT職業(yè)在線教育平臺

TFB：2024最新時間序列預(yù)測Benchmark

發(fā)布于 2024-5-9 10:10

瀏覽

0收藏

今天給大家介紹一篇VLDB 2024中時間序列預(yù)測Benchmark的工作，文章由華東師范大學(xué)，華為云，奧爾堡大學(xué)聯(lián)合發(fā)布。該論文提出了TFB（時間序列預(yù)測基準(zhǔn)測試），這是一個新穎的自動化基準(zhǔn)測試框架，旨在通過包含來自十個不同領(lǐng)域的數(shù)據(jù)集，并提供一個靈活、可擴(kuò)展且一致的評估流程，對包括統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在內(nèi)的多種時間序列預(yù)測方法進(jìn)行全面且無偏見的評估。

該論文呼吁testing不使用drop-last操作，這一影響多個時序Baselines性能的代碼bug！

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

論文標(biāo)題：TFB: Towards Comprehensive and Fair Benchmarking of Time Series Forecasting Methods**

論文鏈接：??https://arxiv.org/pdf/2403.20150.pdf??

代碼鏈接：??https://github.com/decisionintelligence/TFB??

1、引言

這篇論文試圖解決的問題包括：

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

問題1. 數(shù)據(jù)領(lǐng)域覆蓋不足：現(xiàn)有的時間序列預(yù)測方法評估通常只覆蓋有限的領(lǐng)域，無法全面反映方法在多樣數(shù)據(jù)集下的表現(xiàn)。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

問題2. 對傳統(tǒng)方法的刻板影響：現(xiàn)有的評估往往忽略了傳統(tǒng)方法，如統(tǒng)計(jì)學(xué)習(xí)，機(jī)器學(xué)習(xí)方法，大部分只關(guān)注深度學(xué)習(xí)方法。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

問題3. 缺乏一致和靈活的流程。不同的評估基準(zhǔn)使用不同的實(shí)驗(yàn)設(shè)置，如數(shù)據(jù)劃分、歸一化方法選擇、超參數(shù)設(shè)置，drop-last操作的使用，這使得公平的比較變得困難。此外，大多數(shù)測試基準(zhǔn)流程不靈活，無法支持統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的同時評估。

2、drop-last操作說明

現(xiàn)有的一些方法在測試階段使用“刪除最后一個批次的數(shù)據(jù)”的技巧。為了加速測試，通常將數(shù)據(jù)分成批次。然而，如果我們丟棄最后一個不完整批次：其中包含的樣本數(shù)量少于批次大小，這會導(dǎo)致不公平的比較。例如，在圖4中，ETTh2具有長度為2,880的測試序列長度，我們使用大小為512的回溯窗口預(yù)測336個未來時間步。如果我們選擇批次大小為32、64和128，那么最后一個批次中的樣本數(shù)量分別為17、49和113。除非所有方法都使用相同的批次大小，否則丟棄這些最后一個批次的測試樣本是不公平的，因?yàn)闇y試集的實(shí)際使用長度不一致。圖4顯示了在ETTh2上使用不同批次大小和“刪除最后一個批次”技巧的PatchTST、DLinear和FEDformer的測試結(jié)果。我們觀察到，在變化批次大小時，方法的性能會發(fā)生變化。

因此該論文呼吁testing不使用drop-last操作，該論文在testing中沒有使用drop-last操作。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

3、時間序列特征說明

趨勢性（Trend）：趨勢性是指時間序列隨著時間的推移而發(fā)生的長期變化或模式。直觀地說，它代表了數(shù)據(jù)漂移的大致方向。

季節(jié)性（Seasonality）：季節(jié)性是指時間序列中的變化以特定的間隔重復(fù)的現(xiàn)象。

平穩(wěn)性（Stationarity）：平穩(wěn)性是指時間序列的各階統(tǒng)計(jì)特征（如均值、方差…）不隨時間的變化而變化。

漂移性（Shifting）：漂移性是指時間序列的概率分布隨時間變化的現(xiàn)象。這種行為可能源于系統(tǒng)內(nèi)部的結(jié)構(gòu)變化、外部影響或隨機(jī)事件的發(fā)生。

轉(zhuǎn)移（Transition）：轉(zhuǎn)移捕捉了時間序列中存在的規(guī)律性和可識別的固定特征，例如趨勢、周期性的明確表現(xiàn)，或者季節(jié)性和趨勢同時存在。

相關(guān)性（Correlation）：相關(guān)性是指多變量時間序列中不同變量可能共享的可能性共同的趨勢或模式，表明它們受到相似的因素或具有某種潛在的關(guān)系。

這些特征的公式可從原論文中獲取。

4、TFB：基準(zhǔn)細(xì)節(jié)

數(shù)據(jù)集：TFB配備了25個多變量和8,068個單變量數(shù)據(jù)集。對時間序列數(shù)據(jù)進(jìn)行特征化分析，確保所選數(shù)據(jù)集在不同特征上具有廣泛的分布。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

對比方法：TFB包括了22種方法。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

評估設(shè)定：為了評估方法的預(yù)測準(zhǔn)確性，TFB實(shí)現(xiàn)了兩種不同的評估策略：1) 固定預(yù)測；和2) 滾動預(yù)測。為了對預(yù)測性能進(jìn)行全面評估，TFB采用了八個誤差度量指標(biāo)。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

統(tǒng)一的流程：為了實(shí)現(xiàn)方法的公平和全面比較，TFB引入了一個統(tǒng)一的評估流程，分為數(shù)據(jù)層、方法層、評估層和報(bào)告層。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

5、實(shí)驗(yàn)

單變量時間序列預(yù)測

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

多變量時間序列預(yù)測

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

不同特征上的性能

根據(jù)實(shí)驗(yàn)結(jié)果，總結(jié)了不同方法在各種數(shù)據(jù)特征上的表現(xiàn)和排名。討論了基于Transformer的方法、線性方法以及考慮通道依賴性的方法在不同場景下的性能差異。研究了深度學(xué)習(xí)方法在多變量時間序列預(yù)測中的推理時間和參數(shù)數(shù)量的表現(xiàn)。提供了關(guān)于如何選擇適合特定數(shù)據(jù)集和場景的預(yù)測方法的見解。

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū)

? TFB：2024最新時間序列預(yù)測Benchmark-AI.x社區(qū) 圖片 ?

6、關(guān)鍵發(fā)現(xiàn)

在某些數(shù)據(jù)集中，統(tǒng)計(jì)方法VAR和LinearRegression的表現(xiàn)優(yōu)于最近提出的SOTA方法。

當(dāng)數(shù)據(jù)集呈現(xiàn)增長趨勢或明顯漂移時，基于線性的方法表現(xiàn)良好。

基于Transformer的方法在具有明顯季節(jié)性、非線性模式以及更明顯模式或強(qiáng)內(nèi)部相關(guān)性的數(shù)據(jù)集上優(yōu)于基于線性的方法。

考慮通道之間依賴關(guān)系的方法，與假設(shè)通道獨(dú)立性的方法相比，有時可以提高多變量時間序列預(yù)測的性能，特別是在具有強(qiáng)相關(guān)性的數(shù)據(jù)集上。未來的文章應(yīng)該關(guān)注如何提取、利用變量間關(guān)系來進(jìn)行預(yù)測。

測試過程中使用drop-last操作會對實(shí)驗(yàn)結(jié)果產(chǎn)生很大影響，造成不公平比較現(xiàn)象，論文呼吁testing不使用drop-last操作，這一影響多個時序Baselines性能的代碼bug！

7、總結(jié)

本文提出了TFB，這是一個專門設(shè)計(jì)用于進(jìn)一步提高時間序列預(yù)測方法公平比較的基準(zhǔn)，包括單變量時間序列預(yù)測和多變量時間序列預(yù)測。TFB在8,068個單變量時間序列上測評了超過20種UTSF方法以及在25個多變量數(shù)據(jù)集上對14種MTSF方法進(jìn)行了測評。

TFB確定、收集和處理先前提出的時間序列數(shù)據(jù)集，以確定涵蓋不同領(lǐng)域和特征的全面的數(shù)據(jù)集，并以標(biāo)準(zhǔn)化格式組織它們。然后，設(shè)計(jì)實(shí)驗(yàn)來研究不同方法在不同特征數(shù)據(jù)集上的表現(xiàn)。

TFB提供了一個自動化的端到端流程，用于評估預(yù)測方法，簡化和標(biāo)準(zhǔn)化加載時間序列數(shù)據(jù)集、配置實(shí)驗(yàn)和評估方法的步驟。這簡化了研究人員的評估過程。此外，所有數(shù)據(jù)集和代碼都可在https://github.com/decisionintelligence/TFB上獲得。

TFB評估、比較了一系列方法，涵蓋了統(tǒng)計(jì)學(xué)習(xí)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法以及豐富多樣的評估任務(wù)和策略。并將評估結(jié)果總結(jié)為一些關(guān)鍵發(fā)現(xiàn)。

本文轉(zhuǎn)載自??? 圓圓的算法筆記???，作者： Fareise

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

ICLR'24 | 對比學(xué)習(xí)引入全周期時間序列信息提升長周期時序預(yù)測效果

海因斯DK ? 4172瀏覽 ? 0回復(fù)
一文帶你全面了解開源時間序列預(yù)測利器——TimeGPT

51CTO內(nèi)容精選 ? 3962瀏覽 ? 0回復(fù)
亞馬遜最新時序大模型：將時間序列完全轉(zhuǎn)換成文本

海因斯DK ? 6639瀏覽 ? 0回復(fù)
WWW'24 文本增強(qiáng)實(shí)現(xiàn)統(tǒng)一跨域時間序列預(yù)測

海因斯DK ? 3843瀏覽 ? 0回復(fù)
MIT最新力作：用GPT-3.5解決時間序列異常檢測問題

海因斯DK ? 3894瀏覽 ? 0回復(fù)
基于Transformer的時間序列綜述

AI論文解讀 ? 3169瀏覽 ? 0回復(fù)
時間序列預(yù)測近期核心研究點(diǎn)總結(jié)

海因斯DK ? 4307瀏覽 ? 0回復(fù)
Self-Attention在時間序列預(yù)測中有效嗎？新Transformer架構(gòu)效率效果雙提升

海因斯DK ? 4266瀏覽 ? 0回復(fù)
純MLP模型達(dá)到新SOTA，基于序列-核心表征融合的高效多元時間序列預(yù)測

海因斯DK ? 3407瀏覽 ? 0回復(fù)
一文匯總時序預(yù)測新思路——圖學(xué)習(xí)視角解決時間序列預(yù)測問題

海因斯DK ? 4934瀏覽 ? 0回復(fù)
時間序列預(yù)測+NLP大模型新作：為時序預(yù)測自動生成隱式Prompt

海因斯DK ? 2965瀏覽 ? 0回復(fù)
如何改良基于Basis的時間序列預(yù)測模型？

海因斯DK ? 2554瀏覽 ? 0回復(fù)
用時間序列語言模型徹底改變預(yù)測分析現(xiàn)狀

51CTO內(nèi)容精選 ? 1923瀏覽 ? 0回復(fù)
一文梳理Transformer在時間序列預(yù)測中的發(fā)展歷程代表工作

海因斯DK ? 6581瀏覽 ? 0回復(fù)
FoundTS：時間序列預(yù)測基礎(chǔ)模型的全面統(tǒng)一測評基準(zhǔn)

海因斯DK ? 3432瀏覽 ? 0回復(fù)
NeurIPS'24 基于自適應(yīng)多尺度超圖Transfromer的時間序列預(yù)測方法

海因斯DK ? 3119瀏覽 ? 0回復(fù)
時間序列模型的演變：人工智能引領(lǐng)新的預(yù)測時代

51CTO內(nèi)容精選 ? 2367瀏覽 ? 0回復(fù)
連續(xù)小波變換（CWT）+時間序列預(yù)測！融合時頻分析與深度學(xué)習(xí)的預(yù)測新思路

Tang_Lan ? 2436瀏覽 ? 0回復(fù)
連續(xù)小波變換（CWT）+時間序列預(yù)測！融合時頻分析與深度學(xué)習(xí)的預(yù)測新思路

Tang_Lan ? 554瀏覽 ? 0回復(fù)

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

ICLR'25 | 基于記憶網(wǎng)絡(luò)和混合Prototype的時間序列異常檢測方法 10h前發(fā)布
大模型系列：一文匯總16個深度語言模型代表工作 2025-04-08 01:03:28發(fā)布

熱門推薦

大半精銳盡出！o1下線！滿血o3之后，模型本身就是Manus，最大賣點(diǎn)：替代人干真活！ 1回復(fù)

王炸！MCP 架構(gòu)設(shè)計(jì)深度剖析 & 使用 Spring AI + MCP 四步教你實(shí)現(xiàn) Agent 智能體開發(fā) 0回復(fù)

Dify從入門到高階系列二：手把手教學(xué)！超詳細(xì)的Dify知識庫配置全攻略 0回復(fù)

Crawl4AI：GitHub榜首40K星標(biāo)！LLM專屬極速開源爬蟲神器 0回復(fù)

只需5分鐘，教你用Python搭建MCP Server 0回復(fù)

上一篇：圖像生成模型王牌——Diffusion Transformers系列工作梳理

下一篇： ICLR2024杰出論文——Never Train from Scratch！

社區(qū)精華內(nèi)容

目錄

<cite id="otcc5"></cite><sub id="otcc5"><p id="otcc5"></p></sub>

<style id="otcc5"><rp id="otcc5"></rp></style><cite id="otcc5"></cite>

<cite id="otcc5"></cite>^{<sub id="otcc5"></sub>}

<sub id="otcc5"></sub>