在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

做時間序列預測是否有必要用深度學習

智能感知與物聯網技術研究所 ? 來源:深度學習與圖網絡 ? 作者:深度學習與圖網絡 ? 2022-03-24 13:59 ? 次閱讀

深度學習方法應用廣泛的今天,所有領域是不是非它不可呢?其實未必,在時間序列預測任務上,簡單的機器學習方法能夠媲美甚至超越很多 DNN 模型。

過去幾年,時間序列領域的經典參數方法(自回歸)已經在很大程度上被復雜的深度學習框架(如 DeepGIO 或 LSTNet 等)更新替代。這是因為傳統方法可能無法捕獲長期和短期序列混合傳遞的信息,而深度學習方法的思路是掌握數據中的跨時非線性依賴。從結果來看,這些深度學習方法不僅優于 ARIMA 等傳統方法和梯度提升回歸樹(Gradient Boosting Regression Tree, GBRT)等簡單機器學習模型,而且增強了這樣一種預期,即機器學習領域的時間序列預測模型需要以深度學習工作為基礎,才能得到 SOTA 結果。 但是,推薦系列領域的最新啟示表明,深度學習方法在機器學習各種研究分支取得的成就需要對簡單高效模型定期確認和評估,以保持各自研究領域進展的真實性。除了時間序列預測模型越來越復雜之外,另一個動機包括文獻中正在完善的深度學習模型在處理時間序列預測問題上的片面性,因此限制了現有解決方案方法的多樣性。 在前段時間的一篇論文《Do We Really Need Deep Learning Models for Time Series Forecasting?》中,來自德國希爾德斯海姆大學計算機科學系的研究者展示了通過精心配置的輸入處理結構,GBRT 等簡單但強大的集成模型在時間序列預測領域能夠媲美甚至超越很多 DNN 模型。

5cf4bb12-9f8f-11ec-952b-dac502259ad0.png

論文地址:https://arxiv.org/pdf/2101.02118.pdf 研究者對特征工程多輸出 GBRT 模型進行了評估,并提出了以下兩個研究問題:

對于用于時間序列預測的基于窗口的學習框架來說,精心配置 GBRT 模型的輸入和輸出結構有什么效果?

一個雖簡單但配置良好的 GBRT 模型與 SOTA 深度學習時間序列預測框架相比如何?

為了回答這兩個問題,研究者選擇了雙重實驗設置,分別解決兩類預測任務,即系統化方式中的單變量和多變量預測。目的是評估 GBRT 模型以及在頂會(NeurIPS、KDD、SIGIR、ECML、ICML、CIKM、IJCAI、ICLR 等)中出現的 SOTA 深度學習方法。這項研究的整體貢獻可以總結如下: 一,研究者將一個簡單的機器學習方法 GBRT 提升了競品 DNN 時間序列預測模型的標準。首先將 GBRT 轉換成一個基于窗口的回歸框架,接著對它的輸入和輸出結構進行特征工程,如此便能從額外上下文信息中獲益最多;二,為了突出輸入處理對時間序列預測模型的重要性,研究者通過實證證明了為什么基于窗口的 GBRT 輸入設置可以在時間序列預測領域提高 ARIMA 和原版 GBRT 等精心配置的模型所產生的預測性能;三,研究者比較了 GBRT 與各種 SOTA 深度學習時間序列預測模型的性能,并驗證了它在單變量和雙變量時間序列預測任務中的競爭力。 這項研究也引起了不少人的共鳴。有人認為,時間序列分類任務同樣也沒有必要用深度學習方法。在一些情況下,SVMs 或邏輯回歸方法表現更好,速度也更快。

5d0af6fc-9f8f-11ec-952b-dac502259ad0.png

研究設計 選擇基線。研究者系統地過濾了 2016 年至 2020 年在 NeurIPS、KDD、SIGIR、SDM、ECML、ICML、CIKM、IJCAI、ICLR 等會議表現較好的論文集。論文需滿足以下要求:

主題:只考慮時間序列預測領域的研究;

數據結構:專用數據類型,但如異步時間序列和概念化為圖形的數據被排除在外;

可復現:數據、源代碼應公開。如果源代碼不可用,但實驗設置有清晰的文檔,研究也可以從實驗中復制結果;

計算的可行性:研究中得出的結果能夠以易于處理的方式復現,并在合理的時間內可計算。

評估。該研究在兩個層次上對時間序列預測 GBRT 模型進行評估:一個單變量和一個多變量。為了使所選的深度學習基線和 GBRT 之間具有顯著的可比性,該研究在相同的數據集上評估了所有模型,數據集如下表 1 所示:左邊提供了關于用來評估模型數據集,而右邊則列出了各自的實驗規范:

5d20add0-9f8f-11ec-952b-dac502259ad0.png

問題公式化。時間序列預測問題,就監督學習而言,時間序列預測可以表述為:給定一個集合5d3c9f5e-9f8f-11ec-952b-dac502259ad0.png和一個集合5d4d74dc-9f8f-11ec-952b-dac502259ad0.png,經過一系列假設后,得到如下期望損失最小化模型:

5d5a99aa-9f8f-11ec-952b-dac502259ad0.png

GBRT GBRT 模型,特別是 XGBoost 實現,其優點是易于應用,而且在結構化數據上特別成功。但是當涉及時間序列預測的初始(naive)實現時,GBRT 模型失去了很大一部分靈活性,因為它們沒有被投射到基于窗口的回歸問題中,而是被配置為適合大部分時間序列作為完整且連續的數據點序列來預測時間序列的后續和剩余測試部分。 與上述初始實現不同,該研究通過將時間序列重新配置為窗口輸入,并在多個訓練實例(窗口)上進行訓練,以模擬成功的時間序列預測模型中使用的輸入處理行為,為此該研究定義了一個可調窗口,5d6ab6a0-9f8f-11ec-952b-dac502259ad0.png。這種基于窗口的 GBRT 模型輸入設置如圖 1 所示:

5d8e4f84-9f8f-11ec-952b-dac502259ad0.png

第一步是使用變換函數

5da3a17c-9f8f-11ec-952b-dac502259ad0.png

將典型的 2D 訓練實例(時間序列輸入窗口)變換為適合 GBRT 的 1D 形狀向量(扁平窗口)。該函數將所有 w 實例的目標值 y_i 連接起來,然后將最后一個時間點實例 t 的協變量向量附加到輸入窗口 w 中,表示為

5db2d39a-9f8f-11ec-952b-dac502259ad0.png

。 基于窗口的 GBRT 輸入設置極大地提高了其預測性能,因為 GBRT 模型現在能夠掌握數據的底層時間序列結構,并且現在可以被認為是先進 DNN 時間序列預測模型的適當機器學習基線。另一方面,簡單配置的 GBRT 模型

5dca3724-9f8f-11ec-952b-dac502259ad0.png是一個簡單的逐點回歸模型,將時間點5dd9976e-9f8f-11ec-952b-dac502259ad0.png的協變量作為輸入,預測單一目標值 Y_i、j 為同一時間點訓練損失如下:

5df5f72e-9f8f-11ec-952b-dac502259ad0.png

實驗結果 單變量時間序列的結果 下表 2 總體結果表明,除了 traffic 預測外,基于窗口的 GBRT 具有較強的競爭力。另一方面,具有傳統配置的預測模型(例如 ARIMA 和 GBRT(Naive))的表現遠遠優于預期。

5e0a4436-9f8f-11ec-952b-dac502259ad0.png

而在 electricity 預測方面,基于窗口的 GBRT 在所有模型中均顯示出最佳的 RMSE 性能,其在 WAPE 和 MAE 方面的性能僅優于 2016 年推出的 TRMF,基于注意力的 DARNN 模型表現較差。關于 exchange rate 任務,LSTNet(以 w = 24 重新實現)和 TMRF 顯示出相當強的結果,優于基于窗口的 GBRT 基線。 在不考慮時間預測器的情況下,traffic 預測的結果是混合的,因此 DARNN 和 LSTNet 實現了 traffic 數據集的最佳結果,而對于 PeMSD7 數據集,基于窗口的 GBRT 基線在兩個方面優于 DNN 模型三個指標。然而,時間協變量的包含顯著提高了 GBRT 的性能(下表 3),因此,對于 traffic 預測,所有 DNN 方法,包括 DeepGlo [18] 和 STGCN(spatio-temporal traffic forecasting model ) [19],其在 PeMSD7 上實現了 6.77 的 RMSE,優于重新配置的 GBRT 基線。

5e60ace0-9f8f-11ec-952b-dac502259ad0.png

下表 4 顯示了 LSTNet 與 GBRT(W-b) 的結果:

5e746f1e-9f8f-11ec-952b-dac502259ad0.png

下表 5 中的結果表明 GBRT 的競爭力,但也表明基于 transformer 的模型相當強大,例如 TFT 超過了提升回歸樹性能。然而,作為一個例外,TFT 構成了本研究中唯一一個始終優于 GBRT 的 DNN 模型,而 DeepAR 和 DeepState 等概率模型在這些單變量數據集上的表現優于其他模型。

5e8bd316-9f8f-11ec-952b-dac502259ad0.png

多元數據集 下表 6 中為 DARNN 與基于窗口 GBRT 比較:簡單、配置良好的 GBRT 基線可以超越 DNN 框架。

5ea10d9e-9f8f-11ec-952b-dac502259ad0.png

從下表 7 可以看出,即使是專門為某一預測任務設計的 DNN 模型,也沒有達到預期效果。相反,DAQFF 的性能比簡單的基于窗口、特征工程的梯度提升回歸樹模型更差。在本實驗中,值得注意的是,即使是傳統應用預測意義上的 GBRT 模型也能在 air quality 數據集上提供更好的結果。

5eb338c0-9f8f-11ec-952b-dac502259ad0.png

原文標題:做時間序列預測有必要用深度學習嗎?事實證明,梯度提升回歸樹媲美甚至超越多個DNN模型

文章出處:【微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

審核編輯:湯梓紅

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 計算機
    +關注

    關注

    19

    文章

    7523

    瀏覽量

    88314
  • 機器學習
    +關注

    關注

    66

    文章

    8428

    瀏覽量

    132834
  • 深度學習
    +關注

    關注

    73

    文章

    5510

    瀏覽量

    121336

原文標題:做時間序列預測有必要用深度學習嗎?事實證明,梯度提升回歸樹媲美甚至超越多個DNN模型

文章出處:【微信號:tyutcsplab,微信公眾號:智能感知與物聯網技術研究所】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于溫度數據集的時間序列預測實戰

    本文主要介紹時間序列預測并描述任何時間序列的兩種主要模式(趨勢和季節性)。并基于這些模式對時間
    發表于 10-24 14:40 ?1727次閱讀

    【「時間序列與機器學習」閱讀體驗】全書概覽與時間序列概述

    的應用也很廣泛,用機器學習時間分析帶來新的可能性。人們往往可以通過過往的時間序列數據來預測未來,在各行各業中都有很好的應用與發展前景。
    發表于 08-07 23:03

    【《時間序列與機器學習》閱讀體驗】+ 了解時間序列

    學習方法對該序列數據進行分析,可以得到結論或預測估計,因此時間序列分析的用途是非常多的,比如: 可以反映社會經濟現象的發展變化過程,描述現象
    發表于 08-11 17:55

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環節,目標是從給定的
    發表于 08-14 18:00

    【「時間序列與機器學習」閱讀體驗】時間序列的信息提取

    個重要環節,目標是從給定的時間序列數據中提取出有用的信息和特征,以支持后續的分析和預測任務。 特征工程(Feature Engineering)是將數據轉換為更好地表示潛在問題的特征,從而提高機器
    發表于 08-17 21:12

    深度學習預測和健康管理中的應用

    (包括振動,圖像,時間序列和結構化數據)的普遍適用性。它還揭示了深度學習為主要PHM子字段提供了萬能的框架:故障
    發表于 07-12 06:46

    介紹有關時間序列預測時間序列分類

    通過之前有關LSTM的8遍基礎教程和10篇處理時間序列預測任務的教程介紹,使用簡單的序列數據示例,已經把LSTM的原理,數據處理流程,模型架構,Keras實現都講清楚了。從這篇文章開始
    發表于 07-12 09:18

    自回歸滯后模型進行多變量時間序列預測案例分享

    1、如何建立一個模型來進行多元時間序列預測呢?  下圖顯示了關于不同類型葡萄酒銷量的月度多元時間序列。每種葡萄酒類型都是時間序列中的一個變量
    發表于 11-30 15:33

    科學數據時間序列預測方法

    針對傳統的時間序列分析方法預測科學數據效果較差的特點,提出了一種結合自組織神經網絡和灰色理論的時間序列
    發表于 12-31 23:56 ?10次下載

    小波回聲狀態網絡的時間序列預測

    為了更好的對具有多尺度特性的時間序列進行預測,運用小波分析方法與回聲狀態網絡模型相結合來創建小波回聲狀態網絡預測模型。利用小波方法對原始時間
    發表于 01-13 11:40 ?0次下載
    小波回聲狀態網絡的<b class='flag-5'>時間</b><b class='flag-5'>序列</b><b class='flag-5'>預測</b>

    如何用Python進行時間序列分解和預測

    預測是一件復雜的事情,在這方面做得好的企業會在同行業中出類拔萃。時間序列預測的需求不僅存在于各類業務場景當中,而且通常需要對未來幾年甚至幾分鐘之后的
    的頭像 發表于 02-14 11:34 ?2533次閱讀
    如何用Python進行<b class='flag-5'>時間</b><b class='flag-5'>序列</b>分解和<b class='flag-5'>預測</b>?

    序列數據和文本的深度學習

    模型提供文本和序列化數據; ?為序列化數據使用一維卷積。 可以使用RNN構建的一些應用程序如下所示。 ?文檔分類器:識別推文或評論的情感,對新聞文章進行分類。 ?序列序列
    的頭像 發表于 07-15 09:47 ?926次閱讀
    <b class='flag-5'>序列</b>數據和文本的<b class='flag-5'>深度</b><b class='flag-5'>學習</b>

    深度學習中的時間序列分類方法

    時間序列分類(Time Series Classification, TSC)是機器學習深度學習領域的重要任務之一,廣泛應用于人體活動識別
    的頭像 發表于 07-09 15:54 ?1069次閱讀

    LSTM神經網絡在時間序列預測中的應用

    時間序列預測是數據分析中的一個重要領域,它涉及到基于歷史數據預測未來值。隨著深度學習技術的發展,
    的頭像 發表于 11-13 09:54 ?731次閱讀

    如何使用RNN進行時間序列預測

    一種強大的替代方案,能夠學習數據中的復雜模式,并進行準確的預測。 RNN的基本原理 RNN是一種具有循環結構的神經網絡,它能夠處理序列數據。在RNN中,每個輸入序列的元素都會通過一個或
    的頭像 發表于 11-15 09:45 ?349次閱讀
    主站蜘蛛池模板: 日本韩国三级在线| 18免费视频| 黄色大片免费观看| 五月婷婷六月合| 天堂在线最新资源| 丁香婷婷激情综合| 久久久噜噜噜久久久午夜| 日韩国产片| 四虎影视大全免费入口| 在线啪| 91免费视频网站| 欧美色啪| 1024手机在线看永久免费| 免费啪| 欧美jizzhd精品欧美4k| 午夜视频1000| 午夜美女久久久久爽久久| 天天做天天爱天天爽| 4虎影院在线观看| 大量喷潮free| 国产一级做a爱免费视频| 男人的天堂视频在线| 欧美一区二区三区四区视频| 四虎黄色片| 欧美日韩一区在线观看| 日本大片免aaa费观看视频| 看看一级毛片| 激情五月婷婷在线| 另类激情网| www在线视频在线播放| 艹逼免费视频| 天堂网中文在线最新版| 大香线蕉97久久| 一起射综合网| 亚洲人成网站色7799在线播放| 在线观看日本免费视频大片一区| 好大好硬好深好爽的视频| 欧洲三级网站| 亚洲一区小说区中文字幕| 日本一区二区在线视频| 国产汉服被啪福利在线观看|