論文の概要: Deep Learning Foundation and Pattern Models: Challenges in Hydrological Time Series
- arxiv url: http://arxiv.org/abs/2410.15218v2
- Date: Sun, 09 Mar 2025 21:54:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:40:10.186664
- Title: Deep Learning Foundation and Pattern Models: Challenges in Hydrological Time Series
- Title(参考訳): 深層学習の基礎とパターンモデル:水文時系列の課題
- Authors: Junyang He, Ying-Jung Chen, Alireza Jafari, Anushka Idamekorala, Geoffrey Fox,
- Abstract要約: 本稿では,水文学データを用いて時系列における重要な特徴を特定することを目的とする。
本研究では, CAMELS と Caravan のグローバルデータセットから水文学時系列を解析する。
- 参考スコア(独自算出の注目度): 1.4854797901022863
- License:
- Abstract: There has been active investigation into deep learning approaches for time series analysis, including foundation models. However, most studies do not address significant scientific applications. This paper aims to identify key features in time series by examining hydrology data. Our work advances computer science by emphasizing critical application features and contributes to hydrology and other scientific fields by identifying modeling approaches that effectively capture these features. Scientific time series data are inherently complex, involving observations from multiple locations, each with various time-dependent data streams and exogenous factors that may be static or time-varying and either application-dependent or purely mathematical. This research analyzes hydrology time series from the CAMELS and Caravan global datasets, which encompass rainfall and runoff data across catchments, featuring up to six observed streams and 209 static parameters across approximately 8,000 locations. Our investigation assesses the impact of exogenous data through eight different model configurations for key hydrology tasks. Results demonstrate that integrating exogenous information enhances data representation, reducing mean squared error by up to 40% in the largest dataset. Additionally, we present a detailed performance comparison of over 20 state-of-the-art pattern and foundation models. The analysis is fully open-source, facilitated by Jupyter Notebook on Google Colab for LSTM-based modeling, data preprocessing, and model comparisons. Preliminary findings using alternative deep learning architectures reveal that models incorporating comprehensive observed and exogenous data outperform more limited approaches, including foundation models. Notably, natural annual periodic exogenous time series contribute the most significant improvements, though static and other periodic factors are also valuable.
- Abstract(参考訳): 基礎モデルを含む時系列分析における深層学習のアプローチについて,活発に研究が進められている。
しかし、ほとんどの研究は重要な科学的応用に対処していない。
本稿では,水文学データを用いて時系列における重要な特徴を特定することを目的とする。
我々の研究は、重要な応用特徴を強調し、これらの特徴を効果的に捉えたモデリングアプローチを特定することによって、水文学や他の科学分野に貢献することで、計算機科学を進歩させる。
科学的時系列データは本質的に複雑で、複数の場所から観測され、それぞれに様々な時間依存のデータストリームと、静的または時間変化があり、アプリケーション依存または純粋に数学的である可能性のある外因性要因がある。
本研究は,約8,000箇所にわたる最大6つの観測ストリームと209個の静的パラメータを特徴とする,降雨・流出データを含むCAMELSとCaravanのグローバルデータセットから,水文学時系列を分析した。
本研究は,8種類のモデル構成による外因性データの影響について検討した。
その結果,外因性情報の統合によりデータ表現が向上し,最大データセットで平均2乗誤差が最大40%削減された。
さらに,20以上の最先端パターンと基礎モデルの詳細な性能比較を行った。
この分析は完全にオープンソースで、Google ColabのJupyter NotebookによってLSTMベースのモデリング、データ前処理、モデル比較のために進められている。
代替ディープラーニングアーキテクチャを用いた予備的な発見は、包括的および外生的データを組み込んだモデルが、基礎モデルを含むより限定的なアプローチより優れていることを示している。
特に、自然の周期的外因性時系列は最も顕著な改善であるが、静的やその他の周期的要因も有用である。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Deep Time Series Models: A Comprehensive Survey and Benchmark [74.28364194333447]
時系列データは、現実世界のシナリオにおいて非常に重要である。
近年、時系列コミュニティで顕著なブレークスルーが見られた。
多様な分析タスクのためのディープ時系列モデルの公正なベンチマークとして、時系列ライブラリ(TSLib)をリリースします。
論文 参考訳(メタデータ) (2024-07-18T08:31:55Z) - Large Models for Time Series and Spatio-Temporal Data: A Survey and
Outlook [95.32949323258251]
時系列データ、特に時系列データと時間時間データは、現実世界のアプリケーションで広く使われている。
大規模言語やその他の基礎モデルの最近の進歩は、時系列データマイニングや時間データマイニングでの使用の増加に拍車を掛けている。
論文 参考訳(メタデータ) (2023-10-16T09:06:00Z) - Pushing the Limits of Pre-training for Time Series Forecasting in the
CloudOps Domain [54.67888148566323]
クラウドオペレーションドメインから,大規模時系列予測データセットを3つ導入する。
強力なゼロショットベースラインであり、モデルとデータセットサイズの両方において、さらなるスケーリングの恩恵を受けています。
これらのデータセットと結果を取得することは、古典的および深層学習のベースラインを事前訓練された方法と比較した総合的なベンチマーク結果の集合である。
論文 参考訳(メタデータ) (2023-10-08T08:09:51Z) - Data Augmentation techniques in time series domain: A survey and
taxonomy [0.20971479389679332]
時系列を扱うディープニューラルネットワークは、トレーニングで使用されるデータセットのサイズと一貫性に大きく依存する。
この研究は、すべての利用可能なアルゴリズムの概要を提供するために、この分野の最先端を体系的にレビューする。
本研究の究極的な目的は、この分野の将来の研究者を導くために、より良い結果をもたらす領域の進化と性能を概説することである。
論文 参考訳(メタデータ) (2022-06-25T17:09:00Z) - Structured Time Series Prediction without Structural Prior [0.152292571922932]
時系列予測は、多くの領域の応用において広くよく研究されている問題である。
このようなグラフに依存しない完全データ駆動モデルを提案する。
論文 参考訳(メタデータ) (2022-02-07T22:01:58Z) - Time Series Analysis via Network Science: Concepts and Algorithms [62.997667081978825]
本稿では,時系列をネットワークに変換する既存のマッピング手法について概観する。
我々は、主要な概念的アプローチを説明し、権威的な参照を提供し、統一された表記法と言語におけるそれらの利点と限界について洞察を与える。
ごく最近の研究だが、この研究領域には大きな可能性を秘めており、今後の研究の道を開くことを目的としている。
論文 参考訳(メタデータ) (2021-10-11T13:33:18Z) - An Experimental Review on Deep Learning Architectures for Time Series
Forecasting [0.0]
時系列予測のための最も広範な深層学習研究を提供する。
すべての研究モデルの中で、結果は、長期短期記憶(LSTM)と畳み込みネットワーク(CNN)が最良の代替手段であることを示しています。
CNNは、異なるパラメータ設定の下で結果の変動が少なく、比較性能を達成し、効率も向上します。
論文 参考訳(メタデータ) (2021-03-22T17:58:36Z) - Deep learning for time series classification [2.0305676256390934]
時系列分析により、時間の経過とともにプロセスの進化を可視化し、理解することができます。
時系列分類は時系列データを自動的にラベル付けするアルゴリズムで構成されている。
ディープラーニングは、教師付き分類タスクに対処する最も効果的な方法の1つとして登場した。
論文 参考訳(メタデータ) (2020-10-01T17:38:40Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。