論文の概要: Reinforcement Learning based dynamic weighing of Ensemble Models for
Time Series Forecasting
- arxiv url: http://arxiv.org/abs/2008.08878v1
- Date: Thu, 20 Aug 2020 10:40:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 02:55:30.068376
- Title: Reinforcement Learning based dynamic weighing of Ensemble Models for
Time Series Forecasting
- Title(参考訳): 強化学習に基づく時系列予測のためのアンサンブルモデルの動的重み付け
- Authors: Satheesh K. Perepu, Bala Shyamala Balaji, Hemanth Kumar Tanneru,
Sudhakar Kathari, Vivek Shankar Pinnamaraju
- Abstract要約: データモデリングのために選択されたモデルが(線形/非線形、静的/動的)異なるモデルと独立(最小相関)モデルである場合、予測の精度が向上することが知られている。
アンサンブルモデルを重み付けするために文献で提案された様々なアプローチは、静的な重みセットを使用する。
この問題に対処するため、Reinforcement Learning (RL)アプローチでは、各モデルの重み付けを異なるタイミングで動的に割り当て、更新する。
- 参考スコア(独自算出の注目度): 0.8399688944263843
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensemble models are powerful model building tools that are developed with a
focus to improve the accuracy of model predictions. They find applications in
time series forecasting in varied scenarios including but not limited to
process industries, health care, and economics where a single model might not
provide optimal performance. It is known that if models selected for data
modelling are distinct (linear/non-linear, static/dynamic) and independent
(minimally correlated models), the accuracy of the predictions is improved.
Various approaches suggested in the literature to weigh the ensemble models use
a static set of weights. Due to this limitation, approaches using a static set
of weights for weighing ensemble models cannot capture the dynamic changes or
local features of the data effectively. To address this issue, a Reinforcement
Learning (RL) approach to dynamically assign and update weights of each of the
models at different time instants depending on the nature of data and the
individual model predictions is proposed in this work. The RL method
implemented online, essentially learns to update the weights and reduce the
errors as the time progresses. Simulation studies on time series data showed
that the dynamic weighted approach using RL learns the weight better than
existing approaches. The accuracy of the proposed method is compared with an
existing approach of online Neural Network tuning quantitatively through
normalized mean square error(NMSE) values.
- Abstract(参考訳): Ensemble Modelは、モデル予測の精度を改善するために開発された強力なモデル構築ツールである。
彼らは、プロセス産業、医療、経済に限らず、単一のモデルが最適なパフォーマンスを提供しないような様々なシナリオにおける時系列予測の応用を見つける。
データモデリングのために選択されたモデルが(線形/非線形/静的/動的)独立(最小相関モデル)である場合、予測の精度が向上することが知られている。
文献で示唆される様々なアプローチは、アンサンブルモデルの重み付けに静的な重みの組を用いる。
この制限のため、アンサンブルモデルの重み付けに静的なセットを用いるアプローチでは、データの動的変化や局所的な特徴を効果的に捉えることはできない。
この問題に対処するために、データの性質や個々のモデル予測に基づいて、異なるタイミングで各モデルの重みを動的に割り当て、更新する強化学習(RL)アプローチを提案する。
rlメソッドはオンラインで実装され、基本的に重み付けの更新と時間経過に伴うエラーの低減を学習する。
時系列データに関するシミュレーション研究により、RLを用いた動的重み付きアプローチは既存の手法よりも優れた重み付けを学習することを示した。
提案手法の精度を,正規化平均二乗誤差(NMSE)値を用いて定量的にチューニングするオンラインニューラルネットワークの既存手法と比較した。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Few-Shot Load Forecasting Under Data Scarcity in Smart Grids: A Meta-Learning Approach [0.18641315013048293]
本稿では,短期負荷予測のためのモデルに依存しないメタ学習アルゴリズムを提案する。
提案手法は,任意の長さの未知の負荷時間列に迅速に適応し,一般化することができる。
提案手法は,実世界の消費者の歴史的負荷消費データのデータセットを用いて評価する。
論文 参考訳(メタデータ) (2024-06-09T18:59:08Z) - Towards Stable Machine Learning Model Retraining via Slowly Varying Sequences [6.067007470552307]
そこで本研究では,繰り返しのトレーニングにおいて安定な機械学習モデルのシーケンスを見つける手法を提案する。
最適モデルの復元が保証される混合整数最適化の定式化を開発する。
本手法は, 予測力の小さい, 制御可能な犠牲を伴い, 厳密に訓練されたモデルよりも強い安定性を示す。
論文 参考訳(メタデータ) (2024-03-28T22:45:38Z) - Deep autoregressive density nets vs neural ensembles for model-based
offline reinforcement learning [2.9158689853305693]
本稿では、利用可能なデータからシステムダイナミクスを推定し、仮想モデルロールアウトにおけるポリシー最適化を行うモデルベース強化学習アルゴリズムについて考察する。
このアプローチは、実際のシステムで破滅的な失敗を引き起こす可能性のあるモデルエラーを悪用することに対して脆弱である。
D4RLベンチマークの1つのよく校正された自己回帰モデルにより、より良い性能が得られることを示す。
論文 参考訳(メタデータ) (2024-02-05T10:18:15Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - When to Update Your Model: Constrained Model-based Reinforcement
Learning [50.74369835934703]
モデルベースRL(MBRL)の非遅延性能保証のための新規で一般的な理論スキームを提案する。
続いて導いた境界は、モデルシフトとパフォーマンス改善の関係を明らかにします。
さらなる例では、動的に変化する探索からの学習モデルが、最終的なリターンの恩恵をもたらすことが示されている。
論文 参考訳(メタデータ) (2022-10-15T17:57:43Z) - Online Dynamics Learning for Predictive Control with an Application to
Aerial Robots [3.673994921516517]
予測モデルは学習し、モデルベースのコントローラに適用することができるが、これらのモデルはしばしばオフラインで学習される。
このオフライン設定では、トレーニングデータをまず収集し、精巧なトレーニング手順により予測モデルを学ぶ。
本稿では,デプロイ中の動的モデルの精度を継続的に向上するオンライン動的学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-19T15:51:25Z) - Autoregressive Dynamics Models for Offline Policy Evaluation and
Optimization [60.73540999409032]
表現的自己回帰ダイナミクスモデルが次の状態の異なる次元を生成し、以前の次元で順次条件付きで報酬を得ることを示す。
また,リプレイバッファを充実させる手段として,自己回帰的ダイナミクスモデルがオフラインポリシー最適化に有用であることを示す。
論文 参考訳(メタデータ) (2021-04-28T16:48:44Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。