論文の概要: DRL-STAF: A Deep Reinforcement Learning Framework for State-Aware Forecasting of Complex Multivariate Hidden Markov Processes
- arxiv url: http://arxiv.org/abs/2605.14632v1
- Date: Thu, 14 May 2026 09:44:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.759975
- Title: DRL-STAF: A Deep Reinforcement Learning Framework for State-Aware Forecasting of Complex Multivariate Hidden Markov Processes
- Title(参考訳): DRL-STAF:複合多変量隠れマルコフ過程の状態認識予測のための深層強化学習フレームワーク
- Authors: Manrui Jiang, Jingru Huang, Yong Chen, Chen Zhang,
- Abstract要約: DRL-STAF(Deep Reinforcement Learning based STate-Aware Forecasting framework)を提案する。
具体的には、DRL-STAFはディープニューラルネットワークを用いて複雑な非線形放出をモデル化し、強化学習を用いて離散的な隠れ状態を推定する。
- 参考スコア(独自算出の注目度): 9.047464533782003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Forecasting multivariate hidden Markov processes is challenging due to nonlinear and nonstationary observations, latent state transitions, and cross-sequence dependencies. While deep learning methods achieve strong predictive accuracy, they typically lack explicit state modeling, whereas Hidden Markov Models (HMMs) provide interpretable latent states but struggle with complex nonlinear emissions and scalability. To address these limitations, we propose DRL-STAF, a Deep Reinforcement Learning based STate-Aware Forecasting framework that jointly predicts next-step observations and estimates the corresponding hidden states for complex multivariate hidden Markov processes. Specifically, DRL-STAF models complex nonlinear emissions using deep neural networks and estimates discrete hidden states using reinforcement learning, reducing the reliance on predefined transition structures and enabling flexible adaptation to diverse temporal dynamics. In particular, DRL-STAF mitigates the state-space explosion encountered by typical multivariate HMM-based methods. Extensive experiments demonstrate that DRL-STAF outperforms HMM variants, standalone deep learning models, and existing DL-HMM hybrids in most cases, while also providing reliable hidden-state estimates.
- Abstract(参考訳): 多変量隠れマルコフ過程の予測は、非線形および非定常観測、潜時状態遷移、および系列間の依存関係により困難である。
深層学習法は強い予測精度を実現するが、通常は明示的な状態モデリングを欠いているのに対し、隠れマルコフモデル(HMM)は解釈可能な潜在状態を提供するが、複雑な非線形放出と拡張性に苦しむ。
DRL-STAF(Deep Reinforcement Learning based STate-Aware Forecasting framework)を提案する。
具体的には、DRL-STAFはディープニューラルネットワークを用いて複雑な非線形放出をモデル化し、強化学習を用いて離散的な隠蔽状態を推定し、事前定義された遷移構造への依存を低減し、多様な時間的ダイナミクスへの柔軟な適応を可能にする。
特にDRL-STAFは、典型的な多変量HMM法で発生する状態空間の爆発を緩和する。
大規模な実験では、DRL-STAFはHMMの変種、スタンドアロンのディープラーニングモデル、既存のDL-HMMハイブリッドよりも優れており、信頼性の高い隠れ状態の推定も可能である。
関連論文リスト
- On the Trainability of Masked Diffusion Language Models via Blockwise Locality [58.92209096047332]
マスク付き拡散言語モデル (MDMs) は、最近、標準自己回帰型大言語モデル (AR-LLMs) に代わる有望な代替品として登場した。
ブロックワイズMDMを解析し,AR-LLMと比較し,構造生成の異なる側面を強調する3つの制御タスクについて検討した。
標準ランダムマスキングMDMは線形回帰を確実に学習できず、グラフパスフィニングにおいて高分散トレーニングダイナミクスを示し、スドクではAR-LLMよりも優れていた。
論文 参考訳(メタデータ) (2026-04-27T17:44:26Z) - Strong Linear Baselines Strike Back: Closed-Form Linear Models as Gaussian Process Conditional Density Estimators for TSAD [41.074068820031655]
本研究は,OLS回帰法により得られる閉形式解を用いた単純な線形自己回帰異常スコアが,最先端の深部検出器と一貫して一致し,より優れることを示す。
理論的な観点から、線形モデルは、有限歴史ガウス過程条件密度を推定し、幅広い種類の異常型を捉えていることを示す。
論文 参考訳(メタデータ) (2026-01-31T11:35:51Z) - On the Identifiability of Regime-Switching Models with Multi-Lag Dependencies [42.274922469778545]
マルチラグレジームスイッチングモデル(RSM)の一般的な理論的枠組みを開発する。
非線形ガウス条件下では,レギュラー数とマルチラグ遷移の双方の識別可能性を示す。
我々の結果は、アーキテクチャとノイズの仮定を通して完全に教師なしの設定を保ちます。
論文 参考訳(メタデータ) (2026-01-06T15:12:39Z) - Quantization Meets dLLMs: A Systematic Study of Post-training Quantization for Diffusion LLMs [78.09559830840595]
本稿では拡散に基づく言語モデルの定量化に関する最初の体系的研究について述べる。
異常に大きなアクティベーション値によって特徴付けられるアクティベーションアウトリーチの存在を同定する。
我々は最先端のPTQ手法を実装し、包括的な評価を行う。
論文 参考訳(メタデータ) (2025-08-20T17:59:51Z) - Unconditional Truthfulness: Learning Unconditional Uncertainty of Large Language Models [104.55763564037831]
我々は、注意マップ、現在の生成ステップにおける確率、および以前に生成されたトークンから繰り返し計算された不確実性スコアを利用する回帰モデルを訓練する。
評価の結果,提案手法は選択的生成に極めて有効であり,教師なしアプローチと教師なしアプローチに比較して大幅な改善が得られた。
論文 参考訳(メタデータ) (2024-08-20T09:42:26Z) - Distributionally Robust Model-based Reinforcement Learning with Large
State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。
広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。
本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文 参考訳(メタデータ) (2023-09-05T13:42:11Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Variational multiscale reinforcement learning for discovering reduced
order closure models of nonlinear spatiotemporal transport systems [0.0]
閉包モデルは、多くの非線形力学系において、順序表現の減少による損失を考慮に入れるのに一般的である。
本研究では,ガレルキン射影に基づく縮小順序モデルの安定化を目的とした動的閉包モデルと探索フレームワークを提案する。
まず、モード依存クロージャポリシーを発見するためのマルチモーダルRL(MMRL)を提案する。
次に,報奨関数の設計において,高忠実度データへのアクセスを必要とせずに閉包モデルを発見するために,変分多スケールRL (VMRL) アプローチを定式化する。
論文 参考訳(メタデータ) (2022-07-07T19:58:47Z) - Deep Switching State Space Model (DS$^3$M) for Nonlinear Time Series Forecasting with Regime Switching [2.8579459256051316]
我々はDeep Switching State Space Model(DS$3$M)として知られる新しいモデリングフレームワークを紹介する。
このフレームワークは、動的に隠された不規則な状態を特定しながら、そのような時系列の正確な予測を行うように設計されている。
本研究は,DS$3$Mの短期および長期の予測テストを通じて,シミュレーションおよび実世界の幅広いデータセット上でのDS$3$Mの有効性とレギュラー識別能力を検証する。
論文 参考訳(メタデータ) (2021-06-04T08:25:47Z) - Continuous-Time Model-Based Reinforcement Learning [4.427447378048202]
本稿では,新しいアクター・クリティック手法に基づく連続時間MBRLフレームワークを提案する。
我々は、連続時間制御システムを明確に解決する新しいODE-RLスイート上で、本手法を実装し、テストする。
論文 参考訳(メタデータ) (2021-02-09T11:30:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。