論文の概要: Model-Based Reinforcement Learning for Control under Time-Varying Dynamics
- arxiv url: http://arxiv.org/abs/2604.02260v1
- Date: Thu, 02 Apr 2026 16:52:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.92959
- Title: Model-Based Reinforcement Learning for Control under Time-Varying Dynamics
- Title(参考訳): 時間変化ダイナミクスを考慮したモデルベース強化学習
- Authors: Klemens Iten, Bruce Lee, Chenhao Li, Lenart Treven, Andreas Krause, Bhavya Sukhija,
- Abstract要約: 時間変動力学下での制御のための強化学習について検討する。
適応型データバッファ機構を用いた実用的な楽観的モデルベース強化学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 40.96573079787976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning-based control methods typically assume stationary system dynamics, an assumption often violated in real-world systems due to drift, wear, or changing operating conditions. We study reinforcement learning for control under time-varying dynamics. We consider a continual model-based reinforcement learning setting in which an agent repeatedly learns and controls a dynamical system whose transition dynamics evolve across episodes. We analyze the problem using Gaussian process dynamics models under frequentist variation-budget assumptions. Our analysis shows that persistent non-stationarity requires explicitly limiting the influence of outdated data to maintain calibrated uncertainty and meaningful dynamic regret guarantees. Motivated by these insights, we propose a practical optimistic model-based reinforcement learning algorithm with adaptive data buffer mechanisms and demonstrate improved performance on continuous control benchmarks with non-stationary dynamics.
- Abstract(参考訳): 学習に基づく制御法は通常、静止系の力学を仮定するが、これは現実のシステムではドリフト、摩耗、動作条件の変化によってしばしば違反される仮定である。
時間変動力学下での制御のための強化学習について検討する。
本稿では,エージェントが繰り返し学習し,遷移ダイナミクスがエピソード間で進化する動的システムを制御する連続モデルに基づく強化学習環境について考察する。
頻繁な変動予算仮定の下でガウス過程力学モデルを用いて問題を解析する。
解析の結果, 持続的非定常性は, 校正された不確かさと意味のある動的後悔の保証を維持するために, 時代遅れのデータの影響を明示的に制限する必要があることがわかった。
これらの知見により,適応型データバッファ機構を持つ実用的な楽観的モデルベース強化学習アルゴリズムを提案し,非定常力学を用いた連続制御ベンチマークの性能向上を示す。
関連論文リスト
- Data-Driven Control with Inherent Lyapunov Stability [3.695480271934742]
本研究では,非線形力学モデルと安定化制御器のパラメトリック表現をデータから共同学習する手法として,インヒーレント・リャプノフ安定度制御(CoILS)を提案する。
新たな構成によって保証される学習力学の安定化性に加えて、学習した制御器は学習力学の忠実性に関する特定の仮定の下で真の力学を安定化することを示す。
論文 参考訳(メタデータ) (2023-03-06T14:21:42Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Stochastically forced ensemble dynamic mode decomposition for
forecasting and analysis of near-periodic systems [65.44033635330604]
本稿では,観測力学を強制線形系としてモデル化した新しい負荷予測手法を提案する。
固有線型力学の利用は、解釈可能性やパーシモニーの観点から、多くの望ましい性質を提供することを示す。
電力グリッドからの負荷データを用いたテストケースの結果が提示される。
論文 参考訳(メタデータ) (2020-10-08T20:25:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。