論文の概要: Accelerating Reinforcement Learning Training Using Simulation Surrogate Models
- arxiv url: http://arxiv.org/abs/2605.27556v1
- Date: Tue, 26 May 2026 18:23:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:55.402084
- Title: Accelerating Reinforcement Learning Training Using Simulation Surrogate Models
- Title(参考訳): シミュレーション・サロゲートモデルを用いた強化学習の加速
- Authors: Mohammadmahdi Ghasemloo, David J. Eckman, Yaxian Li,
- Abstract要約: 高出力シミュレーションモデルは複雑なシステムの解析に広く用いられているが、その高い計算コストはより安価なサロゲートモデルの開発を動機付けている。
並行して、学習強化(RL)が、環境におけるオンライン意思決定のための強力なフレームワークとして登場した。
本稿では,報酬構造,モデルパラメータ,システムダイナミクスが時間とともに変化するような環境下でのRLトレーニングの促進に適した代理モデルについて検討し,シミュレーションモデルやRLモデルとの相互作用について検討する。
- 参考スコア(独自算出の注目度): 0.1234398109349733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-fidelity simulation models are widely used to analyze complex stochastic systems, but their high computational cost motivates the development of cheaper surrogate models that approximate the simulation model's input-output relationship. In parallel, reinforcement learning (RL) has emerged as a powerful framework for making online decisions in stochastic environments, with increasing attention being given to the use of simulation models as training environments for RL models. We investigate a class of surrogate models suitable for accelerating RL training in settings where the reward structure, model parameters, or system dynamics change over time and explore their interactions with simulation models and RL models. Through numerical experiments on a stochastic service system modeled via discrete-event simulation, we demonstrate that leveraging surrogate models can substantially accelerate RL training and re-training.
- Abstract(参考訳): 高忠実度シミュレーションモデルは複雑な確率的システムの解析に広く用いられているが、その高い計算コストはシミュレーションモデルの入出力関係を近似するより安価なサロゲートモデルの開発を動機付けている。
並行して、強化学習(RL)は確率的環境におけるオンライン意思決定のための強力なフレームワークとして現れ、RLモデルのトレーニング環境としてのシミュレーションモデルの使用に注目が集まっている。
本稿では,報酬構造,モデルパラメータ,システムダイナミクスが時間とともに変化するような環境下でのRLトレーニングの促進に適した代理モデルについて検討し,シミュレーションモデルやRLモデルとの相互作用について検討する。
離散イベントシミュレーションによりモデル化された確率的サービスシステムの数値実験により、代理モデルの活用により、RLトレーニングと再訓練が大幅に加速できることが実証された。
関連論文リスト
- Transfer Learning Across Fast- and Full-Simulation Domains in High-Energy Physics [10.078675569996992]
本研究では,現実的な環境下での高速・完全シミュレーションデータセット間の伝達学習を体系的に研究する。
本稿では, 信号背景分類, クォークグルーオンジェットタグ付け, 横方向エネルギー再構成の3つの課題について考察する。
モデルはATLASライクな高速シミュレーションで事前訓練され、CMSライクな高速シミュレーションに適応し、完全なATLASオープンデータに適応する。
論文 参考訳(メタデータ) (2026-05-08T09:18:34Z) - Learning a model is paramount for sample efficiency in reinforcement
learning control of PDEs [5.488334211013093]
RLエージェントの訓練と並行して動作モデルを学ぶことで,実システムからサンプリングしたデータ量を大幅に削減できることを示す。
また、RLトレーニングのバイアスを避けるために、モデルを反復的に更新することが重要であることも示している。
論文 参考訳(メタデータ) (2023-02-14T16:14:39Z) - Continual learning autoencoder training for a particle-in-cell
simulation via streaming [52.77024349608834]
今後のエクサスケール時代は 次世代の物理シミュレーションを 高解像度で提供します
これらのシミュレーションは高解像度であり、ディスク上に大量のシミュレーションデータを格納することはほぼ不可能であるため、機械学習モデルのトレーニングに影響を与える。
この研究は、ディスク上のデータなしで、実行中のシミュレーションにニューラルネットワークを同時にトレーニングするアプローチを示す。
論文 参考訳(メタデータ) (2022-11-09T09:55:14Z) - Conditional Generative Models for Simulation of EMG During Naturalistic
Movements [45.698312905115955]
本稿では、運動単位活性化電位波形を生成するために、逆向きに訓練された条件付き生成ニューラルネットワークを提案する。
本研究では,より少ない数の数値モデルの出力を高い精度で予測的に補間できることを実証する。
論文 参考訳(メタデータ) (2022-11-03T14:49:02Z) - Semi-analytical Industrial Cooling System Model for Reinforcement
Learning [4.272330410469061]
多物理シミュレーションに解析解を埋め込んだハイブリッド産業用冷却システムモデルを提案する。
モデルの忠実度は,大規模冷却システムによる実世界のデータに対して評価される。
論文 参考訳(メタデータ) (2022-07-26T18:19:17Z) - Scientific multi-agent reinforcement learning for wall-models of
turbulent flows [5.678337324555036]
大規模シミュレーションのための壁モデル発見のための科学的マルチエージェント強化学習(SciMARL)を紹介する。
現在のシミュレーションは、完全に解決されたシミュレーションよりも数桁の計算コストを削減している。
論文 参考訳(メタデータ) (2021-06-21T14:30:10Z) - Deep Bayesian Active Learning for Accelerating Stochastic Simulation [74.58219903138301]
Interactive Neural Process(INP)は、シミュレーションとアクティブな学習アプローチのためのディープラーニングフレームワークである。
能動的学習のために,NPベースモデルの潜時空間で計算された新しい取得関数Latent Information Gain (LIG)を提案する。
その結果,STNPは学習環境のベースラインを上回り,LIGは能動学習の最先端を達成していることがわかった。
論文 参考訳(メタデータ) (2021-06-05T01:31:51Z) - Hybrid modeling: Applications in real-time diagnosis [64.5040763067757]
我々は、機械学習にインスパイアされたモデルと物理モデルを組み合わせた、新しいハイブリッドモデリングアプローチの概要を述べる。
このようなモデルをリアルタイム診断に利用しています。
論文 参考訳(メタデータ) (2020-03-04T00:44:57Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。