論文の概要: Controlling dynamics of stochastic systems with deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2502.18111v1
- Date: Tue, 25 Feb 2025 11:28:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-26 15:20:32.258790
- Title: Controlling dynamics of stochastic systems with deep reinforcement learning
- Title(参考訳): 深部強化学習による確率系の力学制御
- Authors: Ruslan Mukhamadiarov,
- Abstract要約: 本稿では,訓練されたニューラルネットワークを用いてシステムのダイナミクスを制御できるシミュレーションアルゴリズムを提案する。
具体的には、エージェントベースのシミュレーションを使用して、ニューラルネットワークがローカル状態から状態への遷移を駆動するコントローラの役割を担っている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: A properly designed controller can help improve the quality of experimental measurements or force a dynamical system to follow a completely new time-evolution path. Recent developments in deep reinforcement learning have made steep advances toward designing effective control schemes for fairly complex systems. However, a general simulation scheme that employs deep reinforcement learning for exerting control in stochastic systems is yet to be established. In this paper, we attempt to further bridge a gap between control theory and deep reinforcement learning by proposing a simulation algorithm that allows achieving control of the dynamics of stochastic systems through the use of trained artificial neural networks. Specifically, we use agent-based simulations where the neural network plays the role of the controller that drives local state-to-state transitions. We demonstrate the workflow and the effectiveness of the proposed control methods by considering the following two stochastic processes: particle coalescence on a lattice and a totally asymmetric exclusion process.
- Abstract(参考訳): 適切に設計されたコントローラは、実験的な測定の質を向上させるのに役立ち、動的システムを全く新しい時間進化経路に従うように強制することができる。
深層強化学習の最近の進歩は、かなり複雑なシステムのための効果的な制御スキームの設計に向けて急激な進歩を遂げている。
しかし, 統計的システムの制御を行うために深層強化学習を用いた一般的なシミュレーション手法はまだ確立されていない。
本稿では,制御理論と深層強化学習のギャップをさらに埋めるために,訓練されたニューラルネットワークを用いて確率系の力学を制御できるシミュレーションアルゴリズムを提案する。
具体的には、エージェントベースのシミュレーションを使用して、ニューラルネットワークがローカル状態から状態への遷移を駆動するコントローラの役割を担っている。
本稿では,格子上の粒子の合体過程と非対称な排除過程の2つの確率過程を考慮することにより,提案手法のワークフローと有効性を示す。
関連論文リスト
- Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。
この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文 参考訳(メタデータ) (2024-06-04T17:15:25Z) - Distributed Robust Learning based Formation Control of Mobile Robots based on Bioinspired Neural Dynamics [14.149584412213269]
まず,変数構造とカスケード設計手法を用いた分散推定器を導入し,実時間性能向上のための微分情報の必要性を排除した。
そして、スムーズな制御入力を提供し、スピードジャンプ問題を効果的に解決することを目的とした、バイオインスパイアされたニューラルダイナミックベースのアプローチを用いて、キネマティックトラッキング制御法を開発した。
完全に未知の力学と乱れを持つロボットの課題に対処するために,学習に基づく頑健な動的コントローラを開発した。
論文 参考訳(メタデータ) (2024-03-23T04:36:12Z) - Decentralized Event-Triggered Online Learning for Safe Consensus of
Multi-Agent Systems with Gaussian Process Regression [3.405252606286664]
本稿では,補助力学によって強化された,学習に基づく分散制御法を提案する。
予測性能を継続的に向上するために、分散イベントトリガー機構を備えたデータ効率の高いオンライン学習戦略を提案する。
提案手法の有効性を示すため,従来の分散制御法とオフライン学習法を対比して比較分析を行った。
論文 参考訳(メタデータ) (2024-02-05T16:41:17Z) - Controlling quantum many-body systems using reduced-order modelling [0.0]
本稿では,多体量子システムにおける制御問題のクラスを解くための効率的な手法を提案する。
もともとのサブシステムの「デジタルツイン」と見なされる、そのような縮小順序モデルの力学のシミュレーションは、はるかに効率的である。
この結果は、多体システムの研究、非自明な準粒子特性の探索、および量子コンピューティングデバイスの開発管理ツールに直接応用される。
論文 参考訳(メタデータ) (2022-11-01T13:58:44Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。
最適制御には無関係な状態変数を特徴付ける。
論文 参考訳(メタデータ) (2021-10-12T16:41:47Z) - Model-Free Control of Dynamical Systems with Deep Reservoir Computing [0.0]
本稿では,未知の複雑なシステムに適用可能な非線形制御法を提案する。
我々の手法はシステムに関する事前の知識を必要としないため、モデルフリーである。
貯留層コンピュータは、小さなトレーニングデータセットと驚くほど低いトレーニング時間を必要とするため、制御問題に適している。
論文 参考訳(メタデータ) (2020-10-05T18:59:51Z) - An Ode to an ODE [78.97367880223254]
我々は、O(d) 群上の行列フローに応じて主フローの時間依存パラメータが進化する ODEtoODE と呼ばれるニューラルODE アルゴリズムの新しいパラダイムを提案する。
この2つの流れのネストされたシステムは、訓練の安定性と有効性を提供し、勾配の消滅・爆発問題を確実に解決する。
論文 参考訳(メタデータ) (2020-06-19T22:05:19Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。