論文の概要: Distributed Influence-Augmented Local Simulators for Parallel MARL in
Large Networked Systems
- arxiv url: http://arxiv.org/abs/2207.00288v1
- Date: Fri, 1 Jul 2022 09:33:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-04 21:56:57.820604
- Title: Distributed Influence-Augmented Local Simulators for Parallel MARL in
Large Networked Systems
- Title(参考訳): 大規模ネットワークシステムにおける並列MARLの分散影響強化ローカルシミュレータ
- Authors: Miguel Suau, Jinke He, Mustafa Mert \c{C}elikok, Matthijs T. J. Spaan,
Frans A. Oliehoek
- Abstract要約: 本稿では,多数のエージェントからなる大規模ネットワークシステムを複数のローカルコンポーネントに分割する方法を示す。
異なるローカルコンポーネントが互いに与える影響を監視するため、各シミュレータには学習モデルが備わっている。
- 参考スコア(独自算出の注目度): 16.735107541302636
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to its high sample complexity, simulation is, as of today, critical for
the successful application of reinforcement learning. Many real-world problems,
however, exhibit overly complex dynamics, which makes their full-scale
simulation computationally slow. In this paper, we show how to decompose large
networked systems of many agents into multiple local components such that we
can build separate simulators that run independently and in parallel. To
monitor the influence that the different local components exert on one another,
each of these simulators is equipped with a learned model that is periodically
trained on real trajectories. Our empirical results reveal that distributing
the simulation among different processes not only makes it possible to train
large multi-agent systems in just a few hours but also helps mitigate the
negative effects of simultaneous learning.
- Abstract(参考訳): サンプルの複雑さが高いため、今日では強化学習を成功させるにはシミュレーションが不可欠である。
しかし、現実世界の多くの問題は非常に複雑なダイナミクスを示し、フルスケールのシミュレーションを計算的に遅くする。
本稿では,多数のエージェントからなる大規模ネットワークシステムを複数のローカルコンポーネントに分解し,独立に並列に動作するシミュレータを別々に構築する方法を示す。
異なるローカルコンポーネントが互いに与える影響を監視するため、各シミュレータは実軌道上で定期的に訓練される学習モデルを備えている。
実験の結果,シミュレーションを異なるプロセスに分散させることで,大規模なマルチエージェントシステムをわずか数時間で学習できるだけでなく,同時学習の悪影響を軽減できることがわかった。
関連論文リスト
- LASIL: Learner-Aware Supervised Imitation Learning For Long-term Microscopic Traffic Simulation [30.500368103677097]
微視的交通シミュレーションは、個々の車両の挙動や交通の流れに関する洞察を提供することによって、輸送工学において重要な役割を担っている。
モデルに依存する従来のシミュレータは、現実の交通環境の複雑さのために正確なシミュレーションを行うことができないことが多い。
本稿では,学習者認識による模倣学習という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-03-26T11:13:35Z) - Towards Complex Dynamic Physics System Simulation with Graph Neural ODEs [75.7104463046767]
本稿では,粒子系の空間的および時間的依存性を特徴付ける新しい学習ベースシミュレーションモデルを提案する。
我々は,GNSTODEのシミュレーション性能を,重力とクーロンの2つの実世界の粒子系上で実証的に評価した。
論文 参考訳(メタデータ) (2023-05-21T03:51:03Z) - Hindsight States: Blending Sim and Real Task Elements for Efficient
Reinforcement Learning [61.3506230781327]
ロボット工学では、第一原理から導かれた力学モデルに基づくシミュレーションに基づいて、トレーニングデータを生成する方法がある。
ここでは、力学の複雑さの不均衡を利用して、より標本効率のよい学習を行う。
提案手法をいくつかの課題に対して検証し,既存の近視アルゴリズムと組み合わせた場合の学習改善を実証する。
論文 参考訳(メタデータ) (2023-03-03T21:55:04Z) - Simulation-Based Parallel Training [55.41644538483948]
このようなボトルネックを緩和するトレーニングフレームワークを設計するために、現在進行中の作業を紹介します。
トレーニングプロセスと並行してデータを生成する。
このバイアスをメモリバッファで軽減する戦略を提案する。
論文 参考訳(メタデータ) (2022-11-08T09:31:25Z) - Sim and Real: Better Together [47.14469055555684]
シミュレーションと実環境とのインタラクションの両方から同時に学習する方法を実証する。
本稿では,高いスループットから多数のサンプルのバランスをとるアルゴリズムを提案するが,精度は低い。
このような多環境相互作用を理論的に解析し、新しい理論的なリプレイバッファ解析により収束特性を提供する。
論文 参考訳(メタデータ) (2021-10-01T14:30:03Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - From Simulation to Real World Maneuver Execution using Deep
Reinforcement Learning [69.23334811890919]
深層強化学習(Deep Reinforcement Learning)は、さまざまな分野における多くの制御タスクを解決できることが証明されている。
これは主に、シミュレーションデータと実世界のデータ間のドメイン適応の欠如と、トレインデータセットとテストデータセットの区別の欠如による。
本稿では,エージェントが同時に訓練される複数の環境に基づくシステムを提案する。
論文 参考訳(メタデータ) (2020-05-13T14:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。