論文の概要: Large-Scale Multi-Agent Deep FBSDEs
- arxiv url: http://arxiv.org/abs/2011.10890v3
- Date: Fri, 21 May 2021 04:46:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 23:25:17.631124
- Title: Large-Scale Multi-Agent Deep FBSDEs
- Title(参考訳): 大規模マルチエージェント深部FBSDE
- Authors: Tianrong Chen, Ziyi Wang, Ioannis Exarchos, Evangelos A. Theodorou
- Abstract要約: 架空のプレイを用いたマルチエージェントゲームにおいてマルコフ的ナッシュ平衡を求めるためのフレームワークを提案する。
我々は,現在最先端のディープラーニングプレイアルゴリズムに対して,我々のフレームワークの優れた性能を示す。
また,ロボット工学における我々のフレームワークの適用性を,信仰空間における自律レース問題に適用可能であることを実証する。
- 参考スコア(独自算出の注目度): 28.525065041507982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper we present a scalable deep learning framework for finding
Markovian Nash Equilibria in multi-agent stochastic games using fictitious
play. The motivation is inspired by theoretical analysis of Forward Backward
Stochastic Differential Equations (FBSDE) and their implementation in a deep
learning setting, which is the source of our algorithm's sample efficiency
improvement. By taking advantage of the permutation-invariant property of
agents in symmetric games, the scalability and performance is further enhanced
significantly. We showcase superior performance of our framework over the
state-of-the-art deep fictitious play algorithm on an inter-bank
lending/borrowing problem in terms of multiple metrics. More importantly, our
approach scales up to 3000 agents in simulation, a scale which, to the best of
our knowledge, represents a new state-of-the-art. We also demonstrate the
applicability of our framework in robotics on a belief space autonomous racing
problem.
- Abstract(参考訳): 本稿では,マルチエージェント確率ゲームにおけるマルコフ的ナッシュ平衡を求めるためのスケーラブルなディープラーニングフレームワークを提案する。
この動機は,前向き確率微分方程式(fbsde)の理論的解析と,本アルゴリズムのサンプル効率向上の源泉である深層学習環境におけるそれらの実装に着想を得たものである。
対称ゲームにおけるエージェントの置換不変性を利用することにより、スケーラビリティと性能が大幅に向上する。
複数の指標を用いて,銀行間貸付・借入問題に対する最先端の深層架空のプレイアルゴリズムよりも優れた性能を示す。
さらに重要なことに、私たちのアプローチはシミュレーションにおいて最大3000のエージェントにスケールします。
また,我々のロボット工学における枠組みを,信念空間自律レーシング問題に適用する可能性を示す。
関連論文リスト
- BAIT: Benchmarking (Embedding) Architectures for Interactive
Theorem-Proving [13.374504717801061]
本稿では,対話的定理証明における学習アプローチの公平かつ合理化された比較のためのフレームワークであるBAITを提案する。
BAITの機能を、いくつかのIPPベンチマークで詳細に比較して示す。
BAITはまた、インタラクティブ環境上に構築されたシステムのエンドツーエンドのパフォーマンスを評価することもできる。
論文 参考訳(メタデータ) (2024-03-06T01:56:17Z) - Scalable Semantic Non-Markovian Simulation Proxy for Reinforcement
Learning [0.125828876338076]
本稿では,アノテート論理に対する時間的拡張に基づくシミュレーションのセマンティックプロキシを提案する。
学習した政策の質を保ちながら、最大3桁のスピードアップを示す。
論文 参考訳(メタデータ) (2023-10-10T17:59:26Z) - Guaranteed Conservation of Momentum for Learning Particle-based Fluid
Dynamics [96.9177297872723]
本稿では,学習物理シミュレーションにおける線形運動量を保証する新しい手法を提案する。
我々は、強い制約で運動量の保存を強制し、反対称的な連続的な畳み込み層を通して実現する。
提案手法により,学習シミュレータの物理的精度を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-10-12T09:12:59Z) - Multi-Agent Reinforcement Learning for Long-Term Network Resource
Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。
我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T10:29:06Z) - Slimmable Domain Adaptation [112.19652651687402]
重み付けモデルバンクを用いて、ドメイン間の一般化を改善するためのシンプルなフレームワーク、Slimmable Domain Adaptationを導入する。
私たちのフレームワークは、他の競合するアプローチを、複数のベンチマークにおいて非常に大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-06-14T06:28:04Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Efficient Differentiable Simulation of Articulated Bodies [89.64118042429287]
本稿では, 音素の効率的な微分可能シミュレーション法を提案する。
これにより、ボディダイナミクスを深層学習フレームワークに統合することが可能になる。
提案手法を用いて, 調音システムによる強化学習を高速化できることを示す。
論文 参考訳(メタデータ) (2021-09-16T04:48:13Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Softmax with Regularization: Better Value Estimation in Multi-Agent
Reinforcement Learning [72.28520951105207]
q$-learningの過大評価は、シングルエージェント強化学習で広く研究されている重要な問題である。
ベースラインから逸脱する大きな関節動作値をペナライズする,新たな正規化ベースの更新方式を提案する。
本手法は,StarCraft IIマイクロマネジメントの課題に対して,一貫した性能向上を実現する。
論文 参考訳(メタデータ) (2021-03-22T14:18:39Z) - Non-cooperative Multi-agent Systems with Exploring Agents [10.736626320566707]
マルコフゲームを用いたマルチエージェント動作の規範モデルを開発した。
エージェントが探索するが、最適戦略に近い」モデルに焦点を当てる。
論文 参考訳(メタデータ) (2020-05-25T19:34:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。