論文の概要: Cooperative multi-agent reinforcement learning for high-dimensional
nonequilibrium control
- arxiv url: http://arxiv.org/abs/2111.06875v1
- Date: Fri, 12 Nov 2021 18:54:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-15 14:16:45.968167
- Title: Cooperative multi-agent reinforcement learning for high-dimensional
nonequilibrium control
- Title(参考訳): 高次元非平衡制御のための協調多エージェント強化学習
- Authors: Shriram Chennakesavalu and Grant M. Rotskoff
- Abstract要約: 自己組立のための外部制御プロトコルを設計するために,マルチエージェント強化学習手法をどのように利用できるかを検討する。
外部制御の"粗い"レベルであっても、完全に分散されたアプローチが驚くほどうまく機能することがわかった。
- 参考スコア(独自算出の注目度): 5.787117733071415
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Experimental advances enabling high-resolution external control create new
opportunities to produce materials with exotic properties. In this work, we
investigate how a multi-agent reinforcement learning approach can be used to
design external control protocols for self-assembly. We find that a fully
decentralized approach performs remarkably well even with a "coarse" level of
external control. More importantly, we see that a partially decentralized
approach, where we include information about the local environment allows us to
better control our system towards some target distribution. We explain this by
analyzing our approach as a partially-observed Markov decision process. With a
partially decentralized approach, the agent is able to act more presciently,
both by preventing the formation of undesirable structures and by better
stabilizing target structures as compared to a fully decentralized approach.
- Abstract(参考訳): 高分解能外部制御を可能にする実験的進歩は、エキゾチックな特性を持つ材料を作る新しい機会を生み出す。
本研究では, 自己組立のための外部制御プロトコルの設計にマルチエージェント強化学習手法を用いる方法を検討する。
完全に分散したアプローチは,外部制御の"コア"レベルにおいても非常にうまく機能する。
さらに重要なのは、ローカル環境に関する情報を含む部分分散アプローチによって、システムのターゲットディストリビューションへの制御性が向上する、ということです。
我々は、このアプローチを部分的に観測されたマルコフ決定過程として分析することで、これを説明できる。
部分的に分散したアプローチでは、望ましくない構造の形成を防止し、完全に分散したアプローチと比較してターゲット構造を安定化させることによって、エージェントはより前もって行動することができる。
関連論文リスト
- ROMA-iQSS: An Objective Alignment Approach via State-Based Value Learning and ROund-Robin Multi-Agent Scheduling [44.276285521929424]
本稿では,エージェントが独立して最適な状態を発見できる分散状態ベース価値学習アルゴリズムを提案する。
我々の理論分析は、我々のアプローチが分散化されたエージェントを最適な集団政策へと導くことを示している。
さらに実験により,本手法が既存の分散状態ベースおよび行動ベース価値学習戦略より優れていることを示す。
論文 参考訳(メタデータ) (2024-04-05T09:39:47Z) - Multi-Agent Reinforcement Learning-Based UAV Pathfinding for Obstacle Avoidance in Stochastic Environment [12.122881147337505]
マルチエージェント強化学習に基づく分散実行手法を用いた新しい集中型学習法を提案する。
このアプローチでは、エージェントは集中型プランナーとのみ通信し、オンラインで分散的な決定を行う。
訓練効率を高めるため,多段階強化学習において多段階値収束を行う。
論文 参考訳(メタデータ) (2023-10-25T14:21:22Z) - Towards Integrated Traffic Control with Operating Decentralized
Autonomous Organization [21.34190936421136]
分散自治機構(DAO)の枠組みに基づく統合制御手法を提案する。
提案手法は, エネルギー消費効率(ECE)に関する世界的コンセンサスを達成し, コンセンサスとインセンティブ機構を通じて, 全知的エージェントの局所的な目的を最適化する。
論文 参考訳(メタデータ) (2023-07-25T08:22:18Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - Decentralized Adversarial Training over Graphs [55.28669771020857]
機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。
この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文 参考訳(メタデータ) (2023-03-23T15:05:16Z) - Learning Safe Multi-Agent Control with Decentralized Neural Barrier
Certificates [19.261536710315028]
エージェントが静的な障害物や衝突に対する衝突を避けて目標を達成すべきマルチエージェント安全制御問題について検討する。
私達の中心の考えは安全証明書として制御障壁機能を学ぶことと複数のエージェント制御方針を共同で学ぶことです。
本稿では,特定の関数クラスに対して一般化を保証し,分散的に実装可能な新しい共同学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-14T03:17:17Z) - Is Independent Learning All You Need in the StarCraft Multi-Agent
Challenge? [100.48692829396778]
独立PPO (Independent PPO) は独立学習の一種であり、各エージェントはその局所値関数を単純に推定する。
IPPOの強い性能は、ある種の非定常性に対する堅牢性に起因する可能性がある。
論文 参考訳(メタデータ) (2020-11-18T20:29:59Z) - Efficient Empowerment Estimation for Unsupervised Stabilization [75.32013242448151]
エンパワーメント原理は 直立位置での 力学系の教師なし安定化を可能にする
本稿では,ガウスチャネルとして動的システムのトレーニング可能な表現に基づく代替解を提案する。
提案手法は, サンプルの複雑さが低く, 訓練時より安定であり, エンパワーメント機能の本質的特性を有し, 画像からエンパワーメントを推定できることを示す。
論文 参考訳(メタデータ) (2020-07-14T21:10:16Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。