論文の概要: Network Distributed Multi-Agent Reinforcement Learning for Consensus Control of Quadcopters
- arxiv url: http://arxiv.org/abs/2606.02107v1
- Date: Mon, 01 Jun 2026 11:39:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.892972
- Title: Network Distributed Multi-Agent Reinforcement Learning for Consensus Control of Quadcopters
- Title(参考訳): クアッドコプターのコンセンサス制御のためのネットワーク分散マルチエージェント強化学習
- Authors: Youssef Mahran, Zeyad Gamal, Aamir Ahmad, Ayman El-Badawy,
- Abstract要約: 本稿では,クワッドコプターコンセンサス制御のためのネットワーク分散マルチエージェント強化学習(ND-MARL)フレームワークを提案する。
その結果、集中型MARLコントローラと比較して、スムーズなコンセンサストラジェクトリとプランナー-トラッカー統合が示された。
- 参考スコア(独自算出の注目度): 1.0499611180329804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a Network Distributed Multi-Agent Reinforcement Learning (ND-MARL) framework for quadcopter consensus control. Compared to conventional multi-agent MARL formulations that rely on centralized planning or fully decentralized execution, ND-MARL incorporates the swarm communication graph into the decision process. Under a 2-Neighbor communication topology, each agent observes information of only two neighbors and outputs an action through a distributed policy. A high-level distributed consensus planner is trained using Multi-Agent Soft Actor-Critic (MASAC) and embedded in a hierarchical stack to generate reference target positions tracked by a low-level quadcopter controller. Results demonstrate smooth consensus trajectories and planner-tracker integration when compared to a centralized MARL controller. Most notably, the learned controller exhibits zero-shot scalability, as policies trained on a three-agent system are deployed to swarms of up to 250 agents under the same 2-Neighbor communication topology without retraining or fine-tuning, achieving consistent convergence with increasing steady-state spread at large team sizes due to sparse information propagation. These findings highlight ND-MARL as a stable framework for distributed, communication-aware quadcopter consensus control.
- Abstract(参考訳): 本稿では,クワッドコプターコンセンサス制御のためのネットワーク分散マルチエージェント強化学習(ND-MARL)フレームワークを提案する。
ND-MARLは、中央集権計画や完全な分散実行に依存する従来のマルチエージェントMARLの定式化と比較して、Swarm通信グラフを決定プロセスに組み込んでいる。
2-Neighbor通信トポロジーの下で、各エージェントは2つの隣人の情報のみを観察し、分散ポリシーを介してアクションを出力する。
高レベルの分散コンセンサスプランナーは、マルチエージェント・ソフトアクター・クリティカル(MASAC)を用いて訓練され、階層的なスタックに埋め込まれ、低レベルのクアッドコプターコントローラによって追跡される基準目標位置を生成する。
その結果、集中型MARLコントローラと比較して、スムーズなコンセンサストラジェクトリとプランナー-トラッカー統合が示された。
最も注目すべきは、学習されたコントローラがゼロショットのスケーラビリティを示すことだ。3エージェントシステムでトレーニングされたポリシーは、トレーニングや微調整をすることなく、2つの隣の通信トポロジの下で最大250のエージェントの群にデプロイされる。
これらの結果は,分散通信対応クアッドコプターコンセンサス制御のための安定フレームワークとしてND-MARLが注目されている。
関連論文リスト
- Learning to Communicate Locally for Large-Scale Multi-Agent Pathfinding [48.1609560841622]
本稿では,効率的な特徴共有を通じてエージェント間の協調を強化するための学習可能な通信モジュールを提案する。
提案手法は既存の学習ベースMAPFソルバよりも優れていることを示す。
論文 参考訳(メタデータ) (2026-05-08T12:05:08Z) - Multi-Agent Deep Reinforcement Learning Under Constrained Communications [2.7126292487109005]
本稿では,集中型批判者やグローバル情報の必要性を解消する分散マルチエージェント強化学習(MARL)フレームワークを提案する。
マルチホップ通信によるグローバルな状態推論を行う新しいグラフ注意ネットワーク(D-GAT)を開発した。
また、エージェントがローカルポリシーや値関数を最適化する分散MARLフレームワークである分散グラフアテンションMAPPO(DG-MAPPO)を開発した。
論文 参考訳(メタデータ) (2026-01-22T21:07:18Z) - Decentralized Multi-Agent Active Search and Tracking when Targets
Outnumber Agents [8.692007892160913]
そこで我々は,DecSTERと呼ばれる分散マルチエージェント,マルチターゲット,同時アクティブ検索・追跡アルゴリズムを提案する。
提案アルゴリズムは,確率仮説密度フィルタの逐次モントカルロ法とトンプソンサンプリングを併用し,分散化マルチエージェント意思決定を行う。
シミュレーションでは,DecSTERは信頼性の低いエージェント間通信に頑健であり,最適サブパターン割り当て(OSPA)の指標で情報グレディベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2024-01-06T08:10:58Z) - MADiff: Offline Multi-agent Learning with Diffusion Models [79.18130544233794]
MADiffは拡散型マルチエージェント学習フレームワークである。
分散ポリシと集中型コントローラの両方として機能する。
実験の結果,MADiffは様々なマルチエージェント学習タスクにおいて,ベースラインアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T02:14:09Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z) - Multi-agent Reinforcement Learning for Networked System Control [6.89105475513757]
本稿では,ネットワークシステム制御におけるマルチエージェント強化学習(MARL)について考察する。
我々は,NMARLにおける情報損失と非定常性を低減するため,NeurCommと呼ばれる新しい通信プロトコルを提案する。
NeurCommは学習効率と制御性能の両方で既存の通信プロトコルより優れている。
論文 参考訳(メタデータ) (2020-04-03T02:21:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。