論文の概要: Communication-Aware Multi-Agent Reinforcement Learning for Decentralized Cooperative UAV Deployment
- arxiv url: http://arxiv.org/abs/2603.16141v1
- Date: Tue, 17 Mar 2026 05:48:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:07.117626
- Title: Communication-Aware Multi-Agent Reinforcement Learning for Decentralized Cooperative UAV Deployment
- Title(参考訳): 分散協調型UAV展開のためのコミュニケーション対応マルチエージェント強化学習
- Authors: Enguang Fan, Yifan Chen, Zihan Shan, Matthew Caesar, Jae Kim,
- Abstract要約: 我々は、分散実行(CTDE)を用いた集中学習の下で訓練されたグラフに基づくマルチエージェント強化学習フレームワークを提案する。
中央集権的な批評家とグローバルな国家は訓練中のみ利用可能であり、各UAVは近隣住民からのローカルな観察とメッセージを使用して共有ポリシーを実行する。
本アーキテクチャでは,ローカルエージェントの状態と周辺エンティティをエージェント・エンタテイメント・モジュールでエンコードし,距離限定通信グラフ上でUAV間メッセージを隣接する自己注意で集約する。
- 参考スコア(独自算出の注目度): 5.204648436671471
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Autonomous Unmanned Aerial Vehicle (UAV) swarms are increasingly used as rapidly deployable aerial relays and sensing platforms, yet practical deployments must operate under partial observability and intermittent peer-to-peer links. We present a graph-based multi-agent reinforcement learning framework trained under centralized training with decentralized execution (CTDE): a centralized critic and global state are available only during training, while each UAV executes a shared policy using local observations and messages from nearby neighbors. Our architecture encodes local agent state and nearby entities with an agent-entity attention module, and aggregates inter-UAV messages with neighbor self-attention over a distance-limited communication graph. We evaluate primarily on a cooperative relay deployment task (DroneConnect) and secondarily on an adversarial engagement task (DroneCombat). In DroneConnect, the proposed method achieves high coverage under restricted communication and partial observation (e.g. 74% coverage with M = 5 UAVs and N = 10 nodes) while remaining competitive with a mixed-integer linear programming (MILP) optimization-based offline upper bound, and it generalizes to unseen team sizes without fine-tuning. In the adversarial setting, the same framework transfers without architectural changes and improves win rate over non-communicating baselines.
- Abstract(参考訳): 無人無人航空機(UAV)の群れは、急速に展開可能な空中中継機やセンシングプラットフォームとしてますます利用されているが、実際の配備は部分的な観測可能性と断続的なピアツーピアリンクの下で運用されなければならない。
本稿では,集中学習と分散実行(CTDE)を併用したグラフベースのマルチエージェント強化学習フレームワークを提案する。
本アーキテクチャでは,ローカルエージェントの状態と周辺エンティティをエージェント・エンタテイメント・モジュールでエンコードし,距離限定通信グラフ上でUAV間メッセージを隣接する自己注意で集約する。
本研究は,主に協調的リレー展開タスク(DroneConnect)と,敵対的エンゲージメントタスク(DroneCombat)について評価する。
DroneConnect では,M = 5 UAV と N = 10 のノードに対して 74% のカバレッジを達成しつつ,MILP 最適化に基づくオフライン上界との競合を保ち,微調整を伴わないチームサイズに一般化する。
反対の設定では、同じフレームワークがアーキテクチャの変更なしに転送され、非コミュニケーションベースラインよりも勝利率が向上する。
関連論文リスト
- Multi-Agent Deep Reinforcement Learning for Collaborative UAV Relay Networks under Jamming Atatcks [36.380478794869234]
本稿では,この課題を,分散実行トレーニング(CTDE)フレームワークを用いて解決したMARL(Multi-Agent Reinforcement Learning)問題として定式化する。
提案手法はベースラインを著しく上回り,システム全体のスループットを約50%向上し,同時にほぼゼロの衝突速度を実現した。
重要な発見は、エージェントが明示的なプログラミングなしに創発的なアンチジャミング戦略を開発することである。
論文 参考訳(メタデータ) (2025-12-09T08:11:21Z) - Multi-Agent Reinforcement Learning for Task Offloading in Wireless Edge Networks [3.065057842316041]
エッジコンピューティングシステムでは、自律エージェントは共有リソースを競いながら、高速なローカル決定をしなければならない。
本稿では,各エージェントが制約付きマルコフ決定プロセス(CMDP)を解き,共有制約ベクトルを通じて暗黙的にコーディネートする分散フレームワークを提案する。
安全強化学習を用いて、エージェントは、地域とグローバルの両方の目標を満たすポリシーを学ぶ。
論文 参考訳(メタデータ) (2025-09-01T08:47:36Z) - Energy Efficient Task Offloading in UAV-Enabled MEC Using a Fully Decentralized Deep Reinforcement Learning Approach [0.6999740786886537]
無人航空機(UAV)は近年,マルチアクセスエッジコンピューティング(MEC)においてエッジサーバとして利用されている。
UAVの軌道を設計して、集中的な実行なしに完全に分散化されたセットアップを確保することが望ましい。
論文 参考訳(メタデータ) (2025-08-09T07:24:12Z) - LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Networked Communication for Mean-Field Games with Function Approximation and Empirical Mean-Field Estimation [59.01527054553122]
分散エージェントは、経験的システムの非絶対的実行から平均フィールドゲームにおいて平衡を学ぶことができる。
既存の設定に関数近似を導入し,Munchausen Online Mirror Descent 方式で描画する。
ポリシー情報の交換は,ネットワーク化されたエージェントが,機能近似設定において,独立エージェントと集中エージェントの両方より優れていることを示す。
論文 参考訳(メタデータ) (2024-08-21T13:32:46Z) - Muti-Agent Proximal Policy Optimization For Data Freshness in
UAV-assisted Networks [4.042622147977782]
収集したデータが時間に敏感な場合に注目し,そのタイムラインを維持することが重要である。
我々の目標は、UAVの軌道を最適に設計することであり、グローバル・エイジ・オブ・アップデート(AoU)のような訪問するIoTデバイスのサブセットを最小化することである。
論文 参考訳(メタデータ) (2023-03-15T15:03:09Z) - Scalable Perception-Action-Communication Loops with Convolutional and
Graph Neural Networks [208.15591625749272]
視覚に基づくグラフアグリゲーション・アンド・推論(VGAI)を用いた知覚-行動-コミュニケーションループの設計を提案する。
我々のフレームワークは、畳み込みとグラフニューラルネットワーク(CNN/GNN)のカスケードによって実装され、エージェントレベルの視覚知覚と特徴学習に対処する。
我々は、VGAIが他の分散コントローラに匹敵する性能を得ることを示した。
論文 参考訳(メタデータ) (2021-06-24T23:57:21Z) - Attention-based Reinforcement Learning for Real-Time UAV Semantic
Communication [53.46235596543596]
移動地利用者に対する空対地超信頼性・低遅延通信(URLLC)の問題点について検討する。
グラフアテンション交換ネットワーク(GAXNet)を用いたマルチエージェント深層強化学習フレームワークを提案する。
GAXNetは、最先端のベースラインフレームワークと比較して、0.0000001エラー率で6.5倍のレイテンシを実現している。
論文 参考訳(メタデータ) (2021-05-22T12:43:25Z) - Learning Connectivity for Data Distribution in Robot Teams [96.39864514115136]
グラフニューラルネットワーク(GNN)を用いたアドホックネットワークにおけるデータ分散のためのタスク非依存,分散化,低レイテンシ手法を提案する。
当社のアプローチは、グローバル状態情報に基づいたマルチエージェントアルゴリズムを各ロボットで利用可能にすることで機能させます。
我々は,情報の平均年齢を報酬関数として強化学習を通じて分散gnn通信政策を訓練し,タスク固有の報酬関数と比較してトレーニング安定性が向上することを示す。
論文 参考訳(メタデータ) (2021-03-08T21:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。