論文の概要: Multi-Agent Deep Reinforcement Learning for Collaborative UAV Relay Networks under Jamming Atatcks
- arxiv url: http://arxiv.org/abs/2512.08341v1
- Date: Tue, 09 Dec 2025 08:11:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.874655
- Title: Multi-Agent Deep Reinforcement Learning for Collaborative UAV Relay Networks under Jamming Atatcks
- Title(参考訳): ジャミングアタック下での協調型UAV中継ネットワークのマルチエージェント深部強化学習
- Authors: Thai Duong Nguyen, Ngoc-Tan Nguyen, Thanh-Dao Nguyen, Nguyen Van Huynh, Dinh-Hieu Tran, Symeon Chatzinotas,
- Abstract要約: 本稿では,この課題を,分散実行トレーニング(CTDE)フレームワークを用いて解決したMARL(Multi-Agent Reinforcement Learning)問題として定式化する。
提案手法はベースラインを著しく上回り,システム全体のスループットを約50%向上し,同時にほぼゼロの衝突速度を実現した。
重要な発見は、エージェントが明示的なプログラミングなしに創発的なアンチジャミング戦略を開発することである。
- 参考スコア(独自算出の注目度): 36.380478794869234
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The deployment of Unmanned Aerial Vehicle (UAV) swarms as dynamic communication relays is critical for next-generation tactical networks. However, operating in contested environments requires solving a complex trade-off, including maximizing system throughput while ensuring collision avoidance and resilience against adversarial jamming. Existing heuristic-based approaches often struggle to find effective solutions due to the dynamic and multi-objective nature of this problem. This paper formulates this challenge as a cooperative Multi-Agent Reinforcement Learning (MARL) problem, solved using the Centralized Training with Decentralized Execution (CTDE) framework. Our approach employs a centralized critic that uses global state information to guide decentralized actors which operate using only local observations. Simulation results show that our proposed framework significantly outperforms heuristic baselines, increasing the total system throughput by approximately 50% while simultaneously achieving a near-zero collision rate. A key finding is that the agents develop an emergent anti-jamming strategy without explicit programming. They learn to intelligently position themselves to balance the trade-off between mitigating interference from jammers and maintaining effective communication links with ground users.
- Abstract(参考訳): 無人航空機(UAV)群をダイナミック通信中継として展開することは、次世代の戦術ネットワークにとって重要である。
しかし、競合する環境での運用には、システムスループットの最大化を含む複雑なトレードオフの解決と、衝突回避と対向的妨害に対するレジリエンスの確保が必要である。
既存のヒューリスティックなアプローチは、この問題の動的かつ多目的的な性質のために、効果的な解決策を見つけるのに苦労することが多い。
本稿では,この課題を,分散学習とCTDE(Centralized Training with Decentralized Execution)フレームワークを用いて解決した,MARL(Multi-Agent Reinforcement Learning)問題として定式化する。
当社のアプローチでは,グローバルステート情報を利用した集中型評論家を用いて,局所的な観測のみを用いて活動する分散型アクターをガイドする。
シミュレーションの結果,提案手法はヒューリスティックベースラインを著しく上回り,システム全体のスループットを約50%向上し,同時にほぼゼロの衝突速度を達成した。
重要な発見は、エージェントが明示的なプログラミングなしに創発的なアンチジャミング戦略を開発することである。
彼らは、ジャムからの干渉を軽減することと、地上ユーザーとの効果的なコミュニケーションリンクを維持することの間のトレードオフを、インテリジェントに位置決めすることを学ぶ。
関連論文リスト
- Goal-Oriented Multi-Agent Reinforcement Learning for Decentralized Agent Teams [0.6676697660506798]
本稿では,車両がエージェントとして機能し,局地的な目標や観測に基づいて選択的にコミュニケーションできる分散マルチエージェント強化学習(MARL)フレームワークを提案する。
この目標対応コミュニケーション戦略により、エージェントは関連する情報のみを共有することができ、可視性制限を尊重しながらコラボレーションを強化することができる。
その結果,本手法は作業成功率を大幅に改善し,非協調的ベースラインに比べて時間とゴールを短縮することがわかった。
論文 参考訳(メタデータ) (2025-11-15T02:11:31Z) - Joint Optimization of Cooperation Efficiency and Communication Covertness for Target Detection with AUVs [105.81167650318054]
本稿では,自律型水中車両(AUV)を用いた水中協調目標検出について検討する。
まず,共同軌道と電力制御の最適化問題を定式化し,それを解決するための革新的な階層的行動管理フレームワークを提案する。
集中学習と分散実行のパラダイムの下で,我々の目標検出フレームワークは,エネルギーとモビリティの制約を満たすとともに,適応的なカバート協調を可能にする。
論文 参考訳(メタデータ) (2025-10-21T02:14:11Z) - Scalable Multi-Agent Path Finding using Collision-Aware Dynamic Alert Mask and a Hybrid Execution Strategy [14.091856940824258]
マルチエージェントパスフィンディングは、ロボット工学や自律システムにおいて重要な問題である。
本稿では,分散経路計画と軽量集中コーディネータを組み合わせたハイブリッドフレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-10T15:25:40Z) - Benchmarking LLMs' Swarm intelligence [51.648605206159125]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - MAGNNET: Multi-Agent Graph Neural Network-based Efficient Task Allocation for Autonomous Vehicles with Deep Reinforcement Learning [2.5022287664959446]
本稿では,グラフニューラルネットワーク(GNN)を一元的トレーニングと分散実行(CTDE)パラダイムに統合する新しいフレームワークを提案する。
本手法により,無人航空機 (UAV) と無人地上車両 (UGV) は, 中央調整を必要とせず, 効率よくタスクを割り当てることができる。
論文 参考訳(メタデータ) (2025-02-04T13:29:56Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - Design Optimization of NOMA Aided Multi-STAR-RIS for Indoor Environments: A Convex Approximation Imitated Reinforcement Learning Approach [51.63921041249406]
非直交多重アクセス(Noma)により、複数のユーザが同じ周波数帯域を共有でき、同時に再構成可能なインテリジェントサーフェス(STAR-RIS)を送信および反射することができる。
STAR-RISを屋内に展開することは、干渉緩和、電力消費、リアルタイム設定における課題を提示する。
複数のアクセスポイント(AP)、STAR-RIS、NOMAを利用した新しいネットワークアーキテクチャが屋内通信のために提案されている。
論文 参考訳(メタデータ) (2024-06-19T07:17:04Z) - Distributed Autonomous Swarm Formation for Dynamic Network Bridging [40.27919181139919]
離散化された部分観測可能なマルコフ決定過程(Dec-POMDP)における動的ネットワークブリッジ問題について定式化する。
グラフ畳み込み強化学習(DGN)に基づく問題に対するマルチエージェント強化学習(MARL)アプローチを提案する。
提案手法はシミュレーション環境で評価し,将来性を示す集中型ベースラインと比較した。
論文 参考訳(メタデータ) (2024-04-02T01:45:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。