論文の概要: Cooperative Target Detection with AUVs: A Dual-Timescale Hierarchical MARDL Approach
- arxiv url: http://arxiv.org/abs/2509.13381v1
- Date: Tue, 16 Sep 2025 09:31:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.579785
- Title: Cooperative Target Detection with AUVs: A Dual-Timescale Hierarchical MARDL Approach
- Title(参考訳): AUVを用いた協調目標検出:2時間階層型MARDLアプローチ
- Authors: Zhang Xueyao, Yang Bo, Yu Zhiwen, Cao Xuelin, George C. Alexandropoulos, Merouane Debbah, Chau Yuen,
- Abstract要約: 敵の環境では、効率的な協調を実現するとともに、隠蔽活動を確保することが、水中での協力ミッションにとって重要な課題である。
本稿では,新しい時間スケール階層型マルチエージェント・ポリシー最適化フレームワークを提案する。
提案手法は, 高速収束を実現し, ベンチマークアルゴリズムの性能を向上し, 長期協調効率を最大化し, 隠蔽動作の確保を図る。
- 参考スコア(独自算出の注目度): 59.81681228738068
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous Underwater Vehicles (AUVs) have shown great potential for cooperative detection and reconnaissance. However, collaborative AUV communications introduce risks of exposure. In adversarial environments, achieving efficient collaboration while ensuring covert operations becomes a key challenge for underwater cooperative missions. In this paper, we propose a novel dual time-scale Hierarchical Multi-Agent Proximal Policy Optimization (H-MAPPO) framework. The high-level component determines the individuals participating in the task based on a central AUV, while the low-level component reduces exposure probabilities through power and trajectory control by the participating AUVs. Simulation results show that the proposed framework achieves rapid convergence, outperforms benchmark algorithms in terms of performance, and maximizes long-term cooperative efficiency while ensuring covert operations.
- Abstract(参考訳): 自律型水中車両(AUV)は、協調的な検出と偵察を行う大きな可能性を示している。
しかし、共同AUV通信は露光のリスクをもたらす。
敵の環境では、効率的な協調を実現するとともに、隠蔽活動を確保することが、水中での協力ミッションにとって重要な課題となる。
本稿では,H-MAPPO(H-MAPPO)フレームワークを新たに提案する。
高レベルコンポーネントは、中央AUVに基づいてタスクに参加している個人を判定し、低レベルコンポーネントは、参加AUVによる電力及び軌道制御を介して露光確率を低減する。
シミュレーションの結果,提案手法は高速収束を実現し,性能面でベンチマークアルゴリズムを上回り,長期協調効率を最大化するとともに,隠蔽動作の確保を図っている。
関連論文リスト
- LLM Meets the Sky: Heuristic Multi-Agent Reinforcement Learning for Secure Heterogeneous UAV Networks [57.27815890269697]
この研究は、エネルギー制約下での不均一なUAVネットワーク(HetUAVN)における機密率の最大化に焦点を当てている。
本稿では,Large Language Model (LLM) を用いたマルチエージェント学習手法を提案する。
その結果,本手法は機密性やエネルギー効率において,既存のベースラインよりも優れていた。
論文 参考訳(メタデータ) (2025-07-23T04:22:57Z) - Aerial Secure Collaborative Communications under Eavesdropper Collusion in Low-altitude Economy: A Generative Swarm Intelligent Approach [84.20358039333756]
本研究では,AAV群に分散コラボレーティブビームフォーミング(DCB)を導入し,対応する信号分布を制御して盗聴者の共謀を処理した。
両方向の秘密保持能力と最大サイドローブレベルを最小化して、未知の盗聴者からの情報漏洩を回避する。
本稿では,より少ないオーバーヘッドで問題を解決するために,新しいジェネレーティブ・スウォーム・インテリジェンス(GenSI)フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-02T04:02:58Z) - CaPo: Cooperative Plan Optimization for Efficient Embodied Multi-Agent Cooperation [98.11670473661587]
CaPoは,1)メタプラン生成,2)プログレッシブなメタプランと実行の2つのフェーズで協調効率を向上する。
3Dworld Multi-Agent TransportとCommunicative Watch-And-Helpタスクの実験結果は、CaPoが最先端技術と比較してタスク完了率と効率をはるかに高めることを示した。
論文 参考訳(メタデータ) (2024-11-07T13:08:04Z) - Guided Cooperation in Hierarchical Reinforcement Learning via Model-based Rollout [16.454305212398328]
モデルベースロールアウト(GCMR)を用いたガイド協調という,目標条件付き階層型強化学習(HRL)フレームワークを提案する。
GCMRは、フォワードダイナミクスを利用して層間情報同期と協調をブリッジすることを目的としている。
実験により,提案したGCMRフレームワークをHIGLのアンタングル変種(ACLG)に組み込むことにより,より安定かつ堅牢な政策改善が得られた。
論文 参考訳(メタデータ) (2023-09-24T00:13:16Z) - Practical Collaborative Perception: A Framework for Asynchronous and
Multi-Agent 3D Object Detection [9.967263440745432]
咬合は、LiDARベースのオブジェクト検出方法において大きな課題である。
最先端のV2X手法は、中間協調手法を用いて性能帯域幅のトレードオフを解消する。
我々は,従来の方法よりも帯域幅と性能のトレードオフを向上する,シンプルで効果的な協調手法を考案した。
論文 参考訳(メタデータ) (2023-07-04T03:49:42Z) - Boosting Value Decomposition via Unit-Wise Attentive State
Representation for Cooperative Multi-Agent Reinforcement Learning [11.843811402154408]
半可観測性を緩和し,UNSR(UNit-wise Attentive State Representation)による協調を効果的に促進する,シンプルかつ強力な手法を提案する。
UNSRでは、各エージェントは変換器ブロックから出力されるコンパクトで不整合な単位状態表現を学習し、その局所的なアクション値関数を生成する。
実験の結果,Star IICraftマイクロマネジメントの課題に対して,ソリッドベースラインよりも優れた性能とデータ効率が得られた。
論文 参考訳(メタデータ) (2023-05-12T00:33:22Z) - Modeling the Interaction between Agents in Cooperative Multi-Agent
Reinforcement Learning [2.9360071145551068]
対話型アクター・クリティック(IAC)と呼ばれる新しい協調型MARLアルゴリズムを提案する。
IACは政策と価値関数の観点からエージェントの相互作用をモデル化する。
連続制御タスクに値分解手法を拡張し、古典的な制御やマルチエージェント粒子環境を含むベンチマークタスク上でIACを評価する。
論文 参考訳(メタデータ) (2021-02-10T01:58:28Z) - UneVEn: Universal Value Exploration for Multi-Agent Reinforcement
Learning [53.73686229912562]
我々はUniversal Value Exploration(UneVEn)と呼ばれる新しいMARLアプローチを提案する。
UneVEnは、一連の関連するタスクと、普遍的な後継機能の線形分解を同時に学習する。
一連の探索ゲームにおける実証的な結果、エージェント間の重要な調整を必要とする協調捕食・捕食作業への挑戦、およびStarCraft IIのマイクロマネジメントベンチマークは、UneVEnが他の最先端のMARLメソッドが失敗するタスクを解決できることを示している。
論文 参考訳(メタデータ) (2020-10-06T19:08:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。