論文の概要: Safe Heterogeneous Multi-Agent RL with Communication Regularization for Coordinated Target Acquisition
- arxiv url: http://arxiv.org/abs/2601.08327v1
- Date: Tue, 13 Jan 2026 08:30:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-14 18:27:19.117972
- Title: Safe Heterogeneous Multi-Agent RL with Communication Regularization for Coordinated Target Acquisition
- Title(参考訳): 協調目標獲得のための通信規則化による安全異種マルチエージェントRL
- Authors: Gabriele Calzolari, Vidya Sumathy, Christoforos Kanellakis, George Nikolakopoulos,
- Abstract要約: 本稿では,分散型マルチエージェント強化学習フレームワークを提案する。
構造的に異質なエージェントのチームが、ランダムに位置したターゲットを共同で発見し、取得することができる。
- 参考スコア(独自算出の注目度): 14.31446990918297
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces a decentralized multi-agent reinforcement learning framework enabling structurally heterogeneous teams of agents to jointly discover and acquire randomly located targets in environments characterized by partial observability, communication constraints, and dynamic interactions. Each agent's policy is trained with the Multi-Agent Proximal Policy Optimization algorithm and employs a Graph Attention Network encoder that integrates simulated range-sensing data with communication embeddings exchanged among neighboring agents, enabling context-aware decision-making from both local sensing and relational information. In particular, this work introduces a unified framework that integrates graph-based communication and trajectory-aware safety through safety filters. The architecture is supported by a structured reward formulation designed to encourage effective target discovery and acquisition, collision avoidance, and de-correlation between the agents' communication vectors by promoting informational orthogonality. The effectiveness of the proposed reward function is demonstrated through a comprehensive ablation study. Moreover, simulation results demonstrate safe and stable task execution, confirming the framework's effectiveness.
- Abstract(参考訳): 本稿では,部分観測可能性,通信制約,動的相互作用を特徴とする環境下で,異質なエージェントチームによるランダムな目標の発見と獲得を可能にする分散型マルチエージェント強化学習フレームワークを提案する。
各エージェントのポリシーはマルチエージェント・プロキシ・ポリシー・オプティマイゼーションアルゴリズムを用いてトレーニングされ、グラフアテンション・ネットワークエンコーダを用いて、シミュレーションされたレンジセンシングデータを近隣エージェント間で交換された通信埋め込みと統合し、ローカルセンシングとリレーショナル情報の両方からコンテキスト認識による意思決定を可能にする。
特に、この研究は、グラフベースの通信と、安全フィルタを通じて軌跡認識の安全性を統合する統一的なフレームワークを導入している。
このアーキテクチャは、情報直交を促進することにより、エージェントの通信ベクトル間の効果的な目標発見と獲得、衝突回避、および非相関を促進するために設計された構造化された報酬定式化によって支持される。
提案した報奨関数の有効性は包括的アブレーション研究により実証された。
さらに、シミュレーションの結果、安全で安定したタスク実行を示し、フレームワークの有効性を確認する。
関連論文リスト
- Scalable Multiagent Reinforcement Learning with Collective Influence Estimation [5.050035210247092]
本稿では,集団影響推定ネットワークを付加したマルチエージェント学習フレームワークを提案する。
タスクオブジェクトに対する他のエージェントの集団的影響を明示的にモデル化することにより、各エージェントはクリティカルな相互作用情報を推測することができる。
実験の結果,提案手法は通信制限環境下での安定かつ効率的な協調を実現することがわかった。
論文 参考訳(メタデータ) (2026-01-13T04:24:11Z) - InterAgent: Physics-based Multi-agent Command Execution via Diffusion on Interaction Graphs [72.5651722107621]
InterAgentはテキスト駆動型物理ベースのマルチエージェントヒューマノイド制御のためのエンドツーエンドフレームワークである。
本稿では,マルチストリームブロックを備えた自己回帰拡散トランスフォーマーを提案する。
また,空間依存性の微粒化を明示的に捉えた対話グラフのエクスセプション表現を提案する。
論文 参考訳(メタデータ) (2025-12-08T10:46:01Z) - Joint Optimization of Cooperation Efficiency and Communication Covertness for Target Detection with AUVs [105.81167650318054]
本稿では,自律型水中車両(AUV)を用いた水中協調目標検出について検討する。
まず,共同軌道と電力制御の最適化問題を定式化し,それを解決するための革新的な階層的行動管理フレームワークを提案する。
集中学習と分散実行のパラダイムの下で,我々の目標検出フレームワークは,エネルギーとモビリティの制約を満たすとともに,適応的なカバート協調を可能にする。
論文 参考訳(メタデータ) (2025-10-21T02:14:11Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文 参考訳(メタデータ) (2024-05-14T12:40:25Z) - Attention Based Feature Fusion For Multi-Agent Collaborative Perception [4.120288148198388]
グラフアテンションネットワーク(GAT)の形での中間的協調認識ソリューションを提案する。
提案手法は,複数の連結エージェント間で交換される中間表現を融合するアテンションベースのアグリゲーション戦略を開発する。
このアプローチは、チャネルレベルと空間レベルの中間特徴写像における重要な領域を適応的に強調することにより、オブジェクト検出精度が向上する。
論文 参考訳(メタデータ) (2023-05-03T12:06:11Z) - Depthwise Convolution for Multi-Agent Communication with Enhanced
Mean-Field Approximation [9.854975702211165]
本稿では,MARL(Multi-agent RL)課題に取り組むための,局所的なコミュニケーション学習に基づく新しい手法を提案する。
まず,局所的な関係を効率的に抽出する深層的畳み込み機能を利用する新しい通信プロトコルを設計する。
第2に,エージェント相互作用の規模を減らすために,平均場近似を導入する。
論文 参考訳(メタデータ) (2022-03-06T07:42:43Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。