論文の概要: Goal-Oriented Multi-Agent Reinforcement Learning for Decentralized Agent Teams
- arxiv url: http://arxiv.org/abs/2511.11992v1
- Date: Sat, 15 Nov 2025 02:11:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:23.488799
- Title: Goal-Oriented Multi-Agent Reinforcement Learning for Decentralized Agent Teams
- Title(参考訳): 分散型エージェントチームのための目標指向多エージェント強化学習
- Authors: Hung Du, Hy Nguyen, Srikanth Thudumu, Rajesh Vasa, Kon Mouzakis,
- Abstract要約: 本稿では,車両がエージェントとして機能し,局地的な目標や観測に基づいて選択的にコミュニケーションできる分散マルチエージェント強化学習(MARL)フレームワークを提案する。
この目標対応コミュニケーション戦略により、エージェントは関連する情報のみを共有することができ、可視性制限を尊重しながらコラボレーションを強化することができる。
その結果,本手法は作業成功率を大幅に改善し,非協調的ベースラインに比べて時間とゴールを短縮することがわかった。
- 参考スコア(独自算出の注目度): 0.6676697660506798
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Connected and autonomous vehicles across land, water, and air must often operate in dynamic, unpredictable environments with limited communication, no centralized control, and partial observability. These real-world constraints pose significant challenges for coordination, particularly when vehicles pursue individual objectives. To address this, we propose a decentralized Multi-Agent Reinforcement Learning (MARL) framework that enables vehicles, acting as agents, to communicate selectively based on local goals and observations. This goal-aware communication strategy allows agents to share only relevant information, enhancing collaboration while respecting visibility limitations. We validate our approach in complex multi-agent navigation tasks featuring obstacles and dynamic agent populations. Results show that our method significantly improves task success rates and reduces time-to-goal compared to non-cooperative baselines. Moreover, task performance remains stable as the number of agents increases, demonstrating scalability. These findings highlight the potential of decentralized, goal-driven MARL to support effective coordination in realistic multi-vehicle systems operating across diverse domains.
- Abstract(参考訳): 陸地、水、空気を横断する接続された自動運転車は、しばしば動的で予測不可能な環境で運用され、通信が制限され、集中制御が無く、部分的な観測が可能でなければならない。
これらの現実的な制約は、特に車両が個々の目的を追求するとき、調整に重大な課題をもたらす。
そこで本研究では,エージェントとして機能する車両をローカルな目標と観測に基づいて選択的に通信できる分散マルチエージェント強化学習(MARL)フレームワークを提案する。
この目標対応コミュニケーション戦略により、エージェントは関連する情報のみを共有することができ、可視性制限を尊重しながらコラボレーションを強化することができる。
障害物や動的エージェントの集団を特徴とする複雑なマルチエージェントナビゲーションタスクにおけるアプローチを検証する。
その結果,本手法は作業成功率を大幅に改善し,非協調的ベースラインに比べて時間とゴールを短縮することがわかった。
さらに、エージェントの数が増加するにつれてタスクパフォーマンスが安定し、スケーラビリティが実証される。
これらの知見は、多分野にわたる現実的なマルチ車両システムにおける効果的な協調を支援するために、分散化されたゴール駆動型MARLの可能性を浮き彫りにした。
関連論文リスト
- Joint Optimization of Cooperation Efficiency and Communication Covertness for Target Detection with AUVs [105.81167650318054]
本稿では,自律型水中車両(AUV)を用いた水中協調目標検出について検討する。
まず,共同軌道と電力制御の最適化問題を定式化し,それを解決するための革新的な階層的行動管理フレームワークを提案する。
集中学習と分散実行のパラダイムの下で,我々の目標検出フレームワークは,エネルギーとモビリティの制約を満たすとともに,適応的なカバート協調を可能にする。
論文 参考訳(メタデータ) (2025-10-21T02:14:11Z) - Learning to Interact in World Latent for Team Coordination [53.51290193631586]
本研究は,多エージェント強化学習(MARL)におけるチーム協調を支援するために,対話型ワールドラテント(IWoL)という新しい表現学習フレームワークを提案する。
コミュニケーションプロトコルを直接モデル化することにより,エージェント間関係とタスク固有の世界情報とを協調的にキャプチャする学習可能な表現空間を構築する。
私たちの表現は、各エージェントの暗黙のラテントとしてだけでなく、コミュニケーションのための明示的なメッセージとしても使用できます。
論文 参考訳(メタデータ) (2025-09-29T22:13:39Z) - RALLY: Role-Adaptive LLM-Driven Yoked Navigation for Agentic UAV Swarms [17.931091064654904]
役割適応型LCM駆動ヨードナビゲーションアルゴリズムをアラリカルに開発する。
RALLYは構造化自然言語を用いて効率的な意味コミュニケーションと協調推論を行う。
実験の結果, タスクカバレッジ, 収束速度, 一般化の点で, 従来手法よりも有意な性能を示した。
論文 参考訳(メタデータ) (2025-07-02T05:44:17Z) - Emergence of Roles in Robotic Teams with Model Sharing and Limited Communication [0.0]
本稿では,単一エージェントに学習を集中させるマルチエージェント捕食システムにおける強化学習戦略を提案する。
このアプローチは、MARLや集中学習モデルのようなアプローチと比較して、計算とエネルギーの需要を大幅に削減することを目的としている。
論文 参考訳(メタデータ) (2025-05-01T14:05:46Z) - Contextual Knowledge Sharing in Multi-Agent Reinforcement Learning with Decentralized Communication and Coordination [0.9776703963093367]
マルチエージェント強化学習(Dec-MARL)は、動的環境における複雑なタスクに対処するための重要なアプローチとして登場した。
本稿では,エージェントの知識共有プロセスに目標認識とタイムアウェアネスを取り入れ,ピアツーピアコミュニケーションとコーディネーションを統合した新しいDec-MARLフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-26T22:49:50Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Decentralized and Lifelong-Adaptive Multi-Agent Collaborative Learning [57.652899266553035]
分散型および生涯適応型多エージェント協調学習は、中央サーバを使わずに複数のエージェント間のコラボレーションを強化することを目的としている。
動的協調グラフを用いた分散マルチエージェント生涯協調学習アルゴリズムであるDeLAMAを提案する。
論文 参考訳(メタデータ) (2024-03-11T09:21:11Z) - AdverSAR: Adversarial Search and Rescue via Multi-Agent Reinforcement
Learning [4.843554492319537]
本稿では,敵対的エージェント間コミュニケーションの存在下で,ロボットの戦略を効率的に調整するアルゴリズムを提案する。
ロボットは対象の場所について事前の知識を持っておらず、隣接するロボットのサブセットのみといつでも対話できると仮定される。
提案手法の有効性は, グリッドワールド環境のプロトタイプで実証した。
論文 参考訳(メタデータ) (2022-12-20T08:13:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。