論文の概要: Dual-level Behavioral Consistency for Inter-group and Intra-group Coordination in Multi-Agent Systems
- arxiv url: http://arxiv.org/abs/2506.18651v1
- Date: Mon, 23 Jun 2025 13:54:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:37.007061
- Title: Dual-level Behavioral Consistency for Inter-group and Intra-group Coordination in Multi-Agent Systems
- Title(参考訳): 多エージェントシステムにおけるグループ間およびグループ内コーディネートのための二重レベル挙動整合性
- Authors: Shuocun Yang, Huawen Hu, Enze Shi, Shu Zhang,
- Abstract要約: 本稿では,グループ内およびグループ間の両方でエージェントの挙動を明示的に制御する新しいMARL制御法であるDual-Level Behavioral Consistency (DLBC)を紹介する。
DLBCはエージェントを異なるグループに分割し、これらのグループ内とグループ間の行動の多様性を動的に調節する。
様々なグループ連携シナリオにおける実験結果から,DLBCはグループ間協調性能とグループ間タスク専門化の両方を著しく向上させることが示された。
- 参考スコア(独自算出の注目度): 2.2074752982319654
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Behavioral diversity in Multi-agent reinforcement learning(MARL) represents an emerging and promising research area. Prior work has largely centered on intra-group behavioral consistency in multi-agent systems, with limited attention given to behavioral consistency in multi-agent grouping scenarios. In this paper, we introduce Dual-Level Behavioral Consistency (DLBC), a novel MARL control method designed to explicitly regulate agent behaviors at both intra-group and inter-group levels. DLBC partitions agents into distinct groups and dynamically modulates behavioral diversity both within and between these groups. By dynamically modulating behavioral diversity within and between these groups, DLBC achieves enhanced division of labor through inter-group consistency, which constrains behavioral strategies across different groups. Simultaneously, intra-group consistency, achieved by aligning behavioral strategies within each group, fosters stronger intra-group cooperation. Crucially, DLBC's direct constraint of agent policy functions ensures its broad applicability across various algorithmic frameworks. Experimental results in various grouping cooperation scenarios demonstrate that DLBC significantly enhances both intra-group cooperative performance and inter-group task specialization, yielding substantial performance improvements. DLBC provides new ideas for behavioral consistency control of multi-intelligent body systems, and its potential for application in more complex tasks and dynamic environments can be further explored in the future.
- Abstract(参考訳): マルチエージェント強化学習(MARL)における行動多様性は、新興かつ有望な研究領域を表している。
先行研究は、マルチエージェントシステムにおけるグループ内の行動整合性を中心に行われており、マルチエージェントグループにおける行動整合性に限定的な注意が払われている。
本稿では,グループ内およびグループ間の両方でエージェントの挙動を明示的に制御する新しいMARL制御法であるDual-Level Behavioral Consistency (DLBC)を紹介する。
DLBCはエージェントを異なるグループに分割し、これらのグループ内とグループ間の行動の多様性を動的に調節する。
これらのグループ間の行動の多様性を動的に調節することにより、DLBCはグループ間の整合性を通じて、異なるグループ間の行動戦略を制約する労働の分業を達成する。
同時に、グループ内での行動戦略の整合によって達成されるグループ内一貫性は、グループ内協力の強化を促進する。
重要なことに、DLBCのエージェントポリシー関数の直接的な制約は、様々なアルゴリズムフレームワークで広く適用可能であることを保証している。
様々なグループ連携シナリオにおける実験結果から,DLBCはグループ間協調性能とグループ間タスク専門化の両方を著しく向上させ,実質的なパフォーマンス向上をもたらすことが示された。
DLBCは、多知能体システムの行動整合性制御のための新しいアイデアを提供し、より複雑なタスクや動的環境への応用の可能性をさらに探求することができる。
関連論文リスト
- Capability-Aware Shared Hypernetworks for Flexible Heterogeneous Multi-Robot Coordination [2.6590401523087634]
マルチロボットチームのための能力認識共有ハイパーネットワークス(CASH)を提案する。
CASHは、ハイパーネットワークを使用してフレキシブルな共有ポリシを効率的に学習する、ソフトウェイト共有アーキテクチャである。
トレーニングとゼロショットの一般化の両方において、CASHは性能とサンプル効率の点で、ベースラインアーキテクチャを一貫して上回っていることを示す。
論文 参考訳(メタデータ) (2025-01-10T15:39:39Z) - Enhancing Cooperation through Selective Interaction and Long-term Experiences in Multi-Agent Reinforcement Learning [10.932974027102619]
本研究では,空間的囚人のジレンマゲームにおけるマルチエージェント強化学習に基づく計算フレームワークを提案する。
2つの異なるQ-ネットを用いて各エージェントをモデル化することにより、協調と相互作用の共進化ダイナミクスを解き放つ。
論文 参考訳(メタデータ) (2024-05-04T12:42:55Z) - DCIR: Dynamic Consistency Intrinsic Reward for Multi-Agent Reinforcement
Learning [84.22561239481901]
本稿では,エージェントの行動が他のエージェントの行動と一致しているかどうかを学習するための新しいアプローチを提案する。
マルチエージェント粒子, Google Research Football および StarCraft II Micromanagement を含む複数の環境における DCIR の評価を行った。
論文 参考訳(メタデータ) (2023-12-10T06:03:57Z) - AgentVerse: Facilitating Multi-Agent Collaboration and Exploring
Emergent Behaviors [93.38830440346783]
本稿では,その構成をより高機能なシステムとして協調的に調整できるマルチエージェントフレームワークを提案する。
実験により,フレームワークが単一エージェントより優れたマルチエージェントグループを効果的に展開できることが実証された。
これらの振舞いの観点から、我々は、ポジティブなものを活用し、ネガティブなものを緩和し、マルチエージェントグループの協調可能性を改善するためのいくつかの戦略について議論する。
論文 参考訳(メタデータ) (2023-08-21T16:47:11Z) - Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。
チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文 参考訳(メタデータ) (2022-10-17T07:16:44Z) - Policy Diagnosis via Measuring Role Diversity in Cooperative Multi-agent
RL [107.58821842920393]
我々はエージェントの行動差を定量化し、bfロールの多様性を通して政策パフォーマンスとの関係を構築する
MARLの誤差は, 役割多様性と強い関係を持つ3つの部分に分けられる。
分解された要因は3つの一般的な方向における政策最適化に大きな影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2022-06-01T04:58:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。