論文の概要: Learning Bilateral Team Formation in Cooperative Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2506.20039v1
- Date: Tue, 24 Jun 2025 22:40:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-26 21:00:42.547652
- Title: Learning Bilateral Team Formation in Cooperative Multi-Agent Reinforcement Learning
- Title(参考訳): 協調型多エージェント強化学習における双方向チーム形成の学習
- Authors: Koorosh Moslemi, Chi-Guhn Lee,
- Abstract要約: 動的マルチエージェントシステムにおいて,チーム構成を双方向に学習するためのフレームワークを提案する。
両チーム構成におけるアルゴリズム特性が政策性能と一般化に与える影響について考察する。
我々は、広く採用されているマルチエージェントシナリオを用いて、競争性能を実証し、ほとんどのシナリオにおける一般化を改善したアプローチを検証する。
- 参考スコア(独自算出の注目度): 7.028778922533688
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Team formation and the dynamics of team-based learning have drawn significant interest in the context of Multi-Agent Reinforcement Learning (MARL). However, existing studies primarily focus on unilateral groupings, predefined teams, or fixed-population settings, leaving the effects of algorithmic bilateral grouping choices in dynamic populations underexplored. To address this gap, we introduce a framework for learning two-sided team formation in dynamic multi-agent systems. Through this study, we gain insight into what algorithmic properties in bilateral team formation influence policy performance and generalization. We validate our approach using widely adopted multi-agent scenarios, demonstrating competitive performance and improved generalization in most scenarios.
- Abstract(参考訳): チーム形成とチームベースの学習のダイナミクスは、MARL(Multi-Agent Reinforcement Learning)の文脈において大きな関心を集めている。
しかし、既存の研究は主に一方的なグループ分け、事前定義されたチーム、または固定的な人口設定に焦点を合わせており、動的集団におけるアルゴリズム的二元的グループ分けの選択の影響が過小評価されている。
このギャップに対処するために、動的マルチエージェントシステムにおいて、双方向チーム形成を学ぶためのフレームワークを導入する。
本研究では,両チーム形成におけるアルゴリズム特性が政策性能と一般化に与える影響について考察する。
我々は、広く採用されているマルチエージェントシナリオを用いて、競争性能を実証し、ほとんどのシナリオにおける一般化を改善したアプローチを検証する。
関連論文リスト
- Dual-level Behavioral Consistency for Inter-group and Intra-group Coordination in Multi-Agent Systems [2.2074752982319654]
本稿では,グループ内およびグループ間の両方でエージェントの挙動を明示的に制御する新しいMARL制御法であるDual-Level Behavioral Consistency (DLBC)を紹介する。
DLBCはエージェントを異なるグループに分割し、これらのグループ内とグループ間の行動の多様性を動的に調節する。
様々なグループ連携シナリオにおける実験結果から,DLBCはグループ間協調性能とグループ間タスク専門化の両方を著しく向上させることが示された。
論文 参考訳(メタデータ) (2025-06-23T13:54:34Z) - Multi-Agent Collaboration via Evolving Orchestration [61.93162413517026]
大規模言語モデル(LLM)は、様々な下流タスクで顕著な成果を上げているが、そのモノリシックな性質は複雑な問題解決におけるスケーラビリティと効率を制限している。
LLMをベースとしたマルチエージェントコラボレーションのためのパウチスタイルのパラダイムを提案し、中央オーケストレータがタスク状態の進化に応じてエージェントを動的に指示する。
クローズドドメインおよびオープンドメインシナリオの実験により,この手法は計算コストを低減し,優れた性能が得られることが示された。
論文 参考訳(メタデータ) (2025-05-26T07:02:17Z) - Unified Generative and Discriminative Training for Multi-modal Large Language Models [88.84491005030316]
生成的トレーニングにより、視覚言語モデル(VLM)は様々な複雑なタスクに取り組むことができる。
CLIPのようなモデルで実証された差別的トレーニングは、ゼロショットイメージテキストの分類と検索に優れています。
本稿では,両パラダイムの強みを統合する統一的アプローチを提案する。
論文 参考訳(メタデータ) (2024-11-01T01:51:31Z) - Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards [1.179778723980276]
MARL(Multi-agent Reinforcement Learning)は、シーケンシャルな意思決定と制御タスクの鍵となるフレームワークである。
これらのシステムを現実のシナリオに展開するには、分散トレーニング、多様なエージェントセット、そして頻繁な環境報酬信号から学ぶ必要がある。
我々は,新しいグラフニューラルネットワーク(GNN)に基づく本質的なモチベーションを利用して,異種エージェントポリシーの学習を容易にするCoHetアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-12T21:38:40Z) - Quantifying Agent Interaction in Multi-agent Reinforcement Learning for
Cost-efficient Generalization [63.554226552130054]
マルチエージェント強化学習(MARL)における一般化の課題
エージェントが未確認のコプレイヤーに影響される程度は、エージェントのポリシーと特定のシナリオに依存する。
与えられたシナリオと環境におけるエージェント間の相互作用強度を定量化する指標であるLoI(Level of Influence)を提示する。
論文 参考訳(メタデータ) (2023-10-11T06:09:26Z) - Decentralized Adversarial Training over Graphs [44.03711922549992]
近年、敵攻撃に対する機械学習モデルの脆弱性が注目されている。
マルチエージェントシステムのための分散逆数フレームワークを開発する。
論文 参考訳(メタデータ) (2023-03-23T15:05:16Z) - Safe Multi-agent Learning via Trapping Regions [89.24858306636816]
我々は、動的システムの定性理論から知られているトラップ領域の概念を適用し、分散学習のための共同戦略空間に安全セットを作成する。
本稿では,既知の学習力学を持つシステムにおいて,候補がトラップ領域を形成することを検証するための二分分割アルゴリズムと,学習力学が未知のシナリオに対するサンプリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-27T14:47:52Z) - Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。
チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文 参考訳(メタデータ) (2022-10-17T07:16:44Z) - Celebrating Diversity in Shared Multi-Agent Reinforcement Learning [20.901606233349177]
深層多エージェント強化学習は、複雑な協調的な課題を解決することを約束している。
本稿では,共有型マルチエージェント強化学習の最適化と表現に多様性を導入することを目的とする。
提案手法は,Google Research Footballと超硬度StarCraft IIマイクロマネジメントタスクにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2021-06-04T00:55:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。