論文の概要: Coordination Matters: Evaluation of Cooperative Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.06557v1
- Date: Thu, 07 May 2026 16:50:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:12.011904
- Title: Coordination Matters: Evaluation of Cooperative Multi-Agent Reinforcement Learning
- Title(参考訳): 協調事項:協調的多エージェント強化学習の評価
- Authors: Maria Ana Cardei, Matthew Landers, Afsaneh Doryab,
- Abstract要約: プロセスレベルの診断でリターンを補うコーディネート・アウェア評価の視点を提案する。
制御されたコミットメント制約付き空間的タスク割り当てテストベッドSTATを用いて、この視点をインスタンス化する。
この結果から, 冗長配置の相違, 代入の多様性, タスク補完効率の相違など, 同様のリターン傾向が, 協調機構の相違を反映できることが示唆された。
- 参考スコア(独自算出の注目度): 1.9806597528054068
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cooperative multi-agent reinforcement learning (MARL) benchmarks commonly emphasize aggregate outcomes such as return, success rate, or completion time. While essential, these metrics often fail to reveal how agents coordinate, particularly in settings where agents, tasks, and joint assignment choices scale combinatorially. We propose a coordination-aware evaluation perspective that supplements return with process-level diagnostics. We instantiate this perspective using STAT, a controlled commitment-constrained spatial task-allocation testbed that systematically varies agents, tasks, and environment size while holding observation access and task rules fixed. We evaluate six representative value-based MARL methods across varying levels of centralization. Our results show that similar return trends can reflect distinct coordination mechanisms, including differences in redundant assignment, assignment diversity, and task-completion efficiency. We find that in commitment-constrained task allocation, performance under scale is shaped not only by nominal action-space size, but also by assignment pressure, sparse decision opportunities, and redundant choices among interdependent agents. Our findings motivate coordination-aware evaluation as a necessary complement to return-based benchmarking for cooperative MARL.
- Abstract(参考訳): 協調型マルチエージェント強化学習(MARL)ベンチマークは一般的に、リターン、成功率、完了時間などの集合結果を強調する。
これらの指標は必須ではあるが、エージェントのコーディネート、特にエージェント、タスク、共同割り当ての選択が組み合わせてスケールする環境での調整方法を明らかにするのに失敗することが多い。
プロセスレベルの診断でリターンを補うコーディネート・アウェア評価の視点を提案する。
エージェント,タスク,環境サイズを体系的に変更し,監視アクセスとタスクルールを固定した,コミットメント制約付き空間タスク割り当てテストベッドであるSTATを用いて,この視点をインスタンス化する。
我々は,6つの代表値に基づくMARL法を,様々なレベルの集中度で評価した。
この結果から, 冗長配置の相違, 代入の多様性, タスク補完効率の相違など, 同様のリターン傾向が, 協調機構の相違を反映できることが示唆された。
コミットメントに制約のあるタスクアロケーションでは、作業空間の大きさだけでなく、割り当てのプレッシャー、スパース決定の機会、相互依存エージェント間の冗長な選択によって、スケールのスケールが形成される。
本研究は,協調的MARLに対するリターンベースベンチマークの補足として,協調意識評価を動機づけるものである。
関連論文リスト
- Adaptive Value Decomposition: Coordinating a Varying Number of Agents in Urban Systems [19.19146852846605]
Adaptive Value Decomposition (AVD)は、動的に変化するエージェントに適応する協調的なMARLフレームワークである。
トレーニング実行戦略は、エージェントが異なるタイミングで行動するときの非同期な意思決定に対応するように設計されている。
論文 参考訳(メタデータ) (2026-02-10T03:41:14Z) - Multi-agent In-context Coordination via Decentralized Memory Retrieval [39.106914463842685]
多様なデータセットに基づいてトレーニングされた大規模なトランスフォーマーモデルは、これまで目に見えなかったタスクにおいて、印象的な数ショットのパフォーマンスを誇示している。
MARL(Multi-Agent Reinforcement Learning)では、エージェントが共通の目標に向かって調整しなければならない。
高速適応によるコーディネーション向上を目的とした新しい手法である分散メモリ検索(MAICC)によるマルチエージェントインコンテキストコーディネーションを提案する。
論文 参考訳(メタデータ) (2025-11-13T07:08:31Z) - Fully Decentralized Cooperative Multi-Agent Reinforcement Learning is A Context Modeling Problem [26.317044969022277]
本稿では,各エージェントが各状態,その局所行動,共有報酬のみを観察する,完全分散型協調型マルチエージェント強化学習について検討する。
他のエージェントのアクションにアクセスすることができないことは、値関数の更新や値関数の推定時の相対的な過一般化において非定常性をもたらすことが多い。
本研究では,各エージェントが局所的に認識するタスクをコンテキストマルコフ決定プロセスとして定式化する,DEC(Dynamics-Aware Context)という新しい手法を提案する。
論文 参考訳(メタデータ) (2025-09-19T01:52:44Z) - Offline Multi-agent Reinforcement Learning via Score Decomposition [51.23590397383217]
オフライン協調型マルチエージェント強化学習(MARL)は、分散シフトによる固有の課題に直面している。
この作業は、オフラインとオンラインのMARL間の分散ギャップを明示的に解決する最初の作業である。
論文 参考訳(メタデータ) (2025-05-09T11:42:31Z) - MultiAgentBench: Evaluating the Collaboration and Competition of LLM agents [59.825725526176655]
大規模言語モデル(LLM)は、自律的なエージェントとして顕著な能力を示している。
既存のベンチマークでは、単一エージェントタスクにフォーカスするか、狭いドメインに限定されており、マルチエージェントのコーディネーションと競合のダイナミクスを捉えていない。
多様な対話シナリオにまたがってLLMベースのマルチエージェントシステムを評価するためのベンチマークであるMultiAgentBenchを紹介する。
論文 参考訳(メタデータ) (2025-03-03T05:18:50Z) - Learning Reward Machines in Cooperative Multi-Agent Tasks [75.79805204646428]
本稿では,MARL(Multi-Agent Reinforcement Learning)に対する新しいアプローチを提案する。
これは、協調的なタスク分解と、サブタスクの構造をコードする報酬機(RM)の学習を組み合わせる。
提案手法は、部分的に観測可能な環境下での報酬の非マルコフ的性質に対処するのに役立つ。
論文 参考訳(メタデータ) (2023-03-24T15:12:28Z) - RACA: Relation-Aware Credit Assignment for Ad-Hoc Cooperation in
Multi-Agent Deep Reinforcement Learning [55.55009081609396]
本稿では、アドホックな協調シナリオにおいてゼロショットの一般化を実現するRACA(Relation-Aware Credit Assignment)と呼ばれる新しい手法を提案する。
RACAは、エージェント間のトポロジ構造を符号化するために、グラフベースのエンコーダ関係を利用する。
提案手法は,StarCraftIIマイクロマネジメントベンチマークとアドホック協調シナリオのベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2022-06-02T03:39:27Z) - Modeling the Interaction between Agents in Cooperative Multi-Agent
Reinforcement Learning [2.9360071145551068]
対話型アクター・クリティック(IAC)と呼ばれる新しい協調型MARLアルゴリズムを提案する。
IACは政策と価値関数の観点からエージェントの相互作用をモデル化する。
連続制御タスクに値分解手法を拡張し、古典的な制御やマルチエージェント粒子環境を含むベンチマークタスク上でIACを評価する。
論文 参考訳(メタデータ) (2021-02-10T01:58:28Z) - UneVEn: Universal Value Exploration for Multi-Agent Reinforcement
Learning [53.73686229912562]
我々はUniversal Value Exploration(UneVEn)と呼ばれる新しいMARLアプローチを提案する。
UneVEnは、一連の関連するタスクと、普遍的な後継機能の線形分解を同時に学習する。
一連の探索ゲームにおける実証的な結果、エージェント間の重要な調整を必要とする協調捕食・捕食作業への挑戦、およびStarCraft IIのマイクロマネジメントベンチマークは、UneVEnが他の最先端のMARLメソッドが失敗するタスクを解決できることを示している。
論文 参考訳(メタデータ) (2020-10-06T19:08:47Z) - Robust Learning Through Cross-Task Consistency [92.42534246652062]
クロスタスク整合性を用いた学習向上のための,広く適用可能な完全計算手法を提案する。
クロスタスク一貫性による学習は,より正確な予測と,アウト・オブ・ディストリビューション・インプットの一般化につながることを観察する。
論文 参考訳(メタデータ) (2020-06-07T09:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。