Fugu-MT 論文翻訳(概要): Group-Aware Coordination Graph for Multi-Agent Reinforcement Learning

論文の概要: Group-Aware Coordination Graph for Multi-Agent Reinforcement Learning

arxiv url: http://arxiv.org/abs/2404.10976v2
Date: Sat, 20 Apr 2024 05:04:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-23 12:48:38.815421
Title: Group-Aware Coordination Graph for Multi-Agent Reinforcement Learning
Title（参考訳）: マルチエージェント強化学習のためのグループ認識コーディネーショングラフ
Authors: Wei Duan, Jie Lu, Junyu Xuan,
Abstract要約: GACG(Group-Aware Coordination Graph)は、エージェントペア間の協調を現在の観測結果に基づいて捉えるように設計されている。 GACGは、意思決定中にエージェント間の情報交換のためのグラフ畳み込みにも使われる。本稿では,StarCraft IIマイクロマネジメントタスクによるGACGの性能評価を行った。
参考スコア（独自算出の注目度）: 19.386588137176933
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Cooperative Multi-Agent Reinforcement Learning (MARL) necessitates seamless collaboration among agents, often represented by an underlying relation graph. Existing methods for learning this graph primarily focus on agent-pair relations, neglecting higher-order relationships. While several approaches attempt to extend cooperation modelling to encompass behaviour similarities within groups, they commonly fall short in concurrently learning the latent graph, thereby constraining the information exchange among partially observed agents. To overcome these limitations, we present a novel approach to infer the Group-Aware Coordination Graph (GACG), which is designed to capture both the cooperation between agent pairs based on current observations and group-level dependencies from behaviour patterns observed across trajectories. This graph is further used in graph convolution for information exchange between agents during decision-making. To further ensure behavioural consistency among agents within the same group, we introduce a group distance loss, which promotes group cohesion and encourages specialization between groups. Our evaluations, conducted on StarCraft II micromanagement tasks, demonstrate GACG's superior performance. An ablation study further provides experimental evidence of the effectiveness of each component of our method.
Abstract（参考訳）: 協調的マルチエージェント強化学習(MARL)はエージェント間のシームレスな協調を必要とする。このグラフを学習する既存の方法は、主にエージェント対ペア関係に焦点をあて、高階関係を無視している。いくつかの手法は、グループ内の行動類似性を包含するように協調モデリングを拡張しようとするが、通常は潜伏グラフの同時学習において不足し、部分的に観察されたエージェント間の情報交換を制限している。これらの制約を克服するために,現在観測されている行動パターンからエージェントペア間の協調とグループレベルの依存性の両方を捉えるために,GACG(Group-Aware Coordination Graph)を推論する新しい手法を提案する。このグラフは、意思決定中にエージェント間の情報交換のためのグラフ畳み込みにさらに使用される。同一グループ内のエージェント間の行動整合性をさらに確保するため,グループ間の凝集を促進するグループ距離損失を導入し,グループ間の特殊化を促進する。本稿では,StarCraft IIマイクロマネジメントタスクによるGACGの性能評価を行った。アブレーション実験により, 本手法の各成分の有効性について実験的に検証した。

関連論文リスト

Deep Meta Coordination Graphs for Multi-agent Reinforcement Learning [2.650735171795961]
多エージェント強化学習(MARL)における協調政策学習のための深層メタコーディネートグラフ(DMCG) DMCGは、エージェント間の高次および間接的な関係をキャプチャする。その後、グラフ畳み込みネットワークモジュールを使用して、エンドツーエンドで強力な表現を学習する。
論文参考訳（メタデータ） (2025-02-06T12:35:52Z)
Who Walks With You Matters: Perceiving Social Interactions with Groups for Pedestrian Trajectory Prediction [14.009392073139441]
本稿では,GrouP ConCeption(GPCC)モデルを提案する。 GPCCモデルでは、軌道予測精度が大幅に向上し、社会的・個人的ダイナミクスをモデル化する上での有効性が検証された。
論文参考訳（メタデータ） (2024-12-03T11:47:33Z)
Enhancing Interaction Modeling with Agent Selection and Physical Coefficient for Trajectory Prediction [1.6954753390775528]
本稿では,インタラクションエージェントを手動で選択し,アテンションスコアの代わりに相関関係を計算するASPILinを提案する。興味深いことに、InterACTION、HighD、CitySimデータセットで実施された実験は、我々の手法が効率的かつ簡単であることを実証している。
論文参考訳（メタデータ） (2024-05-21T18:45:18Z)
Learning Multi-Agent Communication from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。提案手法であるCommFormerは,通信グラフを効率よく最適化し,勾配降下によるアーキテクチャパラメータをエンドツーエンドで並列に洗練する。
論文参考訳（メタデータ） (2024-05-14T12:40:25Z)
Enhancing Cooperation through Selective Interaction and Long-term Experiences in Multi-Agent Reinforcement Learning [10.932974027102619]
本研究では,空間的囚人のジレンマゲームにおけるマルチエージェント強化学習に基づく計算フレームワークを提案する。 2つの異なるQ-ネットを用いて各エージェントをモデル化することにより、協調と相互作用の共進化ダイナミクスを解き放つ。
論文参考訳（メタデータ） (2024-05-04T12:42:55Z)
Inferring Latent Temporal Sparse Coordination Graph for Multi-Agent Reinforcement Learning [19.386588137176933]
マルチエージェント強化学習(MARL)のための潜時スパース座標グラフ(LTS-CG)を提案する。このグラフ学習プロセスは、エージェントが今後の観測を予測できる予測・フューチャー(Predict-Future)と、限られたデータから環境コンテキストを徹底的に把握するInfer-Present(Infer-Present)という、2つの革新的な特徴によってさらに強化されている。 StarCraft IIベンチマークの結果はLTS-CGの優れた性能を裏付けるものだった。
論文参考訳（メタデータ） (2024-03-28T09:20:15Z)
Situation-Dependent Causal Influence-Based Cooperative Multi-agent Reinforcement Learning [18.054709749075194]
我々は、状況依存因果関係に基づく協調マルチエージェント強化学習(SCIC)という新しいMARLアルゴリズムを提案する。本研究の目的は,特定の状況におけるエージェント間因果関係の影響を,因果介入と条件付き相互情報を用いて検出することである。結果として得られたアップデートは、協調した探索と本質的な報酬分布をリンクし、全体的なコラボレーションとパフォーマンスを高めた。
論文参考訳（メタデータ） (2023-12-15T05:09:32Z)
Learning Complete Topology-Aware Correlations Between Relations for Inductive Link Prediction [121.65152276851619]
関係性間の意味的相関は本質的にエッジレベルとエンティティ非依存であることを示す。本研究では,関係関係のトポロジ・アウェア・コレレーションをモデル化するための新しいサブグラフベース手法,TACOを提案する。 RCNのポテンシャルをさらに活用するために, 完全コモンニアインダストリアルサブグラフを提案する。
論文参考訳（メタデータ） (2023-09-20T08:11:58Z)
Decentralized Adversarial Training over Graphs [55.28669771020857]
機械学習モデルの敵攻撃に対する脆弱性は、近年、かなりの注目を集めている。この研究は、個々のエージェントが様々な強度摂動空間に従属するグラフ上の敵の訓練を研究する。
論文参考訳（メタデータ） (2023-03-23T15:05:16Z)
Unrolled Graph Learning for Multi-Agent Collaboration [37.239120967721156]
人間のコラボレーションにインスパイアされた分散マルチエージェント学習モデルを提案する。エージェントは、適切なコラボレータを自律的に検出し、より良いパフォーマンスを得るためにコラボレータのモデルを参照することができる。
論文参考訳（メタデータ） (2022-10-31T07:05:44Z)
Rethinking Trajectory Prediction via "Team Game" [118.59480535826094]
本稿では,対話型グループコンセンサスの概念を明示的に導入した,マルチエージェント軌道予測の新しい定式化について述べる。チームスポーツと歩行者の2つのマルチエージェント設定において,提案手法は既存手法と比較して常に優れた性能を達成している。
論文参考訳（メタデータ） (2022-10-17T07:16:44Z)
ACTIVE:Augmentation-Free Graph Contrastive Learning for Partial Multi-View Clustering [52.491074276133325]
部分的マルチビュークラスタリングの問題を解決するために,拡張自由グラフコントラスト学習フレームワークを提案する。提案手法は、インスタンスレベルのコントラスト学習と欠落データ推論をクラスタレベルに高め、個々の欠落データがクラスタリングに与える影響を効果的に軽減する。
論文参考訳（メタデータ） (2022-03-01T02:32:25Z)
Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文参考訳（メタデータ） (2021-07-10T03:49:41Z)
Improving Long-Tail Relation Extraction with Collaborating Relation-Augmented Attention [63.26288066935098]
本稿では,ニューラルネットワーク,コラボレーティング・リレーショナル・アテンション(CoRA)を提案する。一般的なベンチマークデータセットNYTの実験では、提案されたCoRAは、最先端のパフォーマンスを大きなマージンで改善する。
論文参考訳（メタデータ） (2020-10-08T05:34:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。