論文の概要: Heterogeneity in Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2512.22941v1
- Date: Sun, 28 Dec 2025 14:07:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.291508
- Title: Heterogeneity in Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習における不均一性
- Authors: Tianyi Hu, Zhiqiang Pu, Yuan Wang, Tenghai Qiu, Min Chen, Xin Yu,
- Abstract要約: 異種性はマルチエージェント強化学習(MARL)の基本的な性質である
本稿では, MARLにおける異種性について, 定義, 定量化, 利用の観点から体系的に論じる。
- 参考スコア(独自算出の注目度): 18.710455308404452
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Heterogeneity is a fundamental property in multi-agent reinforcement learning (MARL), which is closely related not only to the functional differences of agents, but also to policy diversity and environmental interactions. However, the MARL field currently lacks a rigorous definition and deeper understanding of heterogeneity. This paper systematically discusses heterogeneity in MARL from the perspectives of definition, quantification, and utilization. First, based on an agent-level modeling of MARL, we categorize heterogeneity into five types and provide mathematical definitions. Second, we define the concept of heterogeneity distance and propose a practical quantification method. Third, we design a heterogeneity-based multi-agent dynamic parameter sharing algorithm as an example of the application of our methodology. Case studies demonstrate that our method can effectively identify and quantify various types of agent heterogeneity. Experimental results show that the proposed algorithm, compared to other parameter sharing baselines, has better interpretability and stronger adaptability. The proposed methodology will help the MARL community gain a more comprehensive and profound understanding of heterogeneity, and further promote the development of practical algorithms.
- Abstract(参考訳): 異種性は多エージェント強化学習(MARL)の基本的な性質であり、エージェントの機能的差異だけでなく、政策の多様性や環境相互作用にも密接に関係している。
しかし、MARL の分野は現在、厳密な定義と不均一性についての深い理解が欠けている。
本稿では, 定義, 定量化, 利用の観点から, MARLの不均一性を体系的に論じる。
まず、MARLのエージェントレベルモデリングに基づいて、不均一性を5つのタイプに分類し、数学的定義を提供する。
次に、不均一距離の概念を定義し、実用的な定量化法を提案する。
第3に,提案手法の適用例として,不均一性に基づくマルチエージェント動的パラメータ共有アルゴリズムを設計する。
ケーススタディでは, 種々のエージェントの不均一性を効果的に同定し, 定量化できることが示されている。
実験結果から,提案アルゴリズムは,他のパラメータ共有ベースラインと比較して,解釈性が向上し,適応性が向上していることがわかった。
提案手法は、MARLコミュニティがより包括的で深い異種性の理解を深め、実用的なアルゴリズムの開発を促進するのに役立つ。
関連論文リスト
- HyperMARL: Adaptive Hypernetworks for Multi-Agent RL [13.029350832809582]
マルチエージェント強化学習(MARL)は、均一性、特殊化、混合行動を表現するためのポリシーを必要とする。
エージェント条件のハイパーネットワークはエージェント固有のパラメータを生成し、観察とエージェント条件の勾配を分離することができる。
提案手法であるHyperMARLは,先行研究の複雑さを回避し,政策勾配の分散を実証的に低減する。
論文 参考訳(メタデータ) (2024-12-05T15:09:51Z) - Improving Global Parameter-sharing in Physically Heterogeneous Multi-agent Reinforcement Learning with Unified Action Space [22.535906675532196]
マルチエージェントシステムでは、アクションセマンティクスはエージェントのアクションが他のエンティティに対して異なる影響を示す。
従来のマルチエージェント強化学習(MARL)アルゴリズムは、多種多様な異種エージェントにまたがる大域的パラメータ共有を適用する。
要件を満たすために統一行動空間(UAS)を導入する。
論文 参考訳(メタデータ) (2024-08-14T09:15:11Z) - POGEMA: A Benchmark Platform for Cooperative Multi-Agent Pathfinding [76.67608003501479]
POGEMAは、学習のための高速環境、問題インスタンスジェネレータ、可視化ツールキットを含む、総合的なツールセットである。
また、プライマリ評価指標に基づいて計算されるドメイン関連メトリクスの範囲を規定する評価プロトコルを導入し、定義する。
この比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含む。
論文 参考訳(メタデータ) (2024-07-20T16:37:21Z) - Heterogeneous Multi-Agent Reinforcement Learning for Zero-Shot Scalable Collaboration [5.326588461041464]
マルチエージェント強化学習(MARL)は、自動運転車ネットワークのような分野を変革している。
異なるロールに対するMARL戦略は、スケールに応じて柔軟に更新することができる。
我々は、スケーラブルで不均一なポリシー最適化(SHPPO)という新しいMARLフレームワークを提案する。
SHPPOは、Starcraft Multi-Agent Challenge (SMAC)やGoogle Research Football (GRF)のような古典的なMARL環境において優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-04-05T03:02:57Z) - Enhancing Representations through Heterogeneous Self-Supervised Learning [63.453024759497545]
本稿では,HSSL(Heterogeneous Self-Supervised Learning)を提案する。
HSSLは、構造的変化を伴わない表現学習方式で、ベースモデルに新しい特徴を付与する。
HSSLは、様々な自己教師型メソッドと互換性があり、様々な下流タスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-10-08T10:44:05Z) - Heterogeneous Multi-Robot Reinforcement Learning [7.22614468437919]
不均一グラフニューラルネットワークプロキシポリシー最適化は、異種MARLポリシーをトレーニングするためのパラダイムである。
均質モデルがヘテロジニアスな振る舞いをエミュレートするために利用できる手法のキャラクタリゼーションを提案する。
論文 参考訳(メタデータ) (2023-01-17T19:05:17Z) - Consistency and Diversity induced Human Motion Segmentation [231.36289425663702]
本稿では,CDMS(Consistency and Diversity induced Human Motion)アルゴリズムを提案する。
我々のモデルは、ソースとターゲットデータを異なる多層特徴空間に分解する。
ソースとターゲットデータ間の領域ギャップを低減するために、マルチミューチュアル学習戦略を実行する。
論文 参考訳(メタデータ) (2022-02-10T06:23:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。