論文の概要: Prism: Spectral Parameter Sharing for Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2602.06476v1
- Date: Fri, 06 Feb 2026 08:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-09 22:18:26.292335
- Title: Prism: Spectral Parameter Sharing for Multi-Agent Reinforcement Learning
- Title(参考訳): Prism:マルチエージェント強化学習のためのスペクトルパラメータ共有
- Authors: Kyungbeom Kim, Seungwon Oh, Kyung-Joong Kim,
- Abstract要約: スペクトル領域における共有ネットワークを特異値分解(SVD)により表現することで、エージェント間多様性を誘導するパラメータ共有フレームワークであるPrismを提案する。
均質 (LBF, SMACv2) と不均質 (ヘテロジニアス) ベンチマークの両方の実験により、Prism はより優れた資源効率で競合性能を達成することを示した。
- 参考スコア(独自算出の注目度): 2.504298819189614
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Parameter sharing is a key strategy in multi-agent reinforcement learning (MARL) for improving scalability, yet conventional fully shared architectures often collapse into homogeneous behaviors. Recent methods introduce diversity through clustering, pruning, or masking, but typically compromise resource efficiency. We propose Prism, a parameter sharing framework that induces inter-agent diversity by representing shared networks in the spectral domain via singular value decomposition (SVD). All agents share the singular vector directions while learning distinct spectral masks on singular values. This mechanism encourages inter-agent diversity and preserves scalability. Extensive experiments on both homogeneous (LBF, SMACv2) and heterogeneous (MaMuJoCo) benchmarks show that Prism achieves competitive performance with superior resource efficiency.
- Abstract(参考訳): パラメータ共有はスケーラビリティ向上のためのマルチエージェント強化学習(MARL)において重要な戦略である。
最近の手法はクラスタリング、プルーニング、マスキングを通じて多様性を導入するが、典型的には資源効率を損なう。
スペクトル領域における共有ネットワークを特異値分解(SVD)により表現することにより,エージェント間多様性を誘導するパラメータ共有フレームワークであるPrismを提案する。
すべてのエージェントは特異ベクトル方向を共有し、特異値の異なるスペクトルマスクを学習する。
このメカニズムはエージェント間の多様性を促進し、スケーラビリティを維持する。
均一性 (LBF, SMACv2) と不均一性 (MaMuJoCo) のベンチマークにおいて、Prism はより優れた資源効率で競争性能を発揮することを示した。
関連論文リスト
- HBridge: H-Shape Bridging of Heterogeneous Experts for Unified Multimodal Understanding and Generation [72.69742127579508]
最近の統一モデルでは、理解の専門家(LLMなど)と生成の専門家(拡散モデルなど)を統合している。
本研究では,非対称なH字型アーキテクチャであるHBridgeを提案する。
複数のベンチマークにわたる大規模な実験は、HBridgeの有効性と優れた性能を示している。
論文 参考訳(メタデータ) (2025-11-25T17:23:38Z) - Amplifying Prominent Representations in Multimodal Learning via Variational Dirichlet Process [55.91649771370862]
ディリクレ過程(DP)混合モデルは、最も顕著な特徴を増幅できる強力な非パラメトリック法である。
本稿では,DP駆動型マルチモーダル学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-10-23T16:53:24Z) - Multiview Manifold Evidential Fusion for PolSAR Image Classification [51.41332458376411]
我々は,PolSAR多様体学習とエビデンス融合を統合アーキテクチャに統合する新しいフレームワークを提案する。
実世界の3つのPolSARデータセットの実験により、提案手法は、精度、堅牢性、解釈可能性において、既存のアプローチよりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-10-13T09:05:51Z) - Hierarchical Identity Learning for Unsupervised Visible-Infrared Person Re-Identification [81.3063589622217]
教師なし可視赤外線人物再識別(USVI-ReID)は、ラベルのないクロスモーダルな人物データセットからモダリティ不変の画像特徴を学習することを目的としている。
論文 参考訳(メタデータ) (2025-09-15T05:10:43Z) - Principled Multimodal Representation Learning [99.53621521696051]
マルチモーダル表現学習は、多様なデータモダリティを統合することにより、統一された表現空間を作ろうとする。
最近の進歩は、複数のモードの同時アライメントを調査しているが、いくつかの課題が残っている。
複数モーダルの同時アライメントを実現する新しいフレームワークであるPMRL(Principled Multimodal Representation Learning)を提案する。
論文 参考訳(メタデータ) (2025-07-23T09:12:25Z) - HyperMARL: Adaptive Hypernetworks for Multi-Agent RL [13.029350832809582]
マルチエージェント強化学習(MARL)は、均一性、特殊化、混合行動を表現するためのポリシーを必要とする。
エージェント条件のハイパーネットワークはエージェント固有のパラメータを生成し、観察とエージェント条件の勾配を分離することができる。
提案手法であるHyperMARLは,先行研究の複雑さを回避し,政策勾配の分散を実証的に低減する。
論文 参考訳(メタデータ) (2024-12-05T15:09:51Z) - Kaleidoscope: Learnable Masks for Heterogeneous Multi-agent Reinforcement Learning [14.01772209044574]
本稿では,新しい適応型部分パラメータ共有方式であるEmphKaleidoscopeを紹介する。
パラメータ共有の効率を犠牲にすることなく、これらのマスク間の相違を促進することで、ポリシーネットワーク間の多様性を促進する。
我々はKaleidoscopeを拡張してアクター批判アルゴリズムの文脈におけるアンサンブルを批判する。
論文 参考訳(メタデータ) (2024-10-11T05:22:54Z) - Heterogeneous Multi-Agent Reinforcement Learning for Zero-Shot Scalable Collaboration [5.326588461041464]
マルチエージェント強化学習(MARL)は、自動運転車ネットワークのような分野を変革している。
異なるロールに対するMARL戦略は、スケールに応じて柔軟に更新することができる。
我々は、スケーラブルで不均一なポリシー最適化(SHPPO)という新しいMARLフレームワークを提案する。
SHPPOは、Starcraft Multi-Agent Challenge (SMAC)やGoogle Research Football (GRF)のような古典的なMARL環境において優れたパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-04-05T03:02:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。