論文の概要: Heterogeneous Information-Bottleneck Coordination Graphs for Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2605.17393v1
- Date: Sun, 17 May 2026 11:23:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.992765
- Title: Heterogeneous Information-Bottleneck Coordination Graphs for Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習のための不均一情報-ボットネック座標グラフ
- Authors: Wei Duan, Junyu Xuan, En Yu, Xiaoyu Yang, Jie Lu,
- Abstract要約: コーディネーショングラフは協調型マルチエージェント強化学習における中心的な抽象化である。
現在の手法は、学習したトポロジに正式な保証を与えない原則的な基準に依存している。
Heterogeneous Information-Bottleneck Coordination Graphs (HIBCG)を提案する。
- 参考スコア(独自算出の注目度): 23.90560697099745
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Coordination graphs are a central abstraction in cooperative multi-agent reinforcement learning (MARL), yet existing sparse-graph learners lack a theoretically grounded mechanism to decide which edges should exist and how much information each edge should carry. Current methods rely on heuristic criteria that offer no formal guarantee on the learned topology, and no principled way to allocate different communication capacities to structurally different agent relationships. To address this, we propose Heterogeneous Information-Bottleneck Coordination Graphs (HIBCG), which learns a group-aware sparse graph in which both edge existence and message capacity are theoretically justified. With the graph information bottleneck (GIB) serving as the underlying tool, HIBCG first constructs a group-aligned block-diagonal prior that provides a closed-form criterion for edge retention -- determining which edges should exist and at what density per group block -- and then controls per-agent feature bandwidth on the resulting topology, compressing messages to retain only task-relevant content. We prove that the group-aligned prior strictly tightens the variational bound on topology learning, that the objective decomposes per group block, enabling differential edge control, and that capacity allocation follows a water-filling principle.
- Abstract(参考訳): コーディネーショングラフは、協調マルチエージェント強化学習(MARL)における中心的な抽象化であるが、既存のスパースグラフ学習者は、どのエッジが存在するべきか、どのエッジが保持すべき情報を持つべきかを決定する理論的に基礎的なメカニズムを欠いている。
現在の手法は、学習したトポロジに正式な保証を与えないヒューリスティックな基準に依存しており、異なる通信能力を構造的に異なるエージェント関係に割り当てる原則的な方法はない。
これを解決するために,グループ対応スパースグラフを学習し,エッジの存在とメッセージのキャパシティを理論的に正当化するヘテロジニアス・インフォメーション・ブートネック座標グラフ(HIBCG)を提案する。
グラフ情報ボトルネック(GIB)が基盤となるツールとして、HIBCGは最初にエッジ保持のためのクローズドフォームの基準を提供するグループ整列ブロック対角線を構築 - どのエッジが存在するべきか、グループブロックごとの密度を決定する -- し、その結果のトポロジ上でエージェントごとの機能帯域幅を制御し、タスク関連コンテンツのみを保持するためにメッセージを圧縮する。
我々は,群整列がトポロジ学習の変動境界を厳格に強化し,その目的が群ブロック毎に分解され,差分エッジ制御が可能であり,キャパシティ割り当てが給水原理に従うことを証明した。
関連論文リスト
- Multimodal Structure Learning: Disentangling Shared and Specific Topology via Cross-Modal Graphical Lasso [12.238577096609761]
解釈可能なマルチモーダル表現を学習するためのCross-Modal Graphical Lasso(CM-GLasso)を提案する。
新たなテキスト視覚化戦略と統合された視覚言語エンコーダを結合することにより、マルチモーダルな特徴を共有潜在空間に厳密に整列する。
CM-GLassoは、生成的分類と密接なセマンティックセグメンテーションタスクにおいて、新しい最先端技術を確立していることを示す。
論文 参考訳(メタデータ) (2026-04-05T04:07:59Z) - MacNet: An End-to-End Manifold-Constrained Adaptive Clustering Network for Interpretable Whole Slide Image Classification [9.952997875404634]
クラスタリングに基づくアプローチは、説明可能な意思決定プロセスを提供するが、高次元の特徴と意味的にあいまいなセントロイドに悩まされる。
本稿では、グラスマン再埋め込みと多様体適応クラスタリングを統合したエンドツーエンドMILフレームワークを提案する。
マルチセントのWSIデータセットの実験では、1) クラスタを組み込んだモデルは、グレーディング精度と解釈可能性の両方において優れたパフォーマンスを実現し、2) エンドツーエンドの学習は、より良い特徴表現を洗練し、許容できるリソースを必要とします。
論文 参考訳(メタデータ) (2026-02-16T06:43:36Z) - A Signed Graph Approach to Understanding and Mitigating Oversmoothing in GNNs [54.62268052283014]
署名されたグラフの枠組みに基づく統一的な理論的視点を示す。
既存の戦略の多くは、メッセージパッシングを変えて過度な操作に抵抗する負のエッジを暗黙的に導入している。
本稿では,ラベルや特徴の類似性に基づいて署名されたエッジを割り当てるプラグイン・アンド・プレイ方式であるStructure Balanced Propagation (SBP)を提案する。
論文 参考訳(メタデータ) (2025-02-17T03:25:36Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Deep Contrastive Graph Learning with Clustering-Oriented Guidance [61.103996105756394]
グラフ畳み込みネットワーク(GCN)は、グラフベースのクラスタリングを改善する上で大きな可能性を秘めている。
モデルはGCNを適用するために初期グラフを事前に推定する。
一般的なデータクラスタリングには,Deep Contrastive Graph Learning (DCGL)モデルが提案されている。
論文 参考訳(メタデータ) (2024-02-25T07:03:37Z) - TopoImb: Toward Topology-level Imbalance in Learning from Graphs [34.25952902469481]
グラフに対して、不均衡はサブクラストポロジー群レベルに存在する可能性が高いと論じる。
この問題に対処するために、新しいフレームワーク手法と設計(トポロジ抽出器1は、明示的なメモリセルを持つ各インスタンスのトポロジグループを自動的に識別する)を提案する。
ノードレベルの分類とグラフレベルの分類の両方を対象タスクとして有効性を実証的に検証する。
論文 参考訳(メタデータ) (2022-12-16T19:37:22Z) - BSAL: A Framework of Bi-component Structure and Attribute Learning for
Link Prediction [33.488229191263564]
トポロジや特徴空間からの情報を適応的に活用する二成分構造・属性学習フレームワーク(BSAL)を提案する。
BSALはノード属性を介してセマンティックトポロジを構築し、セマンティックビューに関する埋め込みを取得する。
ノード属性が持つ情報を適応的に組み込む、フレキシブルで実装が容易なソリューションを提供する。
論文 参考訳(メタデータ) (2022-04-18T03:12:13Z) - Tangles and Hierarchical Clustering [0.0]
三角形と階層分解を連結する中心双対定理は、部分モジュラリティが最大部分モジュラリティと呼ばれる別の性質に置き換わるときに成立することを示す。
階層的クラスタリング結果を表すデータ構造であるデンドグラムは,最大部分モジュラ接続関数とその三角形と等価であることを示す。
論文 参考訳(メタデータ) (2022-03-16T16:23:48Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z) - Unifying Graph Convolutional Neural Networks and Label Propagation [73.82013612939507]
LPAとGCNの関係を特徴・ラベルの平滑化と特徴・ラベルの影響の2点の観点から検討した。
理論解析に基づいて,ノード分類のためのGCNとLCAを統一するエンドツーエンドモデルを提案する。
我々のモデルは、既存の特徴に基づく注目モデルよりもタスク指向のノードラベルに基づく学習注意重みと見なすこともできる。
論文 参考訳(メタデータ) (2020-02-17T03:23:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。