論文の概要: Towards Generalizability of Multi-Agent Reinforcement Learning in Graphs with Recurrent Message Passing
- arxiv url: http://arxiv.org/abs/2402.05027v3
- Date: Tue, 4 Jun 2024 10:16:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-06 13:08:02.723899
- Title: Towards Generalizability of Multi-Agent Reinforcement Learning in Graphs with Recurrent Message Passing
- Title(参考訳): 繰り返しメッセージパッシングを有するグラフにおけるマルチエージェント強化学習の一般化に向けて
- Authors: Jannis Weil, Zhenghua Bao, Osama Abboud, Tobias Meuser,
- Abstract要約: 分散化されたアプローチでは、エージェントは与えられたグラフ内で動作し、部分的または時代遅れな観察に基づいて決定を行う。
この研究は一般化性に焦点をあて、グラフ全体の連続的な情報フローで観測された近傍のサイズのトレードオフを解消する。
我々の手法は、実行時に分散的に使用することができ、選択した強化学習アルゴリズムと組み合わせることができる。
- 参考スコア(独自算出の注目度): 0.9353820277714449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph-based environments pose unique challenges to multi-agent reinforcement learning. In decentralized approaches, agents operate within a given graph and make decisions based on partial or outdated observations. The size of the observed neighborhood limits the generalizability to different graphs and affects the reactivity of agents, the quality of the selected actions, and the communication overhead. This work focuses on generalizability and resolves the trade-off in observed neighborhood size with a continuous information flow in the whole graph. We propose a recurrent message-passing model that iterates with the environment's steps and allows nodes to create a global representation of the graph by exchanging messages with their neighbors. Agents receive the resulting learned graph observations based on their location in the graph. Our approach can be used in a decentralized manner at runtime and in combination with a reinforcement learning algorithm of choice. We evaluate our method across 1000 diverse graphs in the context of routing in communication networks and find that it enables agents to generalize and adapt to changes in the graph.
- Abstract(参考訳): グラフベースの環境は、マルチエージェント強化学習に固有の課題をもたらす。
分散化されたアプローチでは、エージェントは与えられたグラフ内で動作し、部分的または時代遅れな観察に基づいて決定を行う。
観測された近傍の大きさは、異なるグラフへの一般化可能性を制限するとともに、エージェントの反応性、選択されたアクションの品質、通信オーバーヘッドに影響を与える。
この研究は一般化性に焦点をあて、グラフ全体の連続的な情報フローで観測された近傍のサイズのトレードオフを解消する。
本稿では,環境のステップに合わせて繰り返しメッセージパッシングモデルを提案し,近隣のノードとメッセージを交換することで,ノードがグラフのグローバルな表現を作成できるようにする。
エージェントは、グラフ内の位置に基づいて学習したグラフ観察を受信する。
我々の手法は、実行時に分散的に使用することができ、選択した強化学習アルゴリズムと組み合わせることができる。
通信ネットワークにおけるルーティングのコンテキストにおいて,1000の多様なグラフにまたがる手法を評価し,エージェントがグラフの変化を一般化し適応できることを示す。
関連論文リスト
- Differential Encoding for Improved Representation Learning over Graphs [15.791455338513815]
メッセージパッシングパラダイムとグローバルアテンションメカニズムは、基本的にノードの埋め込みを生成する。
支配的な情報がノード自身からなのか、あるいはノードの隣人からなのかは不明だ。
本稿では,失った情報の問題に対処する差分符号化手法を提案する。
論文 参考訳(メタデータ) (2024-07-03T02:23:33Z) - Graph Learning under Distribution Shifts: A Comprehensive Survey on
Domain Adaptation, Out-of-distribution, and Continual Learning [53.81365215811222]
グラフ学習の文脈における分布変化に対処する最新のアプローチ、戦略、洞察のレビューと要約を提供する。
既存のグラフ学習手法を,グラフ領域適応学習,グラフ配布学習,グラフ連続学習など,いくつかの重要なシナリオに分類する。
本稿では,この領域における現状を体系的に分析し,分散シフト下でのグラフ学習の可能性と今後の方向性について論じる。
論文 参考訳(メタデータ) (2024-02-26T07:52:40Z) - Universal Graph Continual Learning [22.010954622073598]
タスクの各データポイントがノードかグラフになり得る普遍的なアプローチに注目し、タスクはノードからグラフの分類まで様々である。
本稿では,この普遍的な設定において,グラフニューラルネットワークが優れる新しい手法を提案する。
論文 参考訳(メタデータ) (2023-08-27T01:19:19Z) - Distributed Learning over Networks with Graph-Attention-Based
Personalization [49.90052709285814]
分散ディープラーニングのためのグラフベースパーソナライズアルゴリズム(GATTA)を提案する。
特に、各エージェントのパーソナライズされたモデルは、グローバルな部分とノード固有の部分で構成される。
グラフ内の各エージェントを1つのノードとして扱うことにより、ノード固有のパラメータを特徴として扱うことにより、グラフアテンション機構の利点を継承することができる。
論文 参考訳(メタデータ) (2023-05-22T13:48:30Z) - Graph Representation Learning via Contrasting Cluster Assignments [57.87743170674533]
GRCCAと呼ばれるクラスタ割り当てを対比して、教師なしグラフ表現モデルを提案する。
クラスタリングアルゴリズムとコントラスト学習を組み合わせることで、局所的およびグローバルな情報を合成的にうまく活用する動機付けがある。
GRCCAは、ほとんどのタスクにおいて強力な競争力を持っている。
論文 参考訳(メタデータ) (2021-12-15T07:28:58Z) - A Robust and Generalized Framework for Adversarial Graph Embedding [73.37228022428663]
本稿では,AGE という逆グラフ埋め込みのための頑健なフレームワークを提案する。
AGEは、暗黙の分布から強化された負のサンプルとして偽の隣接ノードを生成する。
本フレームワークでは,3種類のグラフデータを扱う3つのモデルを提案する。
論文 参考訳(メタデータ) (2021-05-22T07:05:48Z) - Learning to Coordinate via Multiple Graph Neural Networks [16.226702761758595]
MGANはグラフ畳み込みネットワークと値分解手法を組み合わせた新しいアルゴリズムである。
グラフネットワークの出力を可視化することにより,表現学習におけるグラフネットワークの驚くべき能力を示す。
論文 参考訳(メタデータ) (2021-04-08T04:33:00Z) - Multi-Level Graph Convolutional Network with Automatic Graph Learning
for Hyperspectral Image Classification [63.56018768401328]
HSI分類のための自動グラフ学習法(MGCN-AGL)を用いたマルチレベルグラフ畳み込みネットワーク(GCN)を提案する。
空間的に隣接する領域における重要度を特徴付けるために注意機構を利用することで、最も関連性の高い情報を適応的に組み込んで意思決定を行うことができる。
MGCN-AGLは局所的に生成した表現表現に基づいて画像領域間の長距離依存性を符号化する。
論文 参考訳(メタデータ) (2020-09-19T09:26:20Z) - Graphs, Entities, and Step Mixture [11.162937043309478]
エッジベース近傍関係とノードベース実体特徴の両方を考慮した新しいグラフニューラルネットワークを提案する。
集約的な実験により,提案したGESMは,8つのベンチマークグラフデータセット上で,最先端または同等のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-05-18T06:57:02Z) - Self-Supervised Graph Representation Learning via Global Context
Prediction [31.07584920486755]
本稿では,データ自体による自然監督を利用して,グラフ表現学習のための新たな自己教師型戦略を提案する。
グラフ内のノードのペアをランダムに選択し、よく設計されたニューラルネットをトレーニングし、一方のノードのコンテキスト位置を他方と相対的に予測する。
我々の仮説は、そのようなグラフ内コンテキストから得られた表現はグラフのグローバルなトポロジーを捉え、ノード間の類似性と区別を微妙に特徴づける、というものである。
論文 参考訳(メタデータ) (2020-03-03T15:46:01Z) - Graph Representation Learning via Graphical Mutual Information
Maximization [86.32278001019854]
本稿では,入力グラフとハイレベルな隠蔽表現との相関を測る新しい概念であるGMIを提案する。
我々は,グラフニューラルエンコーダの入力と出力の間でGMIを最大化することで訓練された教師なし学習モデルを開発する。
論文 参考訳(メタデータ) (2020-02-04T08:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。