論文の概要: TIGER-MARL: Enhancing Multi-Agent Reinforcement Learning with Temporal Information through Graph-based Embeddings and Representations
- arxiv url: http://arxiv.org/abs/2511.08832v1
- Date: Thu, 13 Nov 2025 01:10:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-13 22:34:54.246218
- Title: TIGER-MARL: Enhancing Multi-Agent Reinforcement Learning with Temporal Information through Graph-based Embeddings and Representations
- Title(参考訳): TIGER-MARL:グラフベースの埋め込みと表現による時間情報によるマルチエージェント強化学習の実現
- Authors: Nikunj Gupta, Ludwika Twardecka, James Zachary Hare, Jesse Milzman, Rajgopal Kannan, Viktor Prasanna,
- Abstract要約: 我々は、マルチエージェント強化学習(MARL)を強化するために、グラフベースの埋め込みや表現やtextbfTIGER によるテキストリアルタイム情報の取得と活用を提案する。
TIGERはMARLエージェントの動的時間グラフを構築し、それらの現在の相互作用と歴史的な相互作用を接続する。
次に、時間的注意に基づくエンコーダを使用して、これらの構造的および時間的近隣の情報を集約する。
- 参考スコア(独自算出の注目度): 7.269132496468141
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this paper, we propose capturing and utilizing \textit{Temporal Information through Graph-based Embeddings and Representations} or \textbf{TIGER} to enhance multi-agent reinforcement learning (MARL). We explicitly model how inter-agent coordination structures evolve over time. While most MARL approaches rely on static or per-step relational graphs, they overlook the temporal evolution of interactions that naturally arise as agents adapt, move, or reorganize cooperation strategies. Capturing such evolving dependencies is key to achieving robust and adaptive coordination. To this end, TIGER constructs dynamic temporal graphs of MARL agents, connecting their current and historical interactions. It then employs a temporal attention-based encoder to aggregate information across these structural and temporal neighborhoods, yielding time-aware agent embeddings that guide cooperative policy learning. Through extensive experiments on two coordination-intensive benchmarks, we show that TIGER consistently outperforms diverse value-decomposition and graph-based MARL baselines in task performance and sample efficiency. Furthermore, we conduct comprehensive ablation studies to isolate the impact of key design parameters in TIGER, revealing how structural and temporal factors can jointly shape effective policy learning in MARL. All codes can be found here: https://github.com/Nikunj-Gupta/tiger-marl.
- Abstract(参考訳): 本稿では,マルチエージェント強化学習(MARL)を強化するために,グラフベースの埋め込みと表現による‘textit{Temporal Information’や‘textbf{TIGER’を提案する。
エージェント間の協調構造が時間とともにどのように進化するかを明確にモデル化する。
ほとんどのMARLアプローチは静的またはステップごとのリレーショナルグラフに依存しているが、エージェントが協調戦略を適応、移動、あるいは再編成する際に自然に生じる相互作用の時間的進化を見落としている。
このような進化する依存関係をキャプチャすることは、堅牢で適応的な調整を実現する上で鍵となる。
この目的のために、TIGERはMARLエージェントの動的時間グラフを構築し、それらの現在の相互作用と歴史的な相互作用を接続する。
次に、時間的注意に基づくエンコーダを使用して、これらの構造的および時間的近隣の情報を集約し、協調政策学習のガイドとなる時間認識エージェントを埋め込む。
TIGERは2つの協調集約型ベンチマークの広範な実験を通じて,タスク性能とサンプル効率において,多種多様な値分解およびグラフベースのMARLベースラインを一貫して上回ることを示す。
さらに、TIGERにおける鍵設計パラメータの影響を分離するために包括的なアブレーション研究を行い、構造的要因と時間的要因がMARLにおける効果的な政策学習を協調的に形成できるかを明らかにした。
すべてのコードは、https://github.com/Nikunj-Gupta/tiger-marl.comで参照できる。
関連論文リスト
- Integrating Temporal and Structural Context in Graph Transformers for Relational Deep Learning [6.780460717949915]
直近の領域を越えてノードを検索することで,グローバルなコンテキストを向上する時空間サブグラフサンプリング手法を提案する。
また,リレーショナルディープラーニングのためのグラフトランスフォーマーアーキテクチャであるGraph Perceiver (RGP)を提案する。
RGPは最先端のパフォーマンスを提供し、リレーショナルディープラーニングのための汎用的でスケーラブルなソリューションを提供する。
論文 参考訳(メタデータ) (2025-11-06T17:08:21Z) - GRIL: Knowledge Graph Retrieval-Integrated Learning with Large Language Models [59.72897499248909]
本稿では,Large Language Models (LLM) を用いたエンドツーエンド学習のための新しいグラフ検索手法を提案する。
抽出したサブグラフでは, 構造的知識と意味的特徴をそれぞれ軟式トークンと言語化グラフで符号化し, LLMに注入する。
提案手法は、複雑な推論タスクに対する結合グラフ-LLM最適化の強みを検証し、最先端の性能を一貫して達成する。
論文 参考訳(メタデータ) (2025-09-20T02:38:00Z) - Graphs Meet AI Agents: Taxonomy, Progress, and Future Opportunities [117.49715661395294]
データ構造化は、複雑で非組織的なデータをよく構造化された形式に変換することで、有望な役割を果たす。
この調査では、グラフがAIエージェントにどのように権限を与えるかを、初めて体系的にレビューする。
論文 参考訳(メタデータ) (2025-06-22T12:59:12Z) - Deep Meta Coordination Graphs for Multi-agent Reinforcement Learning [2.650735171795961]
多エージェント強化学習(MARL)における協調政策学習のための深層メタコーディネートグラフ(DMCG)
DMCGは、エージェント間の高次および間接的な関係をキャプチャする。
その後、グラフ畳み込みネットワークモジュールを使用して、エンドツーエンドで強力な表現を学習する。
論文 参考訳(メタデータ) (2025-02-06T12:35:52Z) - Dynamic Graph Representation with Contrastive Learning for Financial Market Prediction: Integrating Temporal Evolution and Static Relations [5.892066196730197]
時間グラフ学習(TGL)は、株式市場の進化する性質を捉えるために不可欠である。
伝統的な手法は、動的時間的変化とストック間の静的構造の間の相互作用を無視することが多い。
動的グラフ関係と静的グラフ関係を統合するコントラスト学習フレームワークによる動的グラフ表現を提案する。
論文 参考訳(メタデータ) (2024-12-05T10:15:56Z) - Inferring Latent Temporal Sparse Coordination Graph for Multi-Agent Reinforcement Learning [19.386588137176933]
マルチエージェント強化学習(MARL)のための潜時スパース座標グラフ(LTS-CG)を提案する。
このグラフ学習プロセスは、エージェントが今後の観測を予測できる予測・フューチャー(Predict-Future)と、限られたデータから環境コンテキストを徹底的に把握するInfer-Present(Infer-Present)という、2つの革新的な特徴によってさらに強化されている。
StarCraft IIベンチマークの結果はLTS-CGの優れた性能を裏付けるものだった。
論文 参考訳(メタデータ) (2024-03-28T09:20:15Z) - TimeGraphs: Graph-based Temporal Reasoning [64.18083371645956]
TimeGraphsは階層的時間グラフとして動的相互作用を特徴付ける新しいアプローチである。
提案手法は,コンパクトなグラフベース表現を用いて相互作用をモデル化し,多種多様な時間スケールでの適応推論を可能にする。
我々は,サッカーシミュレータ,抵抗ゲーム,MOMA人間活動データセットなど,複雑でダイナミックなエージェントインタラクションを持つ複数のデータセット上でTimeGraphsを評価する。
論文 参考訳(メタデータ) (2024-01-06T06:26:49Z) - Jointly Cross- and Self-Modal Graph Attention Network for Query-Based
Moment Localization [77.21951145754065]
本稿では,共同グラフを渡る反復的メッセージのプロセスとして,このタスクをリキャストするクロスモーダルグラフ注意ネットワーク(CSMGAN)を提案する。
CSMGANは2つのモード間の高次相互作用を効果的に捉えることができ、より正確な局所化を可能にします。
論文 参考訳(メタデータ) (2020-08-04T08:25:24Z) - Tensor Graph Convolutional Networks for Multi-relational and Robust
Learning [74.05478502080658]
本稿では,テンソルで表されるグラフの集合に関連するデータから,スケーラブルな半教師付き学習(SSL)を実現するためのテンソルグラフ畳み込みネットワーク(TGCN)を提案する。
提案アーキテクチャは、標準的なGCNと比較して大幅に性能が向上し、最先端の敵攻撃に対処し、タンパク質間相互作用ネットワーク上でのSSL性能が著しく向上する。
論文 参考訳(メタデータ) (2020-03-15T02:33:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。