論文の概要: Discovering Coordinated Joint Options via Inter-Agent Relative Dynamics
- arxiv url: http://arxiv.org/abs/2512.24827v1
- Date: Wed, 31 Dec 2025 12:39:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-01 23:27:28.653217
- Title: Discovering Coordinated Joint Options via Inter-Agent Relative Dynamics
- Title(参考訳): エージェント間相対ダイナミクスによる協調関節運動の発見
- Authors: Raul D. Steleac, Mohan Sridharan, David Abel,
- Abstract要約: マルチエージェント環境では、エージェント数と結合状態空間の指数関数的成長により、協調した振る舞いがさらに貴重になる。
既存のマルチエージェントオプション発見手法は、疎結合あるいは完全独立な振る舞いを生成することでコーディネーションを犠牲にすることが多い。
本研究では,強い協調行動を発見するために必要な情報を保持しつつ,状態空間を圧縮する連立状態抽象化を提案する。
- 参考スコア(独自算出の注目度): 13.0114299827121
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Temporally extended actions improve the ability to explore and plan in single-agent settings. In multi-agent settings, the exponential growth of the joint state space with the number of agents makes coordinated behaviours even more valuable. Yet, this same exponential growth renders the design of multi-agent options particularly challenging. Existing multi-agent option discovery methods often sacrifice coordination by producing loosely coupled or fully independent behaviours. Toward addressing these limitations, we describe a novel approach for multi-agent option discovery. Specifically, we propose a joint-state abstraction that compresses the state space while preserving the information necessary to discover strongly coordinated behaviours. Our approach builds on the inductive bias that synchronisation over agent states provides a natural foundation for coordination in the absence of explicit objectives. We first approximate a fictitious state of maximal alignment with the team, the \textit{Fermat} state, and use it to define a measure of \textit{spreadness}, capturing team-level misalignment on each individual state dimension. Building on this representation, we then employ a neural graph Laplacian estimator to derive options that capture state synchronisation patterns between agents. We evaluate the resulting options across multiple scenarios in two multi-agent domains, showing that they yield stronger downstream coordination capabilities compared to alternative option discovery methods.
- Abstract(参考訳): 一時的に拡張されたアクションは、単一エージェントの設定で探索と計画の能力を改善する。
マルチエージェント環境では、エージェント数と結合状態空間の指数関数的成長により、協調した振る舞いがさらに貴重になる。
しかし、この指数関数的な成長は、特にマルチエージェントオプションの設計を困難にしている。
既存のマルチエージェントオプション発見手法は、疎結合あるいは完全独立な振る舞いを生成することでコーディネーションを犠牲にすることが多い。
これらの制限に対処するために、我々はマルチエージェントオプション発見のための新しいアプローチについて述べる。
具体的には,強い協調行動を発見するために必要な情報を保存しながら,状態空間を圧縮する連立状態抽象化を提案する。
エージェント状態に対する同期は、明示的な目的の欠如において協調の自然な基盤となる。
まず、チームと最大アライメントの架空の状態である「textit{Fermat} 状態」を近似し、それを使って \textit{spreadness} の尺度を定義し、各状態次元のチームレベルのミスアライメントをキャプチャします。
この表現に基づいて、エージェント間の状態同期パターンをキャプチャするオプションを導出するために、ニューラルネットワークラプラシアン推定器を使用する。
2つのマルチエージェント領域において、複数のシナリオにまたがる結果の選択肢を評価し、代替オプション発見手法と比較して、より強力な下流調整能力が得られることを示す。
関連論文リスト
- InterAgent: Physics-based Multi-agent Command Execution via Diffusion on Interaction Graphs [72.5651722107621]
InterAgentはテキスト駆動型物理ベースのマルチエージェントヒューマノイド制御のためのエンドツーエンドフレームワークである。
本稿では,マルチストリームブロックを備えた自己回帰拡散トランスフォーマーを提案する。
また,空間依存性の微粒化を明示的に捉えた対話グラフのエクスセプション表現を提案する。
論文 参考訳(メタデータ) (2025-12-08T10:46:01Z) - AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction [77.62279834617475]
本稿では,グラフ構造ではなくシーケンシャル構造を用いて,マルチエージェント協調を再考するフレームワークを提案する。
提案手法は,(1)各ステップで最も適したエージェントロールを選択するNext-Agent Predictionと,(2)各エージェントが前ステップから関連する情報にアクセスできるようにするNext-Context Selectionの2つの重要な方向に焦点を当てる。
論文 参考訳(メタデータ) (2025-06-21T18:34:43Z) - Scalable Multi-agent Covering Option Discovery based on Kronecker Graphs [49.71319907864573]
本稿では,分解が容易なマルチエージェントスキル発見法を提案する。
我々のキーとなる考え方は、合同状態空間をクロネッカーグラフとして近似することであり、そのフィドラーベクトルを直接見積もることができる。
ラプラシアンスペクトルを直接計算することは、無限大の状態空間を持つタスクには難易度が高いことを考慮し、さらに本手法の深層学習拡張を提案する。
論文 参考訳(メタデータ) (2023-07-21T14:53:12Z) - Multi-agent Deep Covering Skill Discovery [50.812414209206054]
本稿では,複数エージェントの結合状態空間の予測被覆時間を最小化し,マルチエージェントオプションを構築するマルチエージェントDeep Covering Option Discoveryを提案する。
また、MARLプロセスにマルチエージェントオプションを採用するための新しいフレームワークを提案する。
提案アルゴリズムは,アテンション機構とエージェントの相互作用を効果的に把握し,マルチエージェントオプションの同定に成功した。
論文 参考訳(メタデータ) (2022-10-07T00:40:59Z) - Learning Multi-agent Skills for Tabular Reinforcement Learning using
Factor Graphs [41.17714498464354]
エージェント間の協調的な探索行動により,マルチエージェントの選択肢を直接計算できることが示唆された。
提案アルゴリズムは,マルチエージェントオプションの同定に成功し,シングルエージェントオプションや非オプションを用いることで,従来よりも大幅に性能が向上する。
論文 参考訳(メタデータ) (2022-01-20T15:33:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。