論文の概要: Distilling Collaborative Dynamics into Latent Space for Implicit Coordination in Decentralized Multi-Agent Manipulation
- arxiv url: http://arxiv.org/abs/2606.22982v1
- Date: Mon, 22 Jun 2026 08:03:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 03:05:43.107055
- Title: Distilling Collaborative Dynamics into Latent Space for Implicit Coordination in Decentralized Multi-Agent Manipulation
- Title(参考訳): 分散多エージェントマニピュレーションにおける入出力調整のための遅延空間への蒸留協調ダイナミクス
- Authors: Chanyoung Park, Minsung Yoon, Andrew Jeong, Sung-eui Yoon,
- Abstract要約: 部分可観測性の下で暗黙的な協調を可能にする分散マルチエージェントフレームワーク CLS-DP を提案する。
6つのRoboFactoryベンチマークタスクは2から4つのエージェントにまたがっており、CLS-DPの平均成功率は38%である。
また、すべてのエージェント構成に対して優れたパラメータ効率を維持する。
- 参考スコア(独自算出の注目度): 24.08388843290324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-arm manipulation demands precise spatiotemporal coordination, yet many centralized approaches scale poorly as team size increases. To address this, we propose CLS-DP, a decentralized multi-agent framework that enables implicit coordination under partial observability without shared global views, explicit state information, or inter-agent communication. Under the centralized training and decentralized execution (CTDE) paradigm, CLS-DP distills privileged multi-agent dynamics into a latent space. At deployment, each agent infers a collaborative latent from its local RGB observation and a shared task instruction; it then conditions the diffusion denoising process on this latent. This design enables implicit coordination with a per-agent cost independent of team size. Across six RoboFactory benchmark tasks spanning two to four agents, CLS-DP achieves a 38% mean success rate, outperforming the best centralized baseline (20%) and a decentralized ablation without the collaborative latent (9%). It also maintains superior parameter efficiency across all agent configurations. Attribution maps show that an agent conditioned on the collaborative latent places high attribution on the joints and grippers of both itself and its teammates throughout execution. This suggests that the learned latent efficiently encodes collaborative dynamics from local observation, which facilitates implicit coordination in realistic settings characterized by partial observability.
- Abstract(参考訳): マルチアーム操作は正確な時空間調整を必要とするが、チームのサイズが大きくなるにつれて、多くの集中的なアプローチは不十分である。
そこで我々は,共有グローバルビューや明示的状態情報,エージェント間通信を使わずに,部分観測可能性の下で暗黙的な協調を可能にする分散マルチエージェントフレームワーク CLS-DP を提案する。
CLS-DPは、集中トレーニングと分散実行(CTDE)パラダイムの下で、特権化されたマルチエージェントダイナミクスを潜在空間に蒸留する。
デプロイ時に各エージェントは、ローカルなRGB観測と共有タスク命令から協調的な潜水剤を推論し、この潜水剤の拡散分解過程を条件とする。
この設計は、チームサイズに依存しないエージェント毎のコストで暗黙の調整を可能にする。
2から4つのエージェントにまたがる6つのRoboFactoryベンチマークタスクの中で、CLS-DPは38%の平均的な成功率に達し、最高の集中型ベースライン(20%)と非集中型アブレーション(9%)を上回っている。
また、すべてのエージェント構成に対して優れたパラメータ効率を維持する。
属性マップは、共同潜伏者に条件付けられたエージェントが実行中、自分自身とチームメイトの両方の関節とグリップに高い属性を与えることを示している。
このことは、学習した潜伏者は、局所的な観測から協調的ダイナミクスを効率的に符号化し、部分的な観測可能性によって特徴づけられる現実的な設定において暗黙的な調整を促進することを示唆している。
関連論文リスト
- SynAgent: Generalizable Cooperative Humanoid Manipulation via Solo-to-Cooperative Agent Synergy [59.86199649493784]
制御可能な協調的ヒューマノイド操作は、インボディードインテリジェンスにとって根本的な問題である。
スケーラブルで物理的に妥当な協調操作を可能にするフレームワークであるSynAgentを提案する。
実験では、SynAgentは協調模倣と軌道条件制御の両方において既存のベースラインを著しく上回る。
論文 参考訳(メタデータ) (2026-04-20T17:46:20Z) - Multi-Agent Deep Reinforcement Learning Under Constrained Communications [2.7126292487109005]
本稿では,集中型批判者やグローバル情報の必要性を解消する分散マルチエージェント強化学習(MARL)フレームワークを提案する。
マルチホップ通信によるグローバルな状態推論を行う新しいグラフ注意ネットワーク(D-GAT)を開発した。
また、エージェントがローカルポリシーや値関数を最適化する分散MARLフレームワークである分散グラフアテンションMAPPO(DG-MAPPO)を開発した。
論文 参考訳(メタデータ) (2026-01-22T21:07:18Z) - Towards Transparent and Incentive-Compatible Collaboration in Decentralized LLM Multi-Agent Systems: A Blockchain-Driven Approach [21.498244821985562]
本稿では、透過的なエージェント登録、検証可能なタスク割り当て、動的評価追跡を可能にするブロックチェーンベースのフレームワークを提案する。
本実装では, GPT-4エージェントをSolidity契約と統合し, 50ラウンドのシミュレーション, 高いタスク成功率, 安定したユーティリティ分布, 創発的エージェントの特殊化を実演する。
論文 参考訳(メタデータ) (2025-09-20T16:00:24Z) - Enhancing Multi-Agent Collaboration with Attention-Based Actor-Critic Policies [0.0]
Team-Attention-Actor-Critic (TAAC)は、協調環境におけるマルチエージェントコラボレーションを強化するために設計された学習アルゴリズムである。
シミュレーションサッカー環境におけるTAACをベンチマークアルゴリズムを用いて評価する。
論文 参考訳(メタデータ) (2025-07-30T15:48:38Z) - Benchmarking LLMs' Swarm intelligence [51.648605206159125]
大規模言語モデル(LLM)は複雑な推論の可能性を秘めているが、マルチエージェントシステム(MAS)における創発的協調の能力はほとんど探索されていない。
分散エージェントとして機能するLDMのタスクを体系的に評価する新しいベンチマークであるSwarmBenchを紹介する。
本稿では,協調効率の指標を提案し,創発的グループダイナミクスを解析する。
論文 参考訳(メタデータ) (2025-05-07T12:32:01Z) - AgentNet: Decentralized Evolutionary Coordination for LLM-based Multi-Agent Systems [22.291969093748005]
AgentNet(エージェントネット)は、マルチエージェントシステムのための分散化された検索型生成(RAG)ベースのフレームワークである。
静的ロールや集中制御の以前のアプローチとは異なり、AgentNetはエージェントがローカルの専門知識とコンテキストに基づいて接続とタスクのルーティングを調整することができる。
実験の結果,AgentNetは単一エージェントと集中型マルチエージェントのベースラインよりも高いタスク精度を実現することがわかった。
論文 参考訳(メタデータ) (2025-04-01T09:45:25Z) - Scalable Multi-Agent Model-Based Reinforcement Learning [1.95804735329484]
我々は,モデルベース強化学習(MBRL)を用いて協調環境における集中型トレーニングをさらに活用するMAMBAという新しい手法を提案する。
エージェント間のコミュニケーションは、実行期間中に各エージェントのワールドモデルを維持するのに十分であり、一方、仮想ロールアウトはトレーニングに使用でき、環境と対話する必要がなくなる。
論文 参考訳(メタデータ) (2022-05-25T08:35:00Z) - F2A2: Flexible Fully-decentralized Approximate Actor-critic for
Cooperative Multi-agent Reinforcement Learning [110.35516334788687]
分散マルチエージェント強化学習アルゴリズムは複雑なアプリケーションでは実践的でないことがある。
本稿では,大規模で汎用的なマルチエージェント設定を扱える,柔軟な完全分散型アクター批判型MARLフレームワークを提案する。
当社のフレームワークは,大規模環境におけるスケーラビリティと安定性を実現し,情報伝達を低減できる。
論文 参考訳(メタデータ) (2020-04-17T14:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。