論文の概要: CHORUS: Decentralized Multi-Embodiment Collaboration with One VLA Policy
- arxiv url: http://arxiv.org/abs/2606.12352v1
- Date: Wed, 10 Jun 2026 17:26:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.58894
- Title: CHORUS: Decentralized Multi-Embodiment Collaboration with One VLA Policy
- Title(参考訳): CHORUS: 一つのVLA政策による分散多施設連携
- Authors: Ria Doshi, Tian Gao, Annie Chen, Chelsea Finn, Jeannette Bohg,
- Abstract要約: CHORUSは、多様なマルチロボットチームを制御するために、単一のビジョン言語アクション(VLA)バックボーンに適応するフレームワークである。
実験では、CHORUSは分散化されたスクラッチモデルよりも64%のポイント改善を実現している。
その結果,共有VLAバックボーンは分散マルチロボットコラボレーションを実現することができることがわかった。
- 参考スコア(独自算出の注目度): 67.76658561040625
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-robot collaboration allows robots to efficiently take on a wide range of tasks, from moving a couch through a doorway to assembling structures on a construction site. However, achieving such coordination in mobile multi-robot settings remains challenging: centralized methods conditioned on the combined observations of a team scale poorly with team size, and decentralized methods that train one policy per robot often require explicit alignment procedures or information sharing at inference time to overcome partial observability. Our key insight is that the visuomotor priors of pretrained vision-language-action (VLA) models should enable reactive, decentralized collaboration from each robot's local observations alone, without these inference-time assumptions. We propose CHORUS, a framework that adapts a single VLA backbone to control diverse, multi-robot teams. At inference time, each robot runs an independent copy of CHORUS, conditioned only on its own observations and a robot-identifying prompt. In real-world experiments including mobile tape measurement, library book handovers, and laundry basket lifting, CHORUS achieves a 64% point improvement over decentralized, from-scratch models, improves reactivity to teammate behavior by 40% points, and outperforms centralized baselines. Together, these results show that a shared VLA backbone is capable of achieving decentralized multi-robot collaboration, without per-robot policies or inter-robot communication at inference.
- Abstract(参考訳): 複数ロボットのコラボレーションにより、ロボットはソファを戸口から移動させて建設現場で構造物を組み立てるなど、幅広いタスクを効率的にこなすことができる。
しかし、このような調整をモバイルのマルチロボット設定で行うことは依然として困難であり、チーム規模とチーム規模を合わせると、集中的な手法では、部分的な可観測性を克服するために、明示的なアライメント手順や推論時の情報共有を必要とすることが多い。
我々の重要な洞察は、事前訓練された視覚言語アクション(VLA)モデルのビジュモータが、これらの推論時間仮定なしで、各ロボットの局所的な観察のみから、リアクティブで分散化されたコラボレーションを可能にすることである。
多様なマルチロボットチームを制御するために,単一のVLAバックボーンを適応させるフレームワークであるCHORUSを提案する。
推論時には、各ロボットは独立してCHORUSのコピーを実行し、独自の観察とロボット識別プロンプトにのみ条件を付ける。
モバイルテープ計測、ライブラリのハンドオーバ、洗濯バスケットリフトといった実世界の実験において、CHORUSは、分散化された非スクラッチモデルよりも64%のポイント改善を実現し、チームメイト行動に対する反応性を40%改善し、集中ベースラインを上回っている。
これらの結果から、共有VLAバックボーンは、ロボットごとのポリシーやロボット間通信を推論することなく、分散化されたマルチロボット協調を実現することができることが示された。
関連論文リスト
- Federated Single-Agent Robotics: Multi-Robot Coordination Without Intra-Robot Multi-Agent Fragmentation [14.412476605788482]
We present Federated Single-Agent Robotics, a runtime architecture for multi-robot coordinates built on single-agent Robot runtimes。
我々は,権限委譲,ロボット間能力要求,局所逆フライト回収境界,階層的人的監督といった重要な調整関係を定式化した。
その結果、ガバナンスの局所性と、分解性の高いベースラインに対するリカバリの封じ込めが統計的に有意な増加を示した。
論文 参考訳(メタデータ) (2026-04-13T05:51:13Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control [72.81786007015471]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - AdverSAR: Adversarial Search and Rescue via Multi-Agent Reinforcement
Learning [4.843554492319537]
本稿では,敵対的エージェント間コミュニケーションの存在下で,ロボットの戦略を効率的に調整するアルゴリズムを提案する。
ロボットは対象の場所について事前の知識を持っておらず、隣接するロボットのサブセットのみといつでも対話できると仮定される。
提案手法の有効性は, グリッドワールド環境のプロトタイプで実証した。
論文 参考訳(メタデータ) (2022-12-20T08:13:29Z) - Multi-robot Social-aware Cooperative Planning in Pedestrian Environments
Using Multi-agent Reinforcement Learning [2.7716102039510564]
我々は、非政治的マルチエージェント強化学習(MARL)に基づく、新しいマルチロボット・ソーシャル・アウェア・効率的な協調プランナーを提案する。
我々は、時間空間グラフ(TSG)に基づくソーシャルエンコーダを採用し、その視野における各ロボットと歩行者の社会的関係の重要性をよりよく抽出する。
論文 参考訳(メタデータ) (2022-11-29T03:38:47Z) - CLAS: Coordinating Multi-Robot Manipulation with Central Latent Action
Spaces [9.578169216444813]
本稿では,異なるエージェント間で共有される学習された潜在行動空間を通じて,マルチロボット操作を協調する手法を提案する。
シミュレーションされたマルチロボット操作タスクにおいて本手法を検証し,サンプル効率と学習性能の観点から,従来のベースラインよりも改善したことを示す。
論文 参考訳(メタデータ) (2022-11-28T23:20:47Z) - Distributed Reinforcement Learning for Robot Teams: A Review [10.92709534981466]
近年のセンサ,アクティベーション,計算の進歩により,マルチロボットシステムへの扉が開きつつある。
コミュニティはモデルフリーのマルチエージェント強化学習を活用して、マルチロボットシステムのための効率的でスケーラブルなコントローラを開発した。
最近の知見:分散MSSは、非定常性や部分観測可能性などの根本的な課題に直面している。
論文 参考訳(メタデータ) (2022-04-07T15:34:19Z) - Centralizing State-Values in Dueling Networks for Multi-Robot
Reinforcement Learning Mapless Navigation [87.85646257351212]
本稿では,CTDE(Training and Decentralized Execution)パラダイムにおけるマルチロボットマップレスナビゲーションの問題点について考察する。
この問題は、各ロボットが観察を他のロボットと明示的に共有することなく、その経路を考えると困難である。
我々は,集中型状態値ネットワークを用いて共同状態値を計算するCTDEの新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-12-16T16:47:00Z) - Learning Multi-Arm Manipulation Through Collaborative Teleoperation [63.35924708783826]
模倣学習(il)はロボットに操作タスクを実行するための強力なパラダイムである。
多くの現実世界のタスクは、重い物体を持ち上げる、デスクを組み立てるなど、複数のアームを必要とする。
複数のリモートユーザが同時にロボットアームを遠隔操作できるマルチユーザデータ収集プラットフォームであるMulti-Arm RoboTurk(MART)を紹介した。
論文 参考訳(メタデータ) (2020-12-12T05:43:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。