論文の概要: Robots that Collaborate: Sequential Asymmetric Imitation for Learning Coupled Robot Policies
- arxiv url: http://arxiv.org/abs/2606.16490v1
- Date: Mon, 15 Jun 2026 09:55:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 16:21:34.358658
- Title: Robots that Collaborate: Sequential Asymmetric Imitation for Learning Coupled Robot Policies
- Title(参考訳): 協調するロボット: 結合型ロボット政策を学習するための連続的非対称的模倣
- Authors: Yincong Chen, Ranpeng Qiu, Zihao Li, Yanan Zhou, Guoqiang Ren, Weiming Zhi,
- Abstract要約: 協調的な移動操作では、ロボットが部分的に観察されたパートナーと協調する必要がある。
失敗は、しばしば誤った待ち時間、収量、引き抜き、解放、再配置から生じるため、これは難しい。
本稿では,複数ロボットの動作を同時に学習するための一括操作カリキュラムであるSequential Asymmetric Imitation (SAI)を提案する。
- 参考スコア(独自算出の注目度): 8.640835924450553
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaborative mobile manipulation requires robots to coordinate with a partially observed partner while physically interacting through shared objects. This is difficult because failures often arise not from poor local skills, but from mistimed waiting, yielding, pulling, releasing, or repositioning. We study this problem with two bimanual mobile manipulators coupled through rigid and deformable objects. We propose Sequential Asymmetric Imitation (SAI), a single-teleoperator curriculum for learning coupled multi-robot behaviors without synchronized dual-operator demonstrations or explicit inter-robot communication. SAI trains Robot A from unilateral demonstrations with a compliant human partner, trains Robot B against the deployed Robot A policy, and then refines Robot A using sparse interventions near coordination failures. This staged process exposes the policies to increasingly realistic partner behaviors, including delay, phase mismatch,insufficient yielding, and interaction conflict. Across real-world dual-robot manipulation tasks, SAI improves task success, phase synchronization, and partner-contingent yielding over independent imitation and curriculum-ablation baselines. These results suggest that physically coupled collaboration can be learned through the structure of the imitation curriculum, rather than through synchronized multi-operator demonstrations or explicit coordination mechanisms.Project page:http://cyc0429.github.io/sai-project-page/
- Abstract(参考訳): 協調的な移動操作は、共有オブジェクトを介して物理的に相互作用しながら、部分的に観察されたパートナーと協調する必要がある。
失敗は、しばしば地元のスキルの貧弱からではなく、待ち時間、収量、引き抜き、解放、再配置から生じるため、これは難しい。
剛体および変形可能な物体に結合した2つのバイマニピュレータを用いてこの問題を研究する。
本研究では,複数ロボットの同時動作や明示的なロボット間通信を伴わずに,複数ロボットの動作を学習するための単一操作型カリキュラムであるSequential Asymmetric Imitation (SAI)を提案する。
SAIはロボットAを、従順な人間パートナーとの一方的なデモンストレーションから訓練し、展開されたロボットAポリシーに対してロボットBを訓練し、調整失敗に近いスパース介入を使用してロボットAを洗練させる。
この段階的なプロセスは、遅延、フェーズミスマッチ、不十分な収量、相互作用の競合など、ますます現実的なパートナーの行動に対するポリシーを公開する。
実世界のデュアルロボット操作タスク全体にわたって、SAIはタスクの成功、フェーズ同期、そして独立した模倣とカリキュラム・アブレーションベースラインよりもパートナー・コンテントの利得を改善している。
これらの結果から, 同期型マルチオペレーショナルデモや明示的なコーディネーション機構ではなく, 模倣カリキュラムの構造を通じて, 物理的に結合したコラボレーションを学習できることが示唆された。
関連論文リスト
- CHORUS: Decentralized Multi-Embodiment Collaboration with One VLA Policy [67.76658561040625]
CHORUSは、多様なマルチロボットチームを制御するために、単一のビジョン言語アクション(VLA)バックボーンに適応するフレームワークである。
実験では、CHORUSは分散化されたスクラッチモデルよりも64%のポイント改善を実現している。
その結果,共有VLAバックボーンは分散マルチロボットコラボレーションを実現することができることがわかった。
論文 参考訳(メタデータ) (2026-06-10T17:26:08Z) - Modular Reinforcement Learning For Cooperative Swarms [0.0]
協調ロボット群は、共通の目標を共有する計算に制限されたロボットの集合体である。
分散マルチエージェント強化学習の最近の進歩は、ロボットが他の人と効果的に対話する方法を学ぶことが可能であることを実証している。
本稿では,Swarmにおける強化学習のための空間的相互作用状態を表現するための代替手法を提案する。
論文 参考訳(メタデータ) (2026-05-06T14:05:36Z) - Morphology-Consistent Humanoid Interaction through Robot-Centric Video Synthesis [25.249184346335557]
Dream2Actは、生成ビデオによるゼロショットインタラクションを可能にするロボット中心のフレームワークである。
Dream2Actは、ロボットネイティブ空間内で厳密に動作し、エラーを回避し、タスク固有のポリシートレーニングを取り除く。
論文 参考訳(メタデータ) (2026-03-20T07:27:09Z) - Fault-Tolerant Multi-Robot Coordination with Limited Sensing within Confined Environments [0.6144680854063939]
マルチロボットシステムにおける物理的接触相互作用を利用した新しいフォールトトレランス手法を提案する。
そこで本研究では, ロボットの動作を, 操作不能なロボットに遭遇する可能性に基づいて調整する「アクティブコンタクト応答(ACR)」手法を提案する。
論文 参考訳(メタデータ) (2025-05-21T02:43:36Z) - HACTS: a Human-As-Copilot Teleoperation System for Robot Learning [47.9126187195398]
HACTS(Human-As-Copilot Teleoperation System)は,ロボットアームと遠隔操作ハードウェアを双方向でリアルタイムに同期させるシステムである。
このシンプルで効果的なフィードバックメカニズムは、自動運転車のステアリングホイールに似たもので、人間の操縦士がシームレスに介入し、将来の学習のために行動補正データを収集することを可能にする。
論文 参考訳(メタデータ) (2025-03-31T13:28:13Z) - Rethinking Bimanual Robotic Manipulation: Learning with Decoupled Interaction Framework [51.39847596489193]
バイオマチックなロボット操作は、ロボティクスコミュニティにおいて、新しくて重要なトピックである。
本稿では,バイマニュアル操作における異なるタスクの特徴を考察した,疎結合なインタラクションフレームワークを提案する。
我々のフレームワークは,SOTA法よりも23.5%向上し,優れた性能を実現している。
論文 参考訳(メタデータ) (2025-03-12T09:28:41Z) - Commonsense Reasoning for Legged Robot Adaptation with Vision-Language Models [81.55156507635286]
脚のついたロボットは、様々な環境をナビゲートし、幅広い障害を克服することができる。
現在の学習手法は、人間の監督を伴わずに、予期せぬ状況の長い尾への一般化に苦慮することが多い。
本稿では,VLM-Predictive Control (VLM-PC) というシステムを提案する。
論文 参考訳(メタデータ) (2024-07-02T21:00:30Z) - LPAC: Learnable Perception-Action-Communication Loops with Applications to Coverage Control [72.81786007015471]
本稿では,その問題に対する学習可能なパーセプション・アクション・コミュニケーション(LPAC)アーキテクチャを提案する。
CNNは局所認識を処理する。グラフニューラルネットワーク(GNN)はロボットのコミュニケーションを促進する。
評価の結果,LPACモデルは標準分散型および集中型カバレッジ制御アルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-01-10T00:08:00Z) - Show Me What You Can Do: Capability Calibration on Reachable Workspace
for Human-Robot Collaboration [83.4081612443128]
本稿では,REMPを用いた短時間キャリブレーションにより,ロボットが到達できると考える非専門家と地道とのギャップを効果的に埋めることができることを示す。
この校正手順は,ユーザ認識の向上だけでなく,人間とロボットのコラボレーションの効率化にも寄与することを示す。
論文 参考訳(メタデータ) (2021-03-06T09:14:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。