論文の概要: BiKC+: Bimanual Hierarchical Imitation with Keypose-Conditioned Coordination-Aware Consistency Policies
- arxiv url: http://arxiv.org/abs/2601.12116v1
- Date: Sat, 17 Jan 2026 17:33:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 05:45:31.332389
- Title: BiKC+: Bimanual Hierarchical Imitation with Keypose-Conditioned Coordination-Aware Consistency Policies
- Title(参考訳): BiKC+: キー・コンディション・コーディネート・アウェア・一貫性ポリシーによる双方向階層的模倣
- Authors: Hang Xu, Yizhou Chen, Dongjie Yu, Yi Ren, Jia PanI,
- Abstract要約: 両手操作に適したキープレイス条件付き協調型整合性ポリシーを提案する。
本フレームワークは,階層的模倣学習を高レベルなキープレース予測器と低レベルな軌道生成器で実現する。
特に,ロボット中心の動作特徴とタスク中心の操作スタイルの両方を考慮することで,バイマニュアルのキープットを識別するための革新的なアプローチを考案する。
- 参考スコア(独自算出の注目度): 25.25845809170421
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robots are essential in industrial manufacturing due to their reliability and efficiency. They excel in performing simple and repetitive unimanual tasks but still face challenges with bimanual manipulation. This difficulty arises from the complexities of coordinating dual arms and handling multi-stage processes. Recent integration of generative models into imitation learning (IL) has made progress in tackling specific challenges. However, few approaches explicitly consider the multi-stage nature of bimanual tasks while also emphasizing the importance of inference speed. In multi-stage tasks, failures or delays at any stage can cascade over time, impacting the success and efficiency of subsequent sub-stages and ultimately hindering overall task performance. In this paper, we propose a novel keypose-conditioned coordination-aware consistency policy tailored for bimanual manipulation. Our framework instantiates hierarchical imitation learning with a high-level keypose predictor and a low-level trajectory generator. The predicted keyposes serve as sub-goals for trajectory generation, indicating targets for individual sub-stages. The trajectory generator is formulated as a consistency model, generating action sequences based on historical observations and predicted keyposes in a single inference step. In particular, we devise an innovative approach for identifying bimanual keyposes, considering both robot-centric action features and task-centric operation styles. Simulation and real-world experiments illustrate that our approach significantly outperforms baseline methods in terms of success rates and operational efficiency. Implementation codes can be found at https://github.com/JoanaHXU/BiKC-plus.
- Abstract(参考訳): ロボットはその信頼性と効率性のために工業生産に不可欠である。
単純かつ反復的な単手作業を実行するのに優れるが、両手操作の課題に直面している。
この困難は、二重腕の調整と多段階プロセスの処理の複雑さから生じる。
近年, 生成モデルと模倣学習(IL)の融合により, 特定の課題への対処が進んでいる。
しかし、二元的タスクの多段階的な性質を明示的に考慮するアプローチはほとんどなく、推論速度の重要性も強調している。
マルチステージタスクでは、どのステージの障害や遅延も時間の経過とともにカスケードし、その後のサブステージの成功と効率に影響し、最終的に全体的なタスクパフォーマンスを妨げます。
本稿では,両面操作に適したキーポーズ条件付き協調型整合性ポリシーを提案する。
本フレームワークは,ハイレベルなキープレース予測器と低レベルなトラジェクタを用いた階層的模倣学習を実現する。
予測されたキーポーズは、個々のサブステージのターゲットを示す軌道生成のサブゴールとして機能する。
トラジェクトリジェネレータは、一貫性モデルとして定式化され、履歴観測に基づいてアクションシーケンスを生成し、単一の推論ステップで予測キーポジションを生成する。
特に,ロボット中心の動作特徴とタスク中心の操作スタイルの両方を考慮することで,バイマニュアルのキープットを識別するための革新的なアプローチを考案する。
シミュレーションと実世界の実験により,本手法は成功率と運用効率の点で,ベースライン法を著しく上回っていることが示された。
実装コードはhttps://github.com/JoanaHXU/BiKC-plusで見ることができる。
関連論文リスト
- Primary-Fine Decoupling for Action Generation in Robotic Imitation [91.2899765310853]
ロボット操作動作シーケンスにおけるマルチモーダル分布は、模倣学習にとって重要な課題である。
PF-DAG(プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、プライマリ・フィン・デカップリング・フォー・アクション・ジェネレーション、PF-DAG)を提案する。
PF-DAGは、Adroit、DexArt、MetaWorldベンチマークの56タスクで最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2026-02-25T08:36:45Z) - Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning [62.3886343725955]
本稿では,行動列上のQ値を出力する批判ネットワークを学習する,新しい値に基づく強化学習アルゴリズムを提案する。
実験により、CQN-ASは、様々なスパース逆ヒューマノイド制御およびテーブルトップ操作タスクにおいて、いくつかのベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2024-11-19T01:23:52Z) - Affordance-based Robot Manipulation with Flow Matching [7.51335919610328]
本稿では,ロボット操作支援のためのフレームワークを提案する。
第1に,大規模モデルを下流シーンの空き時間理解タスクに効果的に適用し,第2に,視覚的空き時間モデルに基づいて,効果的にロボット行動軌跡を学習する。
我々は,教師付きフローマッチング手法を用いて,ロボットの行動軌跡を空き時間で案内する。
論文 参考訳(メタデータ) (2024-09-02T09:11:28Z) - BiKC: Keypose-Conditioned Consistency Policy for Bimanual Robotic Manipulation [48.08416841005715]
両面操作に適したキーポーズ条件の整合性ポリシーを導入する。
階層的な模倣学習フレームワークであり、ハイレベルなキープレース予測器と低レベルな軌道生成器から構成される。
シミュレーションおよび実世界の実験結果から,提案手法は成功率と運用効率の点で基準法を超越していることが示された。
論文 参考訳(メタデータ) (2024-06-14T14:49:12Z) - PRIME: Scaffolding Manipulation Tasks with Behavior Primitives for Data-Efficient Imitation Learning [41.751108579016055]
PRIME(Primitive-based imitation with data efficiency)は、模倣学習のデータ効率を改善するために設計された行動プリミティブベースのフレームワークである。
本実験は,多段階操作タスクにおいてPRIMEが大幅な性能向上を実現することを示す。
論文 参考訳(メタデータ) (2024-03-01T19:19:56Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。