論文の概要: Learning Actionable Manipulation Recovery via Counterfactual Failure Synthesis
- arxiv url: http://arxiv.org/abs/2603.13528v1
- Date: Fri, 13 Mar 2026 19:02:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:10.92132
- Title: Learning Actionable Manipulation Recovery via Counterfactual Failure Synthesis
- Title(参考訳): 擬似故障合成による動作可能なマニピュレーションの学習
- Authors: Dayou Li, Jiuzhou Lei, Hao Wang, Lulin Liu, Yunhao Yang, Zihan Wang, Bangya Liu, Minghui Zheng, Zhiwen Fan,
- Abstract要約: 現在の障害学習パラダイムは、コストと安全性の低い実世界のデータ収集か、シミュレータベースの摂動に依存している。
このフレームワークは,実世界の実演を成功させるのから直接,フォトリアリスティックでファクトファクトファクトのロールアウトを合成するものだ。
生成の世界モデル内でアクションを摂動させることで、Dream2Fixはシミュレータに頼ることなくペアの失敗言語データを生成する。
- 参考スコア(独自算出の注目度): 21.197844940385725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While recent foundation models have significantly advanced robotic manipulation, these systems still struggle to autonomously recover from execution errors. Current failure-learning paradigms rely on either costly and unsafe real-world data collection or simulator-based perturbations, which introduce a severe sim-to-real gap. Furthermore, existing visual analyzers predominantly output coarse, binary diagnoses rather than the executable, trajectory-level corrections required for actual recovery. To bridge the gap between failure diagnosis and actionable recovery, we introduce Dream2Fix, a framework that synthesizes photorealistic, counterfactual failure rollouts directly from successful real-world demonstrations. By perturbing actions within a generative world model, Dream2Fix creates paired failure-correction data without relying on simulators. To ensure the generated data is physically viable for robot learning, we implement a structured verification mechanism that strictly filters rollouts for task validity, visual coherence, and kinematic safety. This engine produces a high-fidelity dataset of over 120k paired samples. Using this dataset, we fine-tune a vision-language model to jointly predict failure types and precise recovery trajectories, mapping visual anomalies directly to corrective actions. Extensive real-world robotic experiments show our approach achieves state-of-the-art correction accuracy, improving from 19.7% to 81.3% over prior baselines, and successfully enables zero-shot closed-loop failure recovery in physical deployments.
- Abstract(参考訳): 最近の基礎モデルではロボット操作が大幅に進歩しているが、これらのシステムは実行エラーから自律的に回復するのに苦戦している。
現在の障害学習パラダイムは、コストと安全性の低い実世界のデータ収集か、シミュレータベースの摂動に依存している。
さらに、既存のビジュアルアナライザは、実際の回復に必要な軌道レベルの実行可能な補正よりも、粗いバイナリ診断を主に出力する。
故障診断と動作可能回復のギャップを埋めるために,実世界の実演成功から直接,フォトリアリスティックなフォールトロールアウトを合成するフレームワークDream2Fixを紹介した。
生成的世界モデル内でのアクションの摂動により、Dream2Fixはシミュレータに頼ることなくペアの失敗補正データを生成する。
ロボット学習において生成したデータが物理的に有効であることを保証するため,タスクの妥当性,視覚的コヒーレンス,運動安全のためのロールアウトを厳格にフィルタリングする構造的検証機構を実装した。
このエンジンは120k以上のサンプルからなる高忠実度データセットを生成する。
このデータセットを用いて視覚言語モデルを微調整し、障害タイプと正確な回復軌跡を共同で予測し、視覚異常を直接修正行動にマッピングする。
大規模な実世界のロボット実験により、我々のアプローチは最先端の精度を達成し、以前のベースラインよりも19.7%から81.3%向上し、物理的展開においてゼロショットクローズループ障害の回復を成功させた。
関連論文リスト
- Foundational World Models Accurately Detect Bimanual Manipulator Failures [21.93685012734004]
我々は、事前学習された視覚基盤モデルの圧縮潜在空間内で、確率的、歴史的、世界モデルを訓練する。
このモデルは、整合予測フレームワーク内の非整合性スコアとして機能する予測と共に不確実性推定を出力する。
また,本手法の学習手法として,トレーニング可能なパラメータの約20分の1が必須であることを示す。
論文 参考訳(メタデータ) (2026-03-07T02:11:29Z) - Guardian: Detecting Robotic Planning and Execution Errors with Vision-Language Models [53.20969621498248]
本稿では,多種多様な計画および実行障害を生成するために,軌道を手続き的に乱す自動ロボット故障合成手法を提案する。
RLBench-Fail, BridgeDataV2-Fail, UR5-Failの3つの新しい故障検出ベンチマークを構築した。
次に、詳細な障害推論と検出のためのマルチビューイメージを備えたVLMであるGuardianをトレーニングします。
論文 参考訳(メタデータ) (2025-12-01T17:57:27Z) - Action Flow Matching for Continual Robot Learning [54.10050120844738]
ロボット工学における継続的な学習は、変化する環境やタスクに常に適応できるシステムを求める。
本稿では,オンラインロボット力学モデルアライメントのためのフローマッチングを利用した生成フレームワークを提案する。
ロボットは,不整合モデルで探索するのではなく,行動自体を変換することで,より効率的に情報収集を行う。
論文 参考訳(メタデータ) (2025-04-25T16:26:15Z) - In-Simulation Testing of Deep Learning Vision Models in Autonomous Robotic Manipulators [11.389756788049944]
自律型ロボットマニピュレータのテストは、ビジョンとコントロールコンポーネント間の複雑なソフトウェアインタラクションのために難しい。
現代のロボットマニピュレータの重要な要素は、ディープラーニングに基づく物体検出モデルである。
本稿では,写真リアリスティックなNVIDIA Isaac Simシミュレータと進化探索を統合し,重要なシナリオを識別するMARTENSフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-25T03:10:42Z) - Learning to Recover from Plan Execution Errors during Robot Manipulation: A Neuro-symbolic Approach [7.768747914019512]
本稿では,自動エラー発見とリカバリのためのアプローチ(記号探索によるブレンディング学習)を提案する。
我々はアルゴリズムの任意のバージョンを提示し、最後に正しい状態に戻る代わりに、元の計画におけるサブゴールを探索する。
論文 参考訳(メタデータ) (2024-05-29T10:03:57Z) - Real-to-Sim: Predicting Residual Errors of Robotic Systems with Sparse
Data using a Learning-based Unscented Kalman Filter [65.93205328894608]
我々は,動的・シミュレータモデルと実ロボット間の残差を学習する。
学習した残差誤差により、動的モデル、シミュレーション、および実際のハードウェア間の現実的ギャップをさらに埋めることができることを示す。
論文 参考訳(メタデータ) (2022-09-07T15:15:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。