論文の概要: Foresight: Failure Detection for Long-Horizon Robotic Manipulation with Action-Conditioned World Model Latents
- arxiv url: http://arxiv.org/abs/2606.23085v1
- Date: Mon, 22 Jun 2026 09:32:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 00:18:55.135657
- Title: Foresight: Failure Detection for Long-Horizon Robotic Manipulation with Action-Conditioned World Model Latents
- Title(参考訳): アクション・コンディションド・ワールド・モデルを用いた長軸ロボットマニピュレーションの故障検出
- Authors: Haoran Zhang, Yifu Lu, Boyang Wang, Xuhui Kang, Yen-Ling Kuo, Zezhou Cheng, Mengdi Wang, Odest Chadwicke Jenkins,
- Abstract要約: ロングホライゾンタスクは、現実のロボット展開では一般的なものだが、そのようなタスクの障害検出は未調査のままである。
動作条件付き世界モデルからの潜在表現を用いて、操作軌跡をモニタする故障検出フレームワークであるForesightを提案する。
この結果から, 動作条件付きワールドモデル埋め込みは, 長距離操作における信頼性のある故障監視のためのスケーラブルな表現を提供する可能性が示唆された。
- 参考スコア(独自算出の注目度): 58.49879338545782
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Long-horizon tasks are common in real-world robotic deployments, yet failure detection for such tasks remains underexplored. Detecting failures in long-horizon robotic tasks is particularly challenging because failure onset is often ambiguous and dense temporal annotations are typically unavailable. We present Foresight, a failure detection framework that monitors manipulation trajectories using latent representations from an action-conditioned world model. Foresight is trained using only final task-level success or failure labels. By leveraging predictive world-model embeddings, our method provides a unified framework for failure detection across different policies. We further use functional conformal prediction (FCP) to calibrate detection thresholds adaptively. We evaluate Foresight with state-of-the-art vision-language-action policies in simulation on LIBERO-Long, ManiSkill-Long, and BEHAVIOR-1K, compare it against state-of-the-artfailure detection methods, and validate it on real robots with three long-horizon tasks on a ReactorX-200 arm and one task on a Franka arm. Our results suggest that action-conditioned world-model embeddings provide a scalable representation for reliable failure monitoring in long-horizon manipulation.
- Abstract(参考訳): ロングホライゾンタスクは、現実のロボット展開では一般的なものだが、そのようなタスクの障害検出は未調査のままである。
長い水平ロボットタスクの障害を検出することは特に困難である。
動作条件付き世界モデルからの潜在表現を用いて、操作軌跡をモニタする故障検出フレームワークであるForesightを提案する。
フォレストは最終タスクレベルの成功または失敗ラベルのみを使用してトレーニングされる。
予測的世界モデル埋め込みを活用することで,本手法は異なるポリシをまたいだ障害検出のための統一的なフレームワークを提供する。
さらに,機能的共形予測(FCP)を用いて検出閾値を適応的に校正する。
我々は, LIBERO-Long, ManiSkill-Long, BEHAVIOR-1Kのシミュレーションにおいて, 最先端の視覚-言語-行動ポリシーを用いてForesightを評価し, 現状の欠陥検出手法と比較し, ReactorX-200アーム上の3つの長距離タスクとフランカアーム上の1つのタスクを実ロボットで検証した。
この結果から, 動作条件付きワールドモデル埋め込みは, 長距離操作における信頼性のある故障監視のためのスケーラブルな表現を提供する可能性が示唆された。
関連論文リスト
- VLA-FAIL: Efficient Task Failure Detection for Finetuned Vision-Language-Action Models [19.137291311347788]
視覚言語アクションモデル(VLA)は、多くのロボットタスクで最先端のパフォーマンスを達成するが、それでも、アウト・オブ・ディストリビューションのシナリオでは予測不可能に振る舞うことができる。
本稿では、2つの新しい障害検出器を最小限のオーバーヘッドで結合するフレームワークであるVLA-FAILを提案する。
論文 参考訳(メタデータ) (2026-06-19T12:51:21Z) - Hide-and-Seek in Trajectories: Discovering Failure Signals for VLA Runtime Monitoring [35.34120853605602]
textbf-and-Seekは、粗い教師付き学習問題としてVLA障害検出を定式化するフレームワークである。
我々は、LIBERO、VLABench、および3つの代表的なVLAポリシーをまたいだ現実世界のロボットプラットフォームについて、Hie-and-Seekの評価を行った。
論文 参考訳(メタデータ) (2026-05-29T04:40:12Z) - Foundational World Models Accurately Detect Bimanual Manipulator Failures [21.93685012734004]
我々は、事前学習された視覚基盤モデルの圧縮潜在空間内で、確率的、歴史的、世界モデルを訓練する。
このモデルは、整合予測フレームワーク内の非整合性スコアとして機能する予測と共に不確実性推定を出力する。
また,本手法の学習手法として,トレーニング可能なパラメータの約20分の1が必須であることを示す。
論文 参考訳(メタデータ) (2026-03-07T02:11:29Z) - Guardian: Detecting Robotic Planning and Execution Errors with Vision-Language Models [53.20969621498248]
本稿では,多種多様な計画および実行障害を生成するために,軌道を手続き的に乱す自動ロボット故障合成手法を提案する。
RLBench-Fail, BridgeDataV2-Fail, UR5-Failの3つの新しい故障検出ベンチマークを構築した。
次に、詳細な障害推論と検出のためのマルチビューイメージを備えたVLMであるGuardianをトレーニングします。
論文 参考訳(メタデータ) (2025-12-01T17:57:27Z) - Failure Prediction at Runtime for Generative Robot Policies [6.375597233389154]
実行中の早期の障害予測は、人間中心で安全クリティカルな環境でロボットをデプロイするために不可欠である。
本稿では,フェールデータを必要としない生成ロボットポリシーの故障予測フレームワークであるFIPERを提案する。
その結果、FIPERは実際の障害と良質なOOD状況とをよく区別し、既存の手法よりも正確に早期に障害を予測できることがわかった。
論文 参考訳(メタデータ) (2025-10-10T15:09:27Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。