論文の概要: ActProbe: Action-Space Probe for Early Failure Detection of Generative Robot Policies
- arxiv url: http://arxiv.org/abs/2606.08508v1
- Date: Sun, 07 Jun 2026 08:18:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.166128
- Title: ActProbe: Action-Space Probe for Early Failure Detection of Generative Robot Policies
- Title(参考訳): ActProbe: 生成ロボットの早期故障検出のための行動空間プローブ
- Authors: Bingjia Huang, Xiangyu Li, Xiang Wang, Liang Mi, Zixu Hao, Weijun Wang, Hao Wu, Kun Li, Yunxin Liu, Ting Cao,
- Abstract要約: 本稿では、生成ロボットポリシーのための純粋なアクションスペース検出器であるActProbeを紹介する。
TCE(Temporal Consistency Error)は、連続したアクションチャンクと、現在のチャンクのアクションチャンクマグニチュード(ACM)の2つのコンパクト信号を使用する。
タスク条件付きLSTM-MLPアーキテクチャを用いて、これらの信号をステップ毎の障害確率にマッピングする。
- 参考スコア(独自算出の注目度): 21.31011797815255
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative robot policies fail unpredictably at deployment: they hesitate at critical moments, drift off-task, or commit to unrecoverable actions. Existing online failure detectors either require white-box access to policy internals or add runtime overhead through resampling and observation-side signals. Our empirical analysis shows that emitted action chunks themselves already carry strong predictive signal for impending failures in generative robot policies. Motivated by this observation, we introduce ActProbe, a lightweight, pure action-space detector that uses two compact signals available from a single forward pass: Temporal Consistency Error (TCE) between consecutive action chunks and Action Chunk Magnitude (ACM) of the current chunk. ActProbe maps these signals to per-step failure probabilities with a task-conditioned LSTM-MLP architecture. Across a diverse suite of generative robot policies and benchmarks, ActProbe raises alerts before failures become visually recognizable, improving the accuracy (F1)-timeliness Pareto frontier of failure detection by an average hypervolume gain of +12.7% over both internal- and external-feature baselines, with a +9.0% early-detection ROC-AUC lead on unseen tasks. ActProbe further transfers to deployment, predicting failures on unseen real-robot pick tasks and accelerating RL fine-tuning (PPO) with 2.9x fewer environment interactions.
- Abstract(参考訳): 生成するロボットのポリシーは、デプロイ時に予測不可能に失敗する。
既存のオンライン障害検出装置は、ポリシー内部へのホワイトボックスアクセスを必要とするか、再サンプリングと観測側の信号を通じてランタイムオーバーヘッドを追加する。
私たちの経験的分析によると、出力された動作チャンク自身は、生成ロボットのポリシーにおいて、差し迫った失敗を予測する強力なシグナルをすでに持っています。
この観測によって得られたActProbeは、1つの前方パスから利用可能な2つのコンパクト信号を使用する軽量で純粋な行動空間検出器である。
ActProbeは、これらの信号をタスク条件付きLSTM-MLPアーキテクチャで、ステップ毎の障害確率にマッピングする。
ActProbeは、さまざまな生成ロボットポリシーとベンチマークのスイートの中で、障害が視覚的に認識される前に警告を提起し、エラー検出の精度(F1)-タイムラインの改善 内部および外部両方の機能ベースラインを平均12.7%上回る障害検出のParetoフロンティアを、予期せぬタスクに+9.0%の早期検出ROC-AUCをリードする。
ActProbeはさらにデプロイに移行し、目に見えない実ロボットのピックタスクの失敗を予測し、2.9倍の環境相互作用でRLファインチューニング(PPO)を加速する。
関連論文リスト
- AgentProcessBench: Diagnosing Step-Level Process Quality in Tool-Using Agents [50.481033105867205]
我々はAgentProcessBenchを紹介した。AgentProcessBenchは、現実的なツール拡張トラジェクトリにおけるステップレベルの有効性を評価するための最初のベンチマークである。
ベンチマークは、1,000の多様な軌跡と8,509の人間ラベル付きステップアノテーションと89.1%のアノテーション間合意で構成されている。
探索をキャプチャする3つのラベリングスキームと、ラベルのあいまいさを減らすためのエラー伝搬ルールを備えている。
論文 参考訳(メタデータ) (2026-03-15T16:13:58Z) - RC-NF: Robot-Conditioned Normalizing Flow for Real-Time Anomaly Detection in Robotic Manipulation [68.7948300643741]
ロボットの異常検出と介入をリアルタイムに監視するロボット・コンディションド・ノーマライゼーション・フロー(RC-NF)を提案する。
RC-NFは、正規化フロー内のタスク認識ロボットとオブジェクト状態の処理を分離する。
従来のロボットタスクの監視方法と比較して、あらゆる異常なタイプで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-11T10:14:37Z) - Trajectory Guard -- A Lightweight, Sequence-Aware Model for Real-Time Anomaly Detection in Agentic AI [0.0]
トラジェクトリガードはシームズ・リカレント・オートエンコーダであり、コントラスト学習によるタスク・トラジェクトリアライメントと、再構成によるシーケンシャル・アライメントを共同で学習するハイブリッド・ロス機能を備えている。
32ミリ秒のレイテンシで、当社のアプローチは LLM Judge のベースラインよりも17-27倍高速で動作し、実運用環境におけるリアルタイムの安全性検証を可能にします。
論文 参考訳(メタデータ) (2026-01-02T00:27:11Z) - Metacognitive Self-Correction for Multi-Agent System via Prototype-Guided Next-Execution Reconstruction [58.51530390018909]
大規模言語モデルに基づくマルチエージェントシステムは、協調的な問題解決において優れているが、エラーのカスケードには脆弱である。
我々は,MASにリアルタイム,教師なし,ステップレベルの誤り検出と自己補正を付与するメタ認知フレームワークMASCを提案する。
論文 参考訳(メタデータ) (2025-10-16T05:35:37Z) - Failure Prediction at Runtime for Generative Robot Policies [6.375597233389154]
実行中の早期の障害予測は、人間中心で安全クリティカルな環境でロボットをデプロイするために不可欠である。
本稿では,フェールデータを必要としない生成ロボットポリシーの故障予測フレームワークであるFIPERを提案する。
その結果、FIPERは実際の障害と良質なOOD状況とをよく区別し、既存の手法よりも正確に早期に障害を予測できることがわかった。
論文 参考訳(メタデータ) (2025-10-10T15:09:27Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z) - Unpacking Failure Modes of Generative Policies: Runtime Monitoring of Consistency and Progress [31.952925824381325]
本稿では,障害検出を補完する2つのカテゴリに分割するランタイム監視フレームワークを提案する。
視覚言語モデル(VLM)を用いて、ポリシーがタスクを解決しないアクションを確実かつ一貫して行うことを検知する。
時間的一貫性検出とVLMランタイム監視を統一することにより、Sentinelは2つの検出器のみを使用する場合よりも18%の障害を検出する。
論文 参考訳(メタデータ) (2024-10-06T22:13:30Z) - Proactive Anomaly Detection for Robot Navigation with Multi-Sensor
Fusion [7.293053431456775]
移動ロボットは異常な動作を生成し、ナビゲーション障害を引き起こす。
反応異常検出法は、現在のロボットの状態に基づいて異常なタスク実行を識別する。
本研究では,非構造的かつ不確実な環境下でのロボットナビゲーションのための能動的異常検出ネットワーク(PAAD)を提案する。
論文 参考訳(メタデータ) (2022-04-03T19:48:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。