論文の概要: PATCH: Action-Chunk-Conditioned Latent Patch Innovation Monitoring for Robot Manipulation
- arxiv url: http://arxiv.org/abs/2606.16690v1
- Date: Mon, 15 Jun 2026 13:24:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-16 18:36:05.06057
- Title: PATCH: Action-Chunk-Conditioned Latent Patch Innovation Monitoring for Robot Manipulation
- Title(参考訳): PATCH:ロボット操作のためのアクション・チャンク・コンディション・ラテント・パッチ・イノベーション・モニタリング
- Authors: Yanan Zhou, Ranpeng Qiu, Yincong Chen, Jiajie Cui, Weiming Zhi,
- Abstract要約: 我々は、デプロイ時の介入のためのアクションチャンク条件付潜時パッチイノベーションモニターを紹介する。
実際のロボットロールアウトデータの実験では、競合するランタイムモニタよりも安定したコンテキスト関連トリガを生成することが示されている。
- 参考スコア(独自算出の注目度): 4.53884951709371
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning-based manipulation policies have made substantial progress in real-world robot manipulation, particularly for short-horizon action generation. However, deployment in open workspaces remains fragile under unexpected local scene dynamics, such as moving objects, transient occlusions, or disturbances near the intended motion. Existing runtime monitors often rely on global observation anomalies, policy uncertainty, or frame-level visual changes, and struggle to distinguish task-relevant execution risk from benign visual variation. We introduce PATCH, an action-chunk-conditioned latent patch innovation monitor for deployment-time intervention. Given the active action chunk, PATCH defines a projected execution corridor, predicts latent patch evolution inside it, and accumulates persistent residuals unexplained by the robot's own motion. These residuals form a localized intervention signal that allows PATCH-Router to pause execution, select an available recovery source, and resume the original policy once localized innovation subsides. Experiments on real robot rollout data show that PATCH produces more stable and context-relevant triggers than competing runtime monitors. Real-robot deployment further demonstrates monitor-driven intervention and policy resumption for disturbance-aware manipulation. Project Page: https://yananzhou5555.github.io/PATCH/.
- Abstract(参考訳): 学習に基づく操作ポリシーは、特に短期行動生成において、現実世界のロボット操作において大きく進歩している。
しかし、オープンなワークスペースへの配置は、移動物体や過渡的な閉塞、意図した動きの近くの乱れなど、予期せぬ局所的な動態の下でも脆弱なままである。
既存のランタイムモニターは、多くの場合、グローバルな観察異常、ポリシーの不確実性、フレームレベルの視覚的変化に依存しており、タスク関連実行リスクと良質な視覚的変動を区別するのに苦労している。
PATCHは、デプロイ時の介入のためのアクションチャンク条件付き潜時パッチイノベーションモニタである。
アクティブなアクションチャンクが与えられた後、PATCHは投射された実行回廊を定義し、内部の潜伏パッチの進化を予測し、ロボット自身の動きによって説明できない残留物を蓄積する。
これらの残余は局所的な介入信号を形成し、PATCH-Routerは実行を一時停止し、利用可能な回復源を選択し、局所化されたイノベーション補助金が与えられたときに元のポリシーを再開する。
実際のロボットロールアウトデータによる実験では、PATCHは競合するランタイムモニタよりも安定的でコンテキスト関連トリガを生成する。
リアルタイムロボットの展開はさらに、監視駆動による介入と、障害対応操作のためのポリシーの再利用を実証している。
プロジェクトページ: https://yananzhou5555.github.io/PATCH/。
関連論文リスト
- ActProbe: Action-Space Probe for Early Failure Detection of Generative Robot Policies [21.31011797815255]
本稿では、生成ロボットポリシーのための純粋なアクションスペース検出器であるActProbeを紹介する。
TCE(Temporal Consistency Error)は、連続したアクションチャンクと、現在のチャンクのアクションチャンクマグニチュード(ACM)の2つのコンパクト信号を使用する。
タスク条件付きLSTM-MLPアーキテクチャを用いて、これらの信号をステップ毎の障害確率にマッピングする。
論文 参考訳(メタデータ) (2026-06-07T08:18:11Z) - ELAN4D: Embodiment-Centric 4D Supervision for Vision-Language-Action Models via Plug-and-Play Adaptation [63.617951135459016]
VLA(Vision-Language-Action)モデルでは、ロボット操作が約束されているが、既存のほとんどのポリシーは、現在の観測からアクションを直接回帰することで、反応する。
ELAN4Dは,将来のロボットキートラックによるポリシーを予測的時間的監視として強化する,実施中心の4D対応トレーニングフレームワークである。
論文 参考訳(メタデータ) (2026-05-28T19:03:30Z) - From Imagined Futures to Executable Actions: Mixture of Latent Actions for Robot Manipulation [88.39072412680633]
将来の映像を実行可能な表現に変換する制御指向インタフェースであるMoLAを提案する。
我々は,シミュレーションベンチマークと実世界のロボット操作タスクに対するアプローチを評価した。
論文 参考訳(メタデータ) (2026-05-12T14:15:16Z) - Rewind-IL: Online Failure Detection and State Respawning for Imitation Learning [7.445072780282545]
提案するRewind-ILは,生成アクションチャンク模倣ポリシーのためのトレーニングフリーオンラインセーフガードフレームワークである。
Rewind-ILは、TIDE(Temporal Inter-chunk Discrepancy Estimate)に基づくゼロショット故障検知器と、状態再起動機構を結合する。
オンラインのRewind-ILは、重複するアクションチャンクの自己整合性を監視し、チェックポイントライブラリと類似性を追跡し、失敗すると、実行を最新の検証された安全な状態に戻す。
論文 参考訳(メタデータ) (2026-04-17T20:41:14Z) - See, Plan, Rewind: Progress-Aware Vision-Language-Action Models for Robust Robotic Manipulation [59.07792608884117]
本稿では,See, Plan, Rewind (SPR)について紹介する。
SPRは、現在の状態と今後のマイルストーンを見て、次の2Dウェイポイントに向けて軌道を計画し、障害時に回復可能な状態に戻すという、継続的なコアサイクルを通じて運用される。
SPRは、OpenVLA-OFTとUniVLAを上回る最小のパフォーマンス低下で最先端のロバスト性を達成する。
論文 参考訳(メタデータ) (2026-03-10T07:22:51Z) - Trace-Focused Diffusion Policy for Multi-Modal Action Disambiguation in Long-Horizon Robotic Manipulation [27.077503086179863]
Trace-Focused Diffusion Policy (TF-DP) は、ロボットの実行履歴にアクション生成を明示的に条件付ける拡散ベースのフレームワークである。
実世界のロボット操作作業におけるTF-DPの評価を行った。
論文 参考訳(メタデータ) (2026-02-07T06:06:43Z) - When Attention Betrays: Erasing Backdoor Attacks in Robotic Policies by Reconstructing Visual Tokens [32.50082492538355]
視覚言語アクション(VLA)モデルの下流での微調整はロボティクスを強化するが、パイプラインをバックドアのリスクに晒す。
本稿では,遅延空間のローカライゼーションによって異常な注意を払ってトークンを検出するテスト時間バックドアフレームワークであるBelaを紹介する。
ベラは名目のパフォーマンスを効果的に維持し、攻撃の成功率を大幅に低下させ、バックドア出力から常に良質な振る舞いを復元する。
論文 参考訳(メタデータ) (2026-02-03T06:09:43Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。