論文の概要: PhaForce: Phase-Scheduled Visual-Force Policy Learning with Slow Planning and Fast Correction for Contact-Rich Manipulation
- arxiv url: http://arxiv.org/abs/2603.08342v1
- Date: Mon, 09 Mar 2026 13:03:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.100888
- Title: PhaForce: Phase-Scheduled Visual-Force Policy Learning with Slow Planning and Fast Correction for Contact-Rich Manipulation
- Title(参考訳): PhaForce: スロープランニングによる位相スケジューリング型ビジュアルフォースポリシー学習とコンタクトリッチマニピュレーションのための高速補正
- Authors: Mingxin Wang, Zhirun Yue, Renhao Lu, Yizhe Li, Zihan Wang, Guoping Pan, Kangkang Dong, Jun Cheng, Yi Cheng, Houde Liu,
- Abstract要約: PhaForceは、低レートのチャンクレベルの計画と高レートの残差補正を調整する、位相スケジューリングされた視覚力ポリシーである。
複数の実ロボットとの接触が豊富なタスクの中で、PhaForceは平均86%の成功率を達成した。
- 参考スコア(独自算出の注目度): 25.000758938670064
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contact-rich manipulation requires not only vision-dominant task semantics but also closed-loop reactions to force/torque (F/T) transients. Yet, generative visuomotor policies are typically constrained to low-frequency updates due to inference latency and action chunking, underutilizing F/T for control-rate feedback. Furthermore, existing force-aware methods often inject force continuously and indiscriminately, lacking an explicit mechanism to schedule when / how much / where to apply force across different task phases. We propose PhaForce, a phase-scheduled visual--force policy that coordinates low-rate chunk-level planning and high-rate residual correction via a unified contact/phase schedule. PhaForce comprises (i) a contact-aware phase predictor (CAP) that estimates contact probability and phase belief, (ii) a Slow diffusion planner that performs dual-gated visual--force fusion with orthogonal residual injection to preserve vision semantics while conditioning on force, and (iii) a Fast corrector that applies control-rate phase-routed residuals in interpretable corrective subspaces for within-chunk micro-adjustments. Across multiple real-robot contact-rich tasks, PhaForce achieves an average success rate of 86% (+40 pp over baselines), while also substantially improving contact quality by regulating interaction forces and exhibiting robust adaptability to OOD geometric shifts.
- Abstract(参考訳): コンタクトリッチな操作には、視覚に支配的なタスクセマンティクスだけでなく、フォース/トルク(F/T)のトランジェントに対するクローズドループ反応も必要である。
しかし、生成的ビジュモータポリシーは、一般的に、推論遅延とアクションチャンキングによる低周波更新に制約され、制御速度フィードバックにF/Tを未利用にしている。
さらに、既存のフォースアウェアメソッドは、しばしば、異なるタスクフェーズにまたがって、いつ、いつ、どこで、どこで、フォースを適用すべきかをスケジュールする明確なメカニズムが欠如している、連続的に非差別的に強制を注入する。
我々は,低レートのチャンクレベル計画と高レートの残差補正を統一された接触/位相スケジュールで調整する位相スケジューリング型視覚力ポリシーであるPhaForceを提案する。
PhaForce の略。
一 接触確率及び位相信念を推定する接触対応位相予測器(CAP)
二 力に条件付けしながら視覚的意味を保ち、直交残差注入で二重ゲート視覚力融合を行うスロー拡散プランナー
三 制御速度位相減衰残差を解釈可能な補正部分空間に印加した高速補正器。
PhaForceは、複数の実ロボットのコンタクトリッチタスク全体で平均成功率86%(ベースライン以上+40pp)を達成すると同時に、相互作用力を調節し、OOD幾何シフトに対する堅牢な適応性を示すことにより、接触品質を大幅に向上させる。
関連論文リスト
- Enabling Dynamic Tracking in Vision-Language-Action Models via Time-Discrete and Time-Continuous Velocity Feedforward [11.066720921275648]
視覚言語アクション(VLA)モデルは、ロボット操作に非常に有望である。
厳格な産業用ロボットへの展開は、コンプライアンスと応答性の本質的にのトレードオフのため、依然として困難である。
本稿では、このトレードオフを解決するために、速度フィードフォワード項をVLAポリシーに統合することの重要性を示す。
論文 参考訳(メタデータ) (2026-03-17T07:50:00Z) - Master Micro Residual Correction with Adaptive Tactile Fusion and Force-Mixed Control for Contact-Rich Manipulation [11.467329921917546]
M2-ResiPolicyは、高レベルのアクションガイダンスと低レベルの修正を相乗化する新しいマスターマイクロ残差制御アーキテクチャである。
M2-ResiPolicyは標準拡散政策と最先端のリアクティブ拡散政策を著しく上回っている。
論文 参考訳(メタデータ) (2026-03-16T11:47:52Z) - One-Step Flow Policy: Self-Distillation for Fast Visuomotor Policies [18.743330791557522]
ワンステップフローポリシー (One-Step Flow Policy, OFP) は、教師の訓練を受けずに高忠実でシングルステップのアクション生成を行うための自己蒸留フレームワークである。
56の多様なシミュレートされた操作タスクに対する評価は、一段階のOFPが最先端の結果を達成することを示す。
論文 参考訳(メタデータ) (2026-03-12T21:58:12Z) - When Sensors Fail: Temporal Sequence Models for Robust PPO under Sensor Drift [64.37959940809633]
時間的持続的なセンサ故障下でのPPOのロバスト性について検討する。
トランスフォーマーを用いたシーケンスポリシーは, センサ数が少ない場合でも高いリターンを保ちながら, 堅牢性, RNN, SSMよりも大幅に優れていた。
論文 参考訳(メタデータ) (2026-03-04T22:21:54Z) - Anchoring Values in Temporal and Group Dimensions for Flow Matching Model Alignment [61.80228667422234]
VGPOは時間次元とグループ次元の両方で値の推定を再定義する。
スパース端末の報酬を密度の高いプロセス認識値推定に変換する。
標準群正規化を絶対値によって強化された新しいプロセスに置き換え、安定した最適化信号を維持する。
論文 参考訳(メタデータ) (2025-12-13T16:31:26Z) - ImplicitRDP: An End-to-End Visual-Force Diffusion Policy with Structural Slow-Fast Learning [52.86018040861575]
本稿では,単一のネットワークに視覚計画と反応力制御を統合した,一貫したエンドツーエンドの視覚力拡散政策を提案する。
本稿では,非同期な視覚と力のトークンを同時に処理するための因果的注意力を利用した構造的スローフォールストラーニングを紹介する。
コンタクトリッチタスクの実験では、ImplicitRDPは視覚のみのベースラインと階層的なベースラインの両方で著しく優れていた。
論文 参考訳(メタデータ) (2025-12-11T18:59:46Z) - Algorithms for dynamic scheduling in manufacturing, towards digital factories Improving Deadline Feasibility and Responsiveness via Temporal Networks [0.0]
従来の決定論的スケジュールは、現実が名目上の計画から逸脱した時に崩壊する。
この論文は、オフラインの制約プログラミングとオンラインの時間的ネットワーク実行を組み合わせることで、最悪の不確実性の下で実現可能なスケジュールを作成する。
論文 参考訳(メタデータ) (2025-10-16T17:28:25Z) - Reactive Diffusion Policy: Slow-Fast Visual-Tactile Policy Learning for Contact-Rich Manipulation [58.95799126311524]
人間は視覚と触覚を使って、外的変化に対する迅速な応答や接触力の適応制御のような非常に反応性の高い能力で、コンタクトリッチなタスクを達成できる。
既存の視覚模倣学習アプローチは、複雑な振る舞いをモデル化するためにアクションチャンキングに依存している。
本稿では,Augmented Realityを通じてリアルタイム触覚フィードバックを提供する,低コスト遠隔操作システムであるTactARを紹介する。
論文 参考訳(メタデータ) (2025-03-04T18:58:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。