論文の概要: Mind the Gap: Learning Implicit Impedance in Visuomotor Policies via Intent-Execution Mismatch
- arxiv url: http://arxiv.org/abs/2602.08776v1
- Date: Mon, 09 Feb 2026 15:18:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.289581
- Title: Mind the Gap: Learning Implicit Impedance in Visuomotor Policies via Intent-Execution Mismatch
- Title(参考訳): Mind the Gap: Intent-Execution Mismatch を用いた視覚障害者政策におけるインシデントインピーダンスの学習
- Authors: Cuijie Xu, Shurui Zheng, Zihao Su, Yuanfan Xu, Tinghao Yi, Xudong Zhang, Jian Wang, Yu Wang, Jinchen Yu,
- Abstract要約: 本稿では,学習目標を「インテント・クローン(マスター・コマンド)」にシフトさせるデュアルステート・コンディショニング・フレームワークを提案する。
マスター意図を予測することによって、我々の政策は「仮想平衡点」を生成することを学び、暗黙のインピーダンス制御を効果的に実現した。
これは、低コストハードウェアのための最小限の動作クローニングフレームワークを示し、明示的な力センシングに頼ることなく、力知覚と動的補償を可能にする。
- 参考スコア(独自算出の注目度): 7.078279704479455
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Teleoperation inherently relies on the human operator acting as a closed-loop controller to actively compensate for hardware imperfections, including latency, mechanical friction, and lack of explicit force feedback. Standard Behavior Cloning (BC), by mimicking the robot's executed trajectory, fundamentally ignores this compensatory mechanism. In this work, we propose a Dual-State Conditioning framework that shifts the learning objective to "Intent Cloning" (master command). We posit that the Intent-Execution Mismatch, the discrepancy between master command and slave response, is not noise, but a critical signal that physically encodes implicit interaction forces and algorithmically reveals the operator's strategy for overcoming system dynamics. By predicting the master intent, our policy learns to generate a "virtual equilibrium point", effectively realizing implicit impedance control. Furthermore, by explicitly conditioning on the history of this mismatch, the model performs implicit system identification, perceiving tracking errors as external forces to close the control loop. To bridge the temporal gap caused by inference latency, we further formulate the policy as a trajectory inpainter to ensure continuous control. We validate our approach on a sensorless, low-cost bi-manual setup. Empirical results across tasks requiring contact-rich manipulation and dynamic tracking reveal a decisive gap: while standard execution-cloning fails due to the inability to overcome contact stiffness and tracking lag, our mismatch-aware approach achieves robust success. This presents a minimalist behavior cloning framework for low-cost hardware, enabling force perception and dynamic compensation without relying on explicit force sensing. Videos are available on the \href{https://xucj98.github.io/mind-the-gap-page/}{project page}.
- Abstract(参考訳): 遠隔操作は、人間のオペレーターがクローズドループコントローラとして機能し、遅延、機械的摩擦、明示的な力フィードバックの欠如など、ハードウェアの欠陥を積極的に補う。
標準行動クローン(Standard Behavior Cloning, BC)は、ロボットが実行した軌道を模倣することで、この補償機構を根本的に無視する。
本研究では,学習目標を"Intent Cloning"(マスターコマンド)にシフトする,デュアルステートコンディショニングフレームワークを提案する。
我々は、マスターコマンドとスレーブ応答の相違であるIntent-Execution Mismatchはノイズではなく、暗黙的な相互作用力を物理的に符号化し、システムダイナミクスを克服するオペレータの戦略をアルゴリズム的に明らかにする重要な信号であると仮定する。
マスター意図を予測することによって、我々の政策は「仮想平衡点」を生成することを学び、暗黙のインピーダンス制御を効果的に実現した。
さらに、このミスマッチの履歴を明示的に条件付けすることで、モデルが暗黙のシステム識別を行い、制御ループを閉じるための外部の力としてエラーを追跡する。
推論遅延による時間的ギャップを埋めるため,経路内挿法としてポリシーをさらに定式化し,連続的な制御を確実にする。
我々はセンサレスで低コストなバイマニュアル・セットアップにアプローチを検証する。
コンタクトリッチな操作と動的トラッキングを必要とするタスク間の実証的な結果から、決定的なギャップが浮かび上がっています。
これは、低コストハードウェアのための最小限の動作クローニングフレームワークを示し、明示的な力センシングに頼ることなく、力知覚と動的補償を可能にする。
ビデオは \href{https://xucj98.github.io/mind-the-gap-page/}{project page} で公開されている。
関連論文リスト
- Force-Aware Residual DAgger via Trajectory Editing for Precision Insertion with Impedance Control [7.670131142516991]
TER-DAggerは、コンタクトリッチな操作のための力覚的模倣学習フレームワークである。
実験により、TER-DAggerは行動クローニング、ヒト誘導補正、リトレーニング、微調整ベースラインと比較して平均成功率を37%以上改善することが示された。
論文 参考訳(メタデータ) (2026-03-04T13:18:05Z) - ULTRA: Unified Multimodal Control for Autonomous Humanoid Whole-Body Loco-Manipulation [55.467742403416175]
本稿では,大規模モーションキャプチャをヒューマノイドに変換する物理駆動型ニューラルネットワークを提案する。
我々は高密度参照とスパースタスク仕様の両方をサポートする統合マルチモーダルコントローラを学習する。
その結果,ULTRAは自我中心の知覚から,自律的,目標条件付き全体ロコ操作に一般化することが示された。
論文 参考訳(メタデータ) (2026-03-03T18:59:29Z) - Closed-Loop Action Chunks with Dynamic Corrections for Training-Free Diffusion Policy [52.106797722292896]
我々は,チャンクベースのアクション生成とリアルタイム修正を統合した動的クローズドループ拡散ポリシーフレームワークDCDPを提案する。
動的PushTシミュレーションでは、DCDPは5%の計算しか必要とせず、再トレーニングなしに適応性を19%改善する。
論文 参考訳(メタデータ) (2026-03-02T15:04:18Z) - Direction Matters: Learning Force Direction Enables Sim-to-Real Contact-Rich Manipulation [28.707088673008172]
本稿では,専門家が設計したコントローラロジックを転送に利用するフレームワークを提案する。
タスクにおける特権的監督の成功に触発されて、シミュレーションには人間によって設計された有限状態マシンベースの位置/力制御を用いる。
シミュレーションの不正確さに非常に敏感な力の大きさとは異なり、力の方向はハイレベルなタスク形状を符号化し、シム・トゥ・リアルギャップをまたいで頑健なままである。
論文 参考訳(メタデータ) (2026-02-15T14:57:13Z) - Robust and Generalized Humanoid Motion Tracking [17.58241987932198]
一般的なヒューマノイド全体制御器の学習は、ロボット領域に移動された後、実用的な参照動作がノイズや不整合を示す可能性があるため、困難である。
本稿では,因果的時間的エンコーダを用いた動的条件付きコマンドアグリゲーションフレームワークの提案と,コンテキストウィンドウを選択的に集約するマルチヘッド・クロスアテンション・コマンドエンコーダを提案する。
提案手法は多種多様な参照入力と挑戦的な動作条件の下で評価され,無見えない動作へのゼロショット転送と,物理的ヒューマノイドロボットへのロバストなシミュレート・トゥ・リアル転送が実証された。
論文 参考訳(メタデータ) (2026-01-30T15:27:43Z) - ImplicitRDP: An End-to-End Visual-Force Diffusion Policy with Structural Slow-Fast Learning [52.86018040861575]
本稿では,単一のネットワークに視覚計画と反応力制御を統合した,一貫したエンドツーエンドの視覚力拡散政策を提案する。
本稿では,非同期な視覚と力のトークンを同時に処理するための因果的注意力を利用した構造的スローフォールストラーニングを紹介する。
コンタクトリッチタスクの実験では、ImplicitRDPは視覚のみのベースラインと階層的なベースラインの両方で著しく優れていた。
論文 参考訳(メタデータ) (2025-12-11T18:59:46Z) - CADTrack: Learning Contextual Aggregation with Deformable Alignment for Robust RGBT Tracking [68.71826342377004]
RGB-Thermal (RGBT) トラッキングは、堅牢な全天候物体追跡のために可視および熱赤外モードを活用することを目的としている。
既存のRGBTトラッカーはモダリティの相違を解決するのに苦労している。
RGBT追跡のためのCADTrackと呼ばれる,変形可能なアライメントによるコンテキストアグリゲーション(Contextual Aggregation)を提案する。
論文 参考訳(メタデータ) (2025-11-22T08:10:02Z) - Code-as-Monitor: Constraint-aware Visual Programming for Reactive and Proactive Robotic Failure Detection [56.66677293607114]
オープンセットのリアクティブかつアクティブな障害検出のためのCode-as-Monitor(CaM)を提案する。
モニタリングの精度と効率を高めるために,制約関連エンティティを抽象化する制約要素を導入する。
実験により、CaMは28.7%高い成功率を達成し、厳しい乱れの下で実行時間を31.8%短縮することが示された。
論文 参考訳(メタデータ) (2024-12-05T18:58:27Z) - Integrating DeepRL with Robust Low-Level Control in Robotic Manipulators for Non-Repetitive Reaching Tasks [0.24578723416255746]
ロボット工学では、現代の戦略は学習に基づくもので、複雑なブラックボックスの性質と解釈可能性の欠如が特徴である。
本稿では, 深部強化学習(DRL)に基づく衝突のない軌道プランナと, 自動調整型低レベル制御戦略を統合することを提案する。
論文 参考訳(メタデータ) (2024-02-04T15:54:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。