論文の概要: MimicIK: Real-Time Generative Inverse Kinematics from Teleoperation with FK Consistency
- arxiv url: http://arxiv.org/abs/2606.15148v2
- Date: Tue, 16 Jun 2026 04:15:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 15:01:46.726485
- Title: MimicIK: Real-Time Generative Inverse Kinematics from Teleoperation with FK Consistency
- Title(参考訳): MimicIK:FK一貫性を用いた遠隔操作によるリアルタイム生成逆キネマティクス
- Authors: Jiahao Yang, Shenhao Yan, Fan Feng, Chengsi Yao, Ge Wang, Zhixin Mai, Yiming Zhao, Yatong Han,
- Abstract要約: 逆運動学(Inverse Kiinematics, IK)は、リアルタイムロボット操作において重要なボトルネックである。
MimicIKは、遠隔操作のデモンストレーションからスムーズで堅牢な共同空間運動を学習するリアルタイム生成逆キネマティクスフレームワークである。
MimicIKの平均位置誤差は4.65mm、成功率10mmは92.01%、軌道スパイクレートは7.99%である。
- 参考スコア(独自算出の注目度): 25.059681949019488
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Inverse kinematics (IK) remains a critical bottleneck for real-time robot manipulation. Classical numerical solvers achieve high geometric precision but often suffer from discontinuous branch switching and unstable behavior near kinematic singularities during closed-loop deployment. Meanwhile, learned IK approaches frequently struggle to balance spatial accuracy, motion smoothness, and real-time efficiency, particularly when trained on noisy human teleoperation data. We present \textbf{MimicIK}, a real-time generative inverse kinematics framework that learns smooth and robust joint-space motion priors from teleoperation demonstrations through conditional flow matching. Given the current joint configuration and a target end-effector pose, MimicIK predicts continuous delta-joint commands using an efficient two-step iterative refinement process based on a Minimal Iterative Policy (MIP) backbone. To enforce physical consistency, we further introduce an FK consistency loss, a differentiable forward-kinematics regularization that penalizes task-space deviations from the target pose during training. We evaluate MimicIK on a real-world 6-DOF robot dataset containing 8,848 teleoperation demonstrations. MimicIK achieves a mean position error of 4.65 mm, a 10 mm success rate of 92.01\%, and a trajectory spike rate of only 7.99\%. Compared with a UNet diffusion baseline, our method improves both spatial accuracy and motion smoothness while reducing inference latency from 21.66 ms to 6.74 ms. Furthermore, unlike deterministic MLP baselines that catastrophically diverge under out-of-distribution deployment, MimicIK remains stable near singular configurations and enables robust 20 Hz real-time control on deployment hardware.
- Abstract(参考訳): 逆運動学(Inverse Kiinematics, IK)は、リアルタイムロボット操作において重要なボトルネックである。
古典的数値解法は幾何精度が高いが, 閉ループ展開時の不連続分岐切替や運動特異点付近の不安定な挙動に悩まされることが多い。
一方、学習したIKアプローチは、特にノイズの多い人間の遠隔操作データに基づいてトレーニングされた場合、空間的精度、運動の滑らかさ、およびリアルタイム効率のバランスをとるのにしばしば苦労する。
本稿では,実時間生成型逆運動学フレームワークであるtextbf{MimicIK} について述べる。
現在のジョイント構成とターゲットのエンドエフェクタのポーズから、MimicIKは最小反復ポリシー(MIP)バックボーンに基づく効率的な2ステップ反復精製プロセスを用いて、連続デルタ接合コマンドを予測する。
身体的整合性を確保するために、トレーニング中にターゲットのポーズからタスク空間のずれをペナルティ化する、微分可能な前方運動規則化であるFK整合損失を導入する。
8,848件の遠隔操作デモを含む実世界の6-DOFロボットデータセット上でMimicIKを評価する。
MimicIKは平均位置誤差が4.65mm、成功率が92.01\%、軌道スパイク率が7.99\%である。
UNet拡散ベースラインと比較して,提案手法は,21.66msから6.74msまでの推論遅延を低減しつつ,空間精度と運動のスムーズさを両立させる。さらに,分布外配置下で破滅的に分散する決定論的MLPベースラインとは異なり,MimicIKは単一構成近傍で安定であり,配置ハードウェア上で20Hzの高能率なリアルタイム制御を可能にする。
関連論文リスト
- Stretch-ICP: A Continuous-Trajectory Registration and Deskewing Algorithm in Scenarios of Aggressive Motions [6.270809447204512]
不均一または滑りやすい地形における安定性の喪失は、極端な加速と角速度を引き起こす。
メカニカルライダーと慣性測定ユニット(IMU)が丘を転がり落ちる様子を収録したTumbling-induced Gyroscope Saturationデータセットを紹介した。
データセットには、類似データセットの最大4倍の角速度が含まれており、公開されている。
論文 参考訳(メタデータ) (2026-05-17T05:13:18Z) - AnchorRefine: Synergy-Manipulation Based on Trajectory Anchor and Residual Refinement for Vision-Language-Action Models [60.04879435087352]
視覚言語アクション(VLA)ポリシーは、単一の統一空間内でアクションを生成する。
本稿では,VLAの動作モデリングを軌跡アンカーと残留精細化に分解する階層的フレームワークであるAnchorRefineを提案する。
LIBERO、CALVIN、および実ロボットタスクの実験では、AnchorRefineは回帰ベースと拡散ベースの両方のVLAバックボーンを一貫して改善している。
論文 参考訳(メタデータ) (2026-04-20T04:25:24Z) - Bridging Discrete Planning and Continuous Execution for Redundant Robot [12.278986080239692]
冗長マニピュレータの経路計画にはボクセルグリッド強化学習が広く採用されている。
しかし、7-DoFアーム上の点数逆キネマティクスによる直接実行は、しばしばステップサイズジッタをもたらす。
この研究は、個別の計画立案者自体を変更することなく、離散的な計画と連続的な実行の間にブリッジングフレームワークを提案する。
論文 参考訳(メタデータ) (2026-04-02T13:23:54Z) - MIRROR: Visual Motion Imitation via Real-time Retargeting and Teleoperation with Parallel Differential Inverse Kinematics [20.41490560492412]
リアルタイムヒューマノイド遠隔操作には応答性逆運動学(IK)が必要である。
本稿では,GPU並列化された連続型差動IKを提案する。
本手法は,人体ロボットTheMIS上で,実世界のタスクにおいて,堅牢でリアルタイムな上半身遠隔操作を可能にする視覚骨格ポーズ推定パイプラインと組み合わせる。
論文 参考訳(メタデータ) (2026-03-25T06:49:58Z) - Parallel Continuous-Time Relative Localization with Augmented Clamped Non-Uniform B-Splines [13.396140913210637]
本稿では,CT-RIO(Continuous-Time Relative-Inertial Odometry framework)を提案する。
C-NUBS(Clarmped Non-Uniform B-splines)をロボットの状態を表すために使用し、クエリ時間遅延を排除した。
常に最先端の手法より優れており、高速動作下では最大60%改善されている。
論文 参考訳(メタデータ) (2026-02-25T15:23:18Z) - SirenPose: Dynamic Scene Reconstruction via Geometric Supervision [12.966077380225856]
本稿では,鍵点に基づく幾何監督と特性正弦波表現ネットワークの周期的活性化を統合した幾何認識損失定式化であるSirenPoseを紹介する。
ポーズ推定において、SirenPoseは、絶対軌道誤差の低いMonst3Rと、変換および回転相対ポーズ誤差の低減で性能を向上する。
論文 参考訳(メタデータ) (2025-12-23T17:23:21Z) - Error-Propagation-Free Learned Video Compression With Dual-Domain Progressive Temporal Alignment [92.57576987521107]
両ドメインのプログレッシブな時間的アライメントと品質条件の混合(QCMoE)を備えた新しい統合変換フレームワークを提案する。
QCMoEは、魅力的なR-Dパフォーマンスで連続的かつ一貫したレート制御を可能にする。
実験結果から,提案手法は最先端技術と比較して,競争力のあるR-D性能を実現することが示された。
論文 参考訳(メタデータ) (2025-12-11T09:14:51Z) - Bidirectional Feature-aligned Motion Transformation for Efficient Dynamic Point Cloud Compression [97.66080040613726]
特徴空間における動きを暗黙的にモデル化する双方向特徴整合運動変換(Bi-FMT)フレームワークを提案する。
Bi-FMTは、時間的に一貫した潜在表現を生成するために、過去と将来の両方のフレームで機能を調整する。
圧縮効率とランタイムの両方において, Bi-FMT が D-DPCC と AdaDPCC を上回っていることを示す。
論文 参考訳(メタデータ) (2025-09-18T03:51:06Z) - ReCoM: Realistic Co-Speech Motion Generation with Recurrent Embedded Transformer [58.49950218437718]
音声に同期した高忠実で一般化可能な人体動作を生成するための効率的なフレームワークであるReCoMを提案する。
Recurrent Embedded Transformer (RET)は、動的埋め込み正規化(DER)をViT(Vit)コアアーキテクチャに統合する。
モデルロバスト性を高めるため,ノイズ抵抗とクロスドメイン一般化の二重性を持つモデルに,提案したDER戦略を取り入れた。
論文 参考訳(メタデータ) (2025-03-27T16:39:40Z) - Spatial-Temporal Graph Diffusion Policy with Kinematic Modeling for Bimanual Robotic Manipulation [88.83749146867665]
既存のアプローチは、遠く離れた次のベストなエンドエフェクタのポーズを予測するポリシーを学びます。
すると、運動に対する対応する関節回転角を逆運動学を用いて計算する。
本稿では,Kinematics 拡張空間テンポアル gRaph diffuser を提案する。
論文 参考訳(メタデータ) (2025-03-13T17:48:35Z) - Online Body Schema Adaptation through Cost-Sensitive Active Learning [63.84207660737483]
この作業は、icubロボットシミュレータの7dofアームを使用して、シミュレーション環境で実行された。
コストに敏感な能動学習手法は最適な関節構成を選択するために用いられる。
その結果,コスト依存型能動学習は標準的な能動学習手法と同等の精度を示し,実行運動の約半分を減らした。
論文 参考訳(メタデータ) (2021-01-26T16:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。