論文の概要: Improving Robotic Imitation Learning via Trajectory Standardization
- arxiv url: http://arxiv.org/abs/2606.22907v1
- Date: Mon, 22 Jun 2026 06:46:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 03:41:41.853898
- Title: Improving Robotic Imitation Learning via Trajectory Standardization
- Title(参考訳): 軌道標準化によるロボット模倣学習の改善
- Authors: Licheng Yang, Lingfeng Qian, Fei Zheng, Yonghao He, Wei Sui, Shuangshuang Li, Hu Su,
- Abstract要約: 一般的な前処理戦略は、時間一様ダウンサンプリングでシーケンスを短くするが、速度による非一様性や冗長な停止を効果的に除去することはできない。
本稿では,効果的な模倣学習のためのオフライン前処理手法であるISRを提案する。
ISRはタスク成功率を約25%改善し、さまざまなオペレータから収集されたデータセット間で堅牢であり、データセットサイズとトレーニングコストの両方を削減する。
- 参考スコア(独自算出の注目度): 7.969825103657315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning for robotic manipulation relies on large sets of human demonstration trajectories, which are often noisy and temporally irregular due to variable operator speed, intermittent pauses, and inconsistent action density. A common preprocessing strategy is time-uniform downsampling to shorten sequences, but it cannot effectively remove speed-induced non-uniformity or redundant pauses. This mismatch degrades data quality and hinders policy learning. To address this issue, we propose Information-Standardized Trajectory Resampling (ISR), an offline preprocessing method for effective imitation learning. ISR resamples each trajectory by enforcing approximately equal information distance between adjacent points. Specifically, we map trajectories onto an information-modulated Riemannian manifold and perform geodesic-equidistant parameterization. We construct an information-intensity field from velocity and acceleration norms: the velocity term removes small-motion redundancy, while the acceleration term preserves high-curvature and fine-manipulation phases. We evaluate ISR on three real-world manipulation tasks with mainstream imitation learning policies. Compared with the baseline time-uniform 3x downsampling, ISR improves task success rates by about 25%, remains robust across datasets collected from different operators, and reduces both dataset size and training cost. The code and videos are publicly available at https://d-robotics-ai-lab.github.io/isr.page.
- Abstract(参考訳): ロボット操作のための模倣学習は、人間のデモ軌道の大規模なセットに依存しており、これはしばしば、可変演算子速度、断続的停止、および矛盾する動作密度のために、ノイズが多く、時間的に不規則である。
一般的な前処理戦略は、時間一様ダウンサンプリングでシーケンスを短くするが、速度による非一様性や冗長な停止を効果的に除去することはできない。
このミスマッチはデータ品質を劣化させ、ポリシー学習を妨げる。
そこで本研究では,効果的な模倣学習のためのオフライン前処理手法であるISRを提案する。
ISRは各軌道を、隣接する点間のほぼ等しい情報距離で再サンプリングする。
具体的には、トラジェクトリを情報変調リーマン多様体に写像し、測地-等距離パラメータ化を行う。
速度項は小さな動きの冗長性を取り除き、加速度項は高い曲率と微動の位相を保持する。
ISRは実世界の3つの操作タスクに対して,メインストリームの模倣学習ポリシーを用いて評価する。
ベースラインのタイムユニフォーム3xダウンサンプリングと比較して、ISRはタスク成功率を約25%改善し、さまざまなオペレータから収集されたデータセット間で堅牢であり、データセットサイズとトレーニングコストの両方を削減する。
コードとビデオはhttps://d-robotics-ai-lab.github.io/isr.pageで公開されている。
関連論文リスト
- Refinement of Accelerated Demonstrations via Incremental Iterative Reference Learning Control for Fast Contact-Rich Imitation Learning [8.16664434473795]
反復参照学習制御 (IRLC) を再利用して, 時間短縮型実演を自律的に洗練する手法を提案する。
Incrmental Iterative Reference Learning Control (I2RLC)を提案する。
IRLCとI2RLCは、トラッキングエラーを減らして最大10倍高速なデモを実現している。
論文 参考訳(メタデータ) (2026-04-18T05:51:46Z) - MemDLM: Memory-Enhanced DLM Training [56.40248490616793]
Diffusion Language Models (DLM)は、Auto-Regressive (AR)モデルよりも優れた利点を提供する。
彼らは列車の干渉ミスマッチに悩まされている。
本稿では,模擬復調処理をトレーニングに組み込んだメモリ拡張DLMを提案する。
論文 参考訳(メタデータ) (2026-03-23T17:39:56Z) - Ada3Drift: Adaptive Training-Time Drifting for One-Step 3D Visuomotor Robotic Manipulation [53.750389076941396]
拡散に基づくビジュモータポリシーは反復的認知を通じて多モーダルな動作分布をキャプチャするが、その高い推論遅延はリアルタイムロボット制御を制限する。
Ada3Driftは,専門家のデモモードに対して予測された行動を引き付ける訓練時間ドリフト場を学習する。
Ada3Driftは、拡散ベースの代替よりも10倍の関数評価を必要としながら、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-12T14:36:53Z) - ESPADA: Execution Speedup via Semantics Aware Demonstration Data Downsampling for Imitation Learning [18.435889278351297]
ESPADAは3Dグリップ・オブジェクト関係を持つVLM-LLMパイプラインを使用して、デモをセグメント化するセマンティックなフレームワークである。
1つの注釈付きエピソードからフルデータセットにスケールするために、ESPADAはDynamic Time Warpingを通じてセグメントラベルを伝搬する。
ESPADAは成功率を維持しながら約2倍のスピードアップを実現し、人間のデモと効率的なロボット制御のギャップを狭める。
論文 参考訳(メタデータ) (2025-12-08T10:08:33Z) - Obstacle Avoidance using Dynamic Movement Primitives and Reinforcement Learning [36.09105994195904]
本研究は, 1つの人工的な実験からスムーズで, ほぼ最適な衝突のない3次元カルト軌道を高速に生成する手法を提案する。
デモは動的運動プリミティブ(DMP)として符号化され、ポリシーベースの強化学習を用いて反復的に再構成される。
この手法はシミュレーションと実ロボット実験で検証され、計算と実行時間の点でRTT-Connectベースラインを上回っている。
論文 参考訳(メタデータ) (2025-10-10T10:51:42Z) - RHYTHM: Reasoning with Hierarchical Temporal Tokenization for Human Mobility [9.200793414310182]
RHYTHM(Reasoning with Hierarchical Temporal Tokenization for Human Mobility)を導入した。
汎用予測器や推論器として,大規模言語モデル (LLM) を用いる。
RHYTHMは総合的な精度が2.4%、週末に5.0%、トレーニング時間が24.6%減少している。
論文 参考訳(メタデータ) (2025-09-27T04:55:56Z) - Autonomous Vehicle Controllers From End-to-End Differentiable Simulation [57.278726604424556]
そこで我々は,AVコントローラのトレーニングにAPG(analytic Policy gradients)アプローチを適用可能なシミュレータを提案し,その設計を行う。
提案するフレームワークは, エージェントがより根底的なポリシーを学ぶのを助けるために, 環境力学の勾配を役立てる, エンド・ツー・エンドの訓練ループに, 微分可能シミュレータを組み込む。
ダイナミクスにおけるパフォーマンスとノイズに対する堅牢性の大幅な改善と、全体としてより直感的なヒューマンライクな処理が見られます。
論文 参考訳(メタデータ) (2024-09-12T11:50:06Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z) - Truncated tensor Schatten p-norm based approach for spatiotemporal
traffic data imputation with complicated missing patterns [77.34726150561087]
本研究は, モード駆動繊維による3症例の欠失を含む, 4症例の欠失パターンについて紹介する。
本モデルでは, 目的関数の非性にもかかわらず, 乗算器の交互データ演算法を統合することにより, 最適解を導出する。
論文 参考訳(メタデータ) (2022-05-19T08:37:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。