論文の概要: SAIL: Faster-than-Demonstration Execution of Imitation Learning Policies
- arxiv url: http://arxiv.org/abs/2506.11948v1
- Date: Fri, 13 Jun 2025 16:58:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 17:50:49.887145
- Title: SAIL: Faster-than-Demonstration Execution of Imitation Learning Policies
- Title(参考訳): SAIL:Imitation Learning Policiesの高速な実証実験
- Authors: Nadun Ranawaka Arachchige, Zhenyang Chen, Wonsuhk Jung, Woo Chul Shin, Rohan Bansal, Pierre Barroso, Yu Hang He, Yingyang Celine Lin, Benjamin Joffe, Shreyas Kousik, Danfei Xu,
- Abstract要約: オフライン・イミテーション・ラーニング(IL)法は複雑なロボット操作技術を得るのに効果的である。
既存のILトレーニングされたポリシーは、デモデータに示すように、タスクを同じ速度で実行することに限定される。
本稿では,ビジュモータポリシーの高速化を実現するための新しい問題を紹介し,定式化する。
- 参考スコア(独自算出の注目度): 9.945756965776932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Offline Imitation Learning (IL) methods such as Behavior Cloning are effective at acquiring complex robotic manipulation skills. However, existing IL-trained policies are confined to executing the task at the same speed as shown in demonstration data. This limits the task throughput of a robotic system, a critical requirement for applications such as industrial automation. In this paper, we introduce and formalize the novel problem of enabling faster-than-demonstration execution of visuomotor policies and identify fundamental challenges in robot dynamics and state-action distribution shifts. We instantiate the key insights as SAIL (Speed Adaptation for Imitation Learning), a full-stack system integrating four tightly-connected components: (1) a consistency-preserving action inference algorithm for smooth motion at high speed, (2) high-fidelity tracking of controller-invariant motion targets, (3) adaptive speed modulation that dynamically adjusts execution speed based on motion complexity, and (4) action scheduling to handle real-world system latencies. Experiments on 12 tasks across simulation and two real, distinct robot platforms show that SAIL achieves up to a 4x speedup over demonstration speed in simulation and up to 3.2x speedup in the real world. Additional detail is available at https://nadunranawaka1.github.io/sail-policy
- Abstract(参考訳): 行動クローニングなどのオフライン模倣学習(IL)手法は,複雑なロボット操作スキルの獲得に有効である。
しかし、既存のILで訓練されたポリシーは、デモデータと同じ速度でタスクを実行することに限られている。
これにより、産業自動化のようなアプリケーションにとって重要な要件であるロボットシステムのタスクスループットが制限される。
本稿では,ビジュモータポリシの実行を高速化する新たな問題を導入・形式化し,ロボットダイナミクスと状態-行動分布シフトの基本的な課題を特定する。
本研究では,SAIL (Speed Adaptation for Imitation Learning) として,(1)高速動作のための一貫性保存動作推論アルゴリズム,(2)コントローラ不変運動目標の高忠実性追跡,(3)動作複雑性に基づいて実行速度を動的に調整する適応速度変調,(4)実世界のシステム遅延を処理する動作スケジューリングの4つのコンポーネントを統合したフルスタックシステムを提案する。
シミュレーションにおける12のタスクと2つの実際のロボットプラットフォームによる実験により、SAILはシミュレーションにおいて最大4倍のスピードアップを達成し、現実世界では最大3.2倍のスピードアップを達成している。
詳細はhttps://nadunranawaka1.github.io/sail-policyで確認できる。
関連論文リスト
- Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - SLIM: Sim-to-Real Legged Instructive Manipulation via Long-Horizon Visuomotor Learning [20.33419404756149]
本稿では,シミュレーションで純粋に強化学習によって訓練された実世界の課題を,低コストで解決するモバイル操作システムを提案する。
単一のポリシーは、検索、移動、把握、輸送、降下を含む長期的タスクを自律的に解決し、80%近い現実世界の成功を達成します。
この性能は、ロボットがより効率的であり、遠隔操作の約1.5倍の速度で動作しているのに対して、同じタスクにおける専門家の遠隔操作に匹敵する。
論文 参考訳(メタデータ) (2025-01-17T01:32:18Z) - Variable-Speed Teaching-Playback as Real-World Data Augmentation for Imitation Learning [6.277546031193622]
本稿では、実世界のデータセットの利点を保ちながら、力制御に適用可能な新しいデータ拡張法を提案する。
位置力制御を備えた模擬学習法を用いて、双方向制御に基づく模擬学習実験を行った。
その結果, 実世界の反応速度の変化により, 成功率の最大55%が向上した。
論文 参考訳(メタデータ) (2024-12-04T11:51:50Z) - Single-Shot Learning of Stable Dynamical Systems for Long-Horizon Manipulation Tasks [48.54757719504994]
本稿では,必要なトレーニングデータ量を削減しつつ,タスク成功率の向上に焦点をあてる。
提案手法では,長距離実証をウェイポイントとサブゴールで定義された離散ステップに分割する手法を提案する。
シミュレーションと実世界の両方の実験を通して,本手法を検証し,シミュレーションから物理ロボットプラットフォームへの効果的移行を実証した。
論文 参考訳(メタデータ) (2024-10-01T19:49:56Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - Learning Robotic Manipulation Skills Using an Adaptive Force-Impedance
Action Space [7.116986445066885]
強化学習は、様々な困難な意思決定タスクにおいて、有望な結果をもたらしました。
高速な人間のような適応制御手法は複雑なロボットの相互作用を最適化するが、非構造化タスクに必要なマルチモーダルフィードバックを統合することができない。
本稿では,階層的学習と適応アーキテクチャにおける学習問題を要因として,両世界を最大限に活用することを提案する。
論文 参考訳(メタデータ) (2021-10-19T12:09:02Z) - ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for
Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。
本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。
ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文 参考訳(メタデータ) (2020-08-18T08:05:15Z) - Catch the Ball: Accurate High-Speed Motions for Mobile Manipulators via
Inverse Dynamics Learning [20.655003319777368]
移動マニピュレータは、スローモーションコラボレーティブロボットシナリオにデプロイされる。
本稿では,高精度な高速動作を必要とするシナリオについて考察する。
2つの主要コンポーネントを含むこのタスク体制のためのフレームワークを導入する。
論文 参考訳(メタデータ) (2020-03-17T01:33:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。