論文の概要: LodeStar: Long-horizon Dexterity via Synthetic Data Augmentation from Human Demonstrations
- arxiv url: http://arxiv.org/abs/2508.17547v1
- Date: Sun, 24 Aug 2025 22:57:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 18:43:45.57897
- Title: LodeStar: Long-horizon Dexterity via Synthetic Data Augmentation from Human Demonstrations
- Title(参考訳): LodeStar:人間のデモから得られた合成データによる長距離デキスタリティ
- Authors: Weikang Wan, Jiawei Fu, Xiaodi Yuan, Yifeng Zhu, Hao Su,
- Abstract要約: ロングホライゾン操作タスクは、物理的なデキスタリティと操作スキルのシームレスなシークエンシングの両方を必要とする。
本稿では,タスクのデモンストレーションを意味的に意味のあるスキルに自動的に分解する学習フレームワークとシステムLodeStarを提案する。
提案手法は,従来のベースラインに比べてタスク性能とロバスト性を大幅に向上させる。
- 参考スコア(独自算出の注目度): 20.300415135664718
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Developing robotic systems capable of robustly executing long-horizon manipulation tasks with human-level dexterity is challenging, as such tasks require both physical dexterity and seamless sequencing of manipulation skills while robustly handling environment variations. While imitation learning offers a promising approach, acquiring comprehensive datasets is resource-intensive. In this work, we propose a learning framework and system LodeStar that automatically decomposes task demonstrations into semantically meaningful skills using off-the-shelf foundation models, and generates diverse synthetic demonstration datasets from a few human demos through reinforcement learning. These sim-augmented datasets enable robust skill training, with a Skill Routing Transformer (SRT) policy effectively chaining the learned skills together to execute complex long-horizon manipulation tasks. Experimental evaluations on three challenging real-world long-horizon dexterous manipulation tasks demonstrate that our approach significantly improves task performance and robustness compared to previous baselines. Videos are available at lodestar-robot.github.io.
- Abstract(参考訳): 人間レベルのデキスタリティで長距離操作タスクを堅牢に実行できるロボットシステムの開発は、環境変動を頑健に処理しながら、物理的なデキスタリティと操作スキルのシームレスなシークエンシングの両方を必要とするため、難しい。
模倣学習は有望なアプローチを提供するが、包括的なデータセットの取得はリソース集約である。
本研究では,学習フレームワークとシステムであるLodeStarを提案する。このシステムでは,タスクのデモンストレーションを,既成の基盤モデルを用いて意味的に意味のあるスキルに自動的に分解し,強化学習を通じて,少数の人間のデモから多様な合成デモデータセットを生成する。
これらのsim拡張データセットは、SRT(Skill Routing Transformer)ポリシによって、学習したスキルを効果的にチェーンして、複雑な長距離操作タスクを実行することによって、堅牢なスキルトレーニングを可能にする。
提案手法は, 従来のベースラインに比べて, タスク性能とロバスト性を大幅に向上させることを示す。
ビデオはlodestar-robot.github.ioで公開されている。
関連論文リスト
- Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids [61.033745979145536]
本研究は,ヒューマノイドの具体化におけるコンタクトリッチな操作タスクの集合を解決するために,強化学習を適用する上で重要な課題について検討する。
私たちの主なコントリビューションは、シミュレーション環境を現実世界に近づける自動リアルタイムチューニングモジュールです。
本研究は,3つのヒューマノイド・デキスタラス・オペレーティング・タスクにおいて有望な結果を示し,それぞれのテクニックについてアブレーション研究を行った。
論文 参考訳(メタデータ) (2025-02-27T18:59:52Z) - SKIL: Semantic Keypoint Imitation Learning for Generalizable Data-efficient Manipulation [12.720334726151739]
本稿では,視覚基盤モデルの助けを借りて意味的キーポイントを自動的に取得するフレームワークを提案する。
SKILは、複雑なロボットタスクの効率的な模倣学習を可能にする意味キーポイントの記述子を形成する。
SKILの平均成功率は70%で、デモは30回に満たない。
論文 参考訳(メタデータ) (2025-01-24T11:11:53Z) - Single-Shot Learning of Stable Dynamical Systems for Long-Horizon Manipulation Tasks [48.54757719504994]
本稿では,必要なトレーニングデータ量を削減しつつ,タスク成功率の向上に焦点をあてる。
提案手法では,長距離実証をウェイポイントとサブゴールで定義された離散ステップに分割する手法を提案する。
シミュレーションと実世界の両方の実験を通して,本手法を検証し,シミュレーションから物理ロボットプラットフォームへの効果的移行を実証した。
論文 参考訳(メタデータ) (2024-10-01T19:49:56Z) - VITAL: Interactive Few-Shot Imitation Learning via Visual Human-in-the-Loop Corrections [10.49712834719005]
イミテーション・ラーニング(IL)はロボット工学において強力なアプローチとして登場し、ロボットは人間の行動を模倣することで新しいスキルを身につけることができる。
その可能性にもかかわらず、ILのデータ収集プロセスは、ロジスティックな困難と高品質なデモンストレーションの獲得に伴う高コストのため、依然として重要な課題である。
本稿では,シミュレーションにおけるデータ拡張を通じて,少数の実演から大規模データ生成を提案する。
論文 参考訳(メタデータ) (2024-07-30T23:29:47Z) - What Matters in Learning from Offline Human Demonstrations for Robot
Manipulation [64.43440450794495]
ロボット操作のための6つのオフライン学習アルゴリズムについて広範な研究を行う。
我々の研究は、オフラインの人間のデータから学習する際の最も重要な課題を分析します。
人間のデータセットから学ぶ機会を強調します。
論文 参考訳(メタデータ) (2021-08-06T20:48:30Z) - Hierarchical Few-Shot Imitation with Skill Transition Models [66.81252581083199]
FIST(Few-shot Imitation with Skill Transition Models)は、オフラインデータからスキルを抽出し、それらを利用して見えないタスクに一般化するアルゴリズムである。
本稿では,FISTが新たなタスクに一般化し,ナビゲーション実験において従来のベースラインを大幅に上回っていることを示す。
論文 参考訳(メタデータ) (2021-07-19T15:56:01Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。