論文の概要: Bootstrapping Imitation Learning for Long-horizon Manipulation via Hierarchical Data Collection Space
- arxiv url: http://arxiv.org/abs/2505.17389v1
- Date: Fri, 23 May 2025 01:57:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.76245
- Title: Bootstrapping Imitation Learning for Long-horizon Manipulation via Hierarchical Data Collection Space
- Title(参考訳): 階層型データ収集空間を用いた長軸マニピュレーションのためのブートストラップ模倣学習
- Authors: Jinrong Yang, Kexun Chen, Zhuoling Li, Shengkai Wu, Yong Zhao, Liangliang Ren, Wenqiu Luo, Chaohui Shang, Meiyu Zhi, Linfeng Gao, Mingshan Sun, Hui Cheng,
- Abstract要約: 人間の実演による模倣学習(IL)はロボット操作タスクの有望な方法である。
本稿では,ロボット模倣学習のための階層型データ収集空間(HD-Space)について紹介する。
我々は2つのシミュレーションと5つの実世界の長距離操作タスクに対して経験的評価を行う。
- 参考スコア(独自算出の注目度): 16.787049521081983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning (IL) with human demonstrations is a promising method for robotic manipulation tasks. While minimal demonstrations enable robotic action execution, achieving high success rates and generalization requires high cost, e.g., continuously adding data or incrementally conducting human-in-loop processes with complex hardware/software systems. In this paper, we rethink the state/action space of the data collection pipeline as well as the underlying factors responsible for the prediction of non-robust actions. To this end, we introduce a Hierarchical Data Collection Space (HD-Space) for robotic imitation learning, a simple data collection scheme, endowing the model to train with proactive and high-quality data. Specifically, We segment the fine manipulation task into multiple key atomic tasks from a high-level perspective and design atomic state/action spaces for human demonstrations, aiming to generate robust IL data. We conduct empirical evaluations across two simulated and five real-world long-horizon manipulation tasks and demonstrate that IL policy training with HD-Space-based data can achieve significantly enhanced policy performance. HD-Space allows the use of a small amount of demonstration data to train a more powerful policy, particularly for long-horizon manipulation tasks. We aim for HD-Space to offer insights into optimizing data quality and guiding data scaling. project page: https://hd-space-robotics.github.io.
- Abstract(参考訳): 人間の実演による模倣学習(IL)はロボット操作タスクの有望な方法である。
最小限のデモはロボットアクションの実行を可能にするが、高い成功率と一般化を実現するには、例えば、データの継続的な追加や複雑なハードウェア/ソフトウェアシステムによるインクリメンタルなヒューマン・イン・ループ・プロセスの実行など、コストがかかる。
本稿では,データ収集パイプラインの状態/動作空間と,非破壊的動作の予測に責任を負う要因を再考する。
この目的のために,ロボット模倣学習のための階層型データ収集空間(HD-Space)を導入する。
具体的には、高レベルな視点から複数の重要な原子タスクに細かな操作タスクを分割し、堅牢なILデータを生成することを目的として、人間のデモンストレーションのための原子状態/アクション空間を設計する。
我々は,2つの実世界および5つの実世界の長距離操作タスクに対して実験的な評価を行い,HD空間データを用いたILポリシートレーニングが政策性能を大幅に向上できることを実証した。
HD-Spaceは、特に長距離操作タスクにおいて、より強力なポリシーをトレーニングするために、少量のデモデータを使用することができる。
私たちはHD-Spaceがデータ品質の最適化とデータスケーリングの指針となることを目標にしています。
プロジェクトページ: https://hd-space-robotics.github.io
関連論文リスト
- ManiBox: Enhancing Spatial Grasping Generalization via Scalable Simulation Data Generation [37.73074657448699]
bfManiBoxは、シミュレーションベースの教師学生フレームワーク上に構築された新しいバウンディングボックス誘導操作手法である。
ManiBoxは、空間的把握の一般化と多様なオブジェクトや背景への適応性を著しく改善した。
論文 参考訳(メタデータ) (2024-11-04T07:05:02Z) - D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning [99.33607114541861]
ロボット操作と移動環境の現実的なシミュレーションに焦点を当てたオフラインRLのための新しいベンチマークを提案する。
提案するベンチマークでは、状態ベースドメインと画像ベースドメインを対象とし、オフラインRLとオンライン微調整評価の両方をサポートしている。
論文 参考訳(メタデータ) (2024-08-15T22:27:00Z) - JUICER: Data-Efficient Imitation Learning for Robotic Assembly [21.43402768760014]
本稿では,人体実験予算を小さくすることで,模擬学習性能を向上させるパイプラインを提案する。
我々のパイプラインは、表現力のあるポリシーアーキテクチャと、データセットの拡張とシミュレーションベースのデータ拡張のための様々な技術を組み合わせています。
シミュレーションで4つの家具組立タスクのパイプラインを実演し、2500近い時間ステップで最大5つの部品をマニピュレータで組み立てます。
論文 参考訳(メタデータ) (2024-04-04T18:00:15Z) - Any-point Trajectory Modeling for Policy Learning [64.23861308947852]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - Leveraging Demonstrations with Latent Space Priors [90.56502305574665]
本稿では,スキル学習とシーケンスモデリングを組み合わせることで,実演データセットを活用することを提案する。
本研究では、国家のみのモーションキャプチャーの実証から、そのような先行情報をどうやって取得するかを示し、政策学習に組み込むためのいくつかの方法を探る。
実験結果から, 学習速度と最終性能において, 遅延空間が顕著に向上することが確認された。
論文 参考訳(メタデータ) (2022-10-26T13:08:46Z) - Batch Exploration with Examples for Scalable Robotic Reinforcement
Learning [63.552788688544254]
BEE(Batch Exploration with Examples)は、重要状態の画像の少ない数の人間がガイドする状態空間の関連領域を探索する。
BEEは、シミュレーションと本物のフランカロボットの両方で、視覚ベースの操作に挑戦することができる。
論文 参考訳(メタデータ) (2020-10-22T17:49:25Z) - Low Dimensional State Representation Learning with Reward-shaped Priors [7.211095654886105]
本研究では,観測結果から低次元状態空間への写像の学習を目的とした手法を提案する。
このマッピングは、環境とタスクの事前知識を組み込むために形作られた損失関数を用いて教師なしの学習で学習される。
本手法は,シミュレーション環境における移動ロボットナビゲーションタスクおよび実ロボット上でのテストを行う。
論文 参考訳(メタデータ) (2020-07-29T13:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。