論文の概要: Bridge Data: Boosting Generalization of Robotic Skills with Cross-Domain
Datasets
- arxiv url: http://arxiv.org/abs/2109.13396v1
- Date: Mon, 27 Sep 2021 23:42:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-30 03:05:50.340145
- Title: Bridge Data: Boosting Generalization of Robotic Skills with Cross-Domain
Datasets
- Title(参考訳): ブリッジデータ: クロスドメインデータセットを用いたロボットスキルの一般化の促進
- Authors: Frederik Ebert, Yanlai Yang, Karl Schmeckpeper, Bernadette Bucher,
Georgios Georgakis, Kostas Daniilidis, Chelsea Finn, Sergey Levine
- Abstract要約: マルチドメインとマルチタスクのデータセットが、新しい環境における新しいタスクの学習を改善する方法について検討する。
また、新しいドメイン内の少数のタスクのみのデータによって、ドメインギャップを埋めることができ、ロボットが他のドメインでしか見られなかったさまざまなタスクを実行できることもわかりました。
- 参考スコア(独自算出の注目度): 122.85598648289789
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robot learning holds the promise of learning policies that generalize
broadly. However, such generalization requires sufficiently diverse datasets of
the task of interest, which can be prohibitively expensive to collect. In other
fields, such as computer vision, it is common to utilize shared, reusable
datasets, such as ImageNet, to overcome this challenge, but this has proven
difficult in robotics. In this paper, we ask: what would it take to enable
practical data reuse in robotics for end-to-end skill learning? We hypothesize
that the key is to use datasets with multiple tasks and multiple domains, such
that a new user that wants to train their robot to perform a new task in a new
domain can include this dataset in their training process and benefit from
cross-task and cross-domain generalization. To evaluate this hypothesis, we
collect a large multi-domain and multi-task dataset, with 7,200 demonstrations
constituting 71 tasks across 10 environments, and empirically study how this
data can improve the learning of new tasks in new environments. We find that
jointly training with the proposed dataset and 50 demonstrations of a
never-before-seen task in a new domain on average leads to a 2x improvement in
success rate compared to using target domain data alone. We also find that data
for only a few tasks in a new domain can bridge the domain gap and make it
possible for a robot to perform a variety of prior tasks that were only seen in
other domains. These results suggest that reusing diverse multi-task and
multi-domain datasets, including our open-source dataset, may pave the way for
broader robot generalization, eliminating the need to re-collect data for each
new robot learning project.
- Abstract(参考訳): ロボット学習は、広く一般化する学習ポリシーの約束を守る。
しかし、そのような一般化は興味のあるタスクの十分な多様なデータセットを必要とするため、収集には極めて高価である。
コンピュータビジョンなどの他の分野では、ImageNetのような共有再利用可能なデータセットを使用してこの課題を克服することが一般的だが、ロボット工学では難しいことが証明されている。
本稿では、ロボット工学におけるデータ再利用をエンドツーエンドのスキル学習に有効化するには、何が必要でしょうか?
キーとなるのは、複数のタスクと複数のドメインを持つデータセットを使用することであり、新しいドメインで新しいタスクを実行するためにロボットをトレーニングしたい新しいユーザは、このデータセットをトレーニングプロセスに含め、クロスタスクとクロスドメインの一般化の恩恵を受けることができる。
この仮説を評価するために,10環境にわたる71のタスクを構成する7,200のデモを行い,新しい環境における新しいタスクの学習を改善する方法について実証研究を行った。
提案したデータセットによる共同トレーニングと,新しいドメインにおける予期せぬタスクの50のデモが,ターゲットドメインデータのみを使用する場合と比較して,成功率を2倍に向上させることがわかった。
また、新しいドメイン内の少数のタスクのみのデータによって、ドメインギャップを埋めることができ、ロボットが他のドメインでしか見られなかったさまざまなタスクを実行できることもわかりました。
これらの結果は、当社のオープンソースデータセットを含む多様なマルチタスクおよびマルチドメインデータセットの再利用が、ロボットの汎用化への道を開く可能性を示唆しており、新しいロボット学習プロジェクトごとにデータを再収集する必要がなくなる。
関連論文リスト
- PoCo: Policy Composition from and for Heterogeneous Robot Learning [44.1315170137613]
現在のメソッドは通常、1つのポリシーをトレーニングするために、1つのドメインからすべてのデータを収集し、プールします。
多様なモダリティやドメインにまたがる情報を組み合わせるための,ポリシ・コンポジションと呼ばれる柔軟なアプローチを提案する。
提案手法はタスクレベルの構成をマルチタスク操作に使用することができ,分析コスト関数を用いて推論時のポリシー動作を適応させることができる。
論文 参考訳(メタデータ) (2024-02-04T14:51:49Z) - BridgeData V2: A Dataset for Robot Learning at Scale [73.86688388408021]
BridgeData V2は、ロボット操作行動の大規模で多様なデータセットである。
対象は、24の環境にまたがる60,096個のトラジェクトリだ。
論文 参考訳(メタデータ) (2023-08-24T17:41:20Z) - RH20T: A Comprehensive Robotic Dataset for Learning Diverse Skills in
One-Shot [56.130215236125224]
オープンドメインでのロボット操作における重要な課題は、ロボットの多様性と一般化可能なスキルの獲得方法である。
単発模倣学習の最近の研究は、訓練されたポリシーを実証に基づく新しいタスクに移行する可能性を示唆している。
本稿では,エージェントがマルチモーダルな知覚で数百の現実世界のスキルを一般化する可能性を解き放つことを目的とする。
論文 参考訳(メタデータ) (2023-07-02T15:33:31Z) - Understanding the World Through Action [91.3755431537592]
ラベルのないデータを利用するための汎用的で原則的で強力なフレームワークは、強化学習から導き出すことができると私は主張する。
このような手順が、下流の潜在的なタスクとどのように密接に一致しているかについて論じます。
論文 参考訳(メタデータ) (2021-10-24T22:33:52Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - Efficient Self-Supervised Data Collection for Offline Robot Learning [17.461103383630853]
ロボット強化学習の実用的なアプローチは、まずリアルまたはシミュレートされたロボット相互作用データの大規模なバッチを収集することです。
我々は,新しい観測結果にデータ収集を積極的に焦点をあてる,簡便な目標条件強化学習法を開発した。
論文 参考訳(メタデータ) (2021-05-10T18:42:58Z) - COG: Connecting New Skills to Past Experience with Offline Reinforcement
Learning [78.13740204156858]
我々は、動的プログラミングによって新しいスキルを拡張するために、事前データを再利用できることを示します。
我々は、新しいタスクを解決するために、以前のデータセットに見られるいくつかの動作をチェーンすることで、アプローチの有効性を実証する。
我々は、高次元画像観察を低レベルのロボット制御コマンドにマッピングし、エンドツーエンドでポリシーを訓練する。
論文 参考訳(メタデータ) (2020-10-27T17:57:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。