論文の概要: Active Task Randomization: Learning Robust Skills via Unsupervised
Generation of Diverse and Feasible Tasks
- arxiv url: http://arxiv.org/abs/2211.06134v2
- Date: Tue, 18 Apr 2023 07:34:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-19 18:13:36.474672
- Title: Active Task Randomization: Learning Robust Skills via Unsupervised
Generation of Diverse and Feasible Tasks
- Title(参考訳): アクティブタスクランダム化:多元的タスクの教師なし生成によるロバストスキルの学習
- Authors: Kuan Fang, Toki Migimatsu, Ajay Mandlekar, Li Fei-Fei, Jeannette Bohg
- Abstract要約: 我々は、教師なしのトレーニングタスクの生成を通じて、堅牢なスキルを学ぶアプローチであるActive Task Randomization (ATR)を導入する。
ATRは、タスクの多様性と実現可能性のバランスをとることで、堅牢なスキルを学ぶために、初期環境状態と操作目標からなる適切なタスクを選択する。
本研究では,視覚的入力に基づく逐次操作問題の解決のために,タスクプランナが学習スキルを構成することを実証する。
- 参考スコア(独自算出の注目度): 37.73239471412444
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Solving real-world manipulation tasks requires robots to have a repertoire of
skills applicable to a wide range of circumstances. When using learning-based
methods to acquire such skills, the key challenge is to obtain training data
that covers diverse and feasible variations of the task, which often requires
non-trivial manual labor and domain knowledge. In this work, we introduce
Active Task Randomization (ATR), an approach that learns robust skills through
the unsupervised generation of training tasks. ATR selects suitable tasks,
which consist of an initial environment state and manipulation goal, for
learning robust skills by balancing the diversity and feasibility of the tasks.
We propose to predict task diversity and feasibility by jointly learning a
compact task representation. The selected tasks are then procedurally generated
in simulation using graph-based parameterization. The active selection of these
training tasks enables skill policies trained with our framework to robustly
handle a diverse range of objects and arrangements at test time. We demonstrate
that the learned skills can be composed by a task planner to solve unseen
sequential manipulation problems based on visual inputs. Compared to baseline
methods, ATR can achieve superior success rates in single-step and sequential
manipulation tasks.
- Abstract(参考訳): 現実世界の操作タスクを解決するには、ロボットは幅広い状況に適用できるスキルのレパートリーを持つ必要がある。
このようなスキルを習得するために学習ベースの手法を使用する場合、重要な課題はタスクの多様性と実現可能なバリエーションをカバーするトレーニングデータを得ることである。
本研究では、教師なしのトレーニングタスクの生成を通じて、堅牢なスキルを学ぶアプローチであるActive Task Randomization (ATR)を紹介する。
ATRは、タスクの多様性と実現可能性のバランスをとることで、堅牢なスキルを学ぶために、初期環境状態と操作目標からなる適切なタスクを選択する。
本稿では,コンパクトなタスク表現を共同学習することで,タスクの多様性と実現可能性を予測することを提案する。
選択されたタスクは、グラフベースのパラメータ化を用いたシミュレーションで手続き的に生成される。
これらのトレーニングタスクのアクティブな選択により、我々のフレームワークでトレーニングされたスキルポリシーは、テスト時にさまざまなオブジェクトやアレンジメントを堅牢に処理できます。
本研究では,視覚的入力に基づく逐次操作問題の解決のために,タスクプランナが学習スキルを構成することを実証する。
ベースライン法と比較して、atrはシングルステップおよびシーケンシャルな操作タスクにおいて優れた成功率を達成できる。
関連論文リスト
- Active Instruction Tuning: Improving Cross-Task Generalization by
Training on Prompt Sensitive Tasks [101.40633115037983]
インストラクションチューニング(IT)は,大規模言語モデル(LLM)を命令付き多種多様なタスクで訓練することにより,印象的なゼロショット一般化を実現する。
ITモデルの性能と一般化性を改善するために、新しいタスクをどのように選択するかは、未解決の問題である。
本稿では,情報的タスクを識別する新しいフレームワークである即時不確実性に基づくアクティブな指導チューニングを提案し,選択したタスク上でモデルをアクティブにチューニングする。
論文 参考訳(メタデータ) (2023-11-01T04:40:05Z) - Reinforcement Learning with Success Induced Task Prioritization [68.8204255655161]
本稿では,自動カリキュラム学習のためのフレームワークであるSuccess induced Task Prioritization (SITP)を紹介する。
アルゴリズムはエージェントに最速の学習を提供するタスクの順序を選択する。
我々は,SITPが他のカリキュラム設計手法と一致するか,あるいは上回っていることを実証する。
論文 参考訳(メタデータ) (2022-12-30T12:32:43Z) - Transferring Knowledge for Reinforcement Learning in Contact-Rich
Manipulation [10.219833196479142]
複数のスキルの前提を活かして、類似したタスクのファミリー内で知識を伝達するという課題に対処する。
提案手法は, 先行タスク毎の実証軌道から, スキル埋め込みを表す潜在行動空間を学習する。
我々は,ペグ・イン・ホール・イン・イン・イン・イン・イン・イン・イン・イン・イン・インサート・タスクのセットを用いて本手法の評価を行い,トレーニング中に遭遇したことのない新しいタスクへのより良い一般化を実証した。
論文 参考訳(メタデータ) (2022-09-19T10:31:13Z) - An Evolutionary Approach to Dynamic Introduction of Tasks in Large-scale
Multitask Learning Systems [4.675744559395732]
マルチタスク学習は、複数のタスクから学習できるモデルが知識伝達によってより良い品質と効率を達成すると仮定する。
最先端のMLモデルは、タスクごとに高いカスタマイズに依存し、タスクの数をスケールするのではなく、サイズとデータスケールを活用する。
本稿では,大規模マルチタスクモデルを生成でき,新しいタスクの動的かつ連続的な追加を支援する進化的手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T13:10:47Z) - Variational Multi-Task Learning with Gumbel-Softmax Priors [105.22406384964144]
マルチタスク学習は、タスク関連性を探究し、個々のタスクを改善することを目的としている。
本稿では,複数のタスクを学習するための一般的な確率的推論フレームワークである変分マルチタスク学習(VMTL)を提案する。
論文 参考訳(メタデータ) (2021-11-09T18:49:45Z) - Efficiently Identifying Task Groupings for Multi-Task Learning [55.80489920205404]
マルチタスク学習は、あるタスクによって学習された情報を活用して、他のタスクのトレーニングに役立てることができる。
マルチタスク学習モデルにおいて、どのタスクを一緒にトレーニングすべきかを選択するアプローチを提案する。
本手法は,全タスクを協調学習し,タスクの勾配が他のタスクの損失に影響を及ぼす影響を定量化する。
論文 参考訳(メタデータ) (2021-09-10T02:01:43Z) - Discovering Generalizable Skills via Automated Generation of Diverse
Tasks [82.16392072211337]
本稿では,多種多様なタスクの自動生成による一般化可能なスキルの発見手法を提案する。
教師なしスキル発見の先行研究とは対照的に,本手法では各スキルをトレーニング可能なタスクジェネレータが生成するユニークなタスクとペアリングする。
生成したタスクにおけるロボットの動作に定義されたタスク判別器を共同で訓練し、多様性目標の低いエビデンスを推定する。
学習スキルは階層的な強化学習アルゴリズムで構成され、目に見えない目標タスクを解決する。
論文 参考訳(メタデータ) (2021-06-26T03:41:51Z) - Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。
私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。
学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文 参考訳(メタデータ) (2020-07-01T09:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。