論文の概要: SKILL-IL: Disentangling Skill and Knowledge in Multitask Imitation
Learning
- arxiv url: http://arxiv.org/abs/2205.03130v1
- Date: Fri, 6 May 2022 10:38:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-09 17:44:24.184590
- Title: SKILL-IL: Disentangling Skill and Knowledge in Multitask Imitation
Learning
- Title(参考訳): SKILL-IL:マルチタスク模倣学習におけるスキルと知識の両立
- Authors: Bian Xihan and Oscar Mendez and Simon Hadfield
- Abstract要約: 人間はスキルと知識を伝達することができる。仕事のサイクルと店へのドライブができれば、店へのサイクルと仕事へのドライブも可能だ。
このことから着想を得て、ポリシーネットワークの潜在記憶を2つのパーティションに切り離すことができると仮定する。
これらは、タスクの環境コンテキストに関する知識や、タスクの解決に必要な一般化可能なスキルを含んでいる。
- 参考スコア(独自算出の注目度): 21.222568055417717
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this work, we introduce a new perspective for learning transferable
content in multi-task imitation learning. Humans are able to transfer skills
and knowledge. If we can cycle to work and drive to the store, we can also
cycle to the store and drive to work. We take inspiration from this and
hypothesize the latent memory of a policy network can be disentangled into two
partitions. These contain either the knowledge of the environmental context for
the task or the generalizable skill needed to solve the task. This allows
improved training efficiency and better generalization over previously unseen
combinations of skills in the same environment, and the same task in unseen
environments.
We used the proposed approach to train a disentangled agent for two different
multi-task IL environments. In both cases we out-performed the SOTA by 30% in
task success rate. We also demonstrated this for navigation on a real robot.
- Abstract(参考訳): 本稿では,多タスク模倣学習における転送可能コンテンツの学習のための新しい視点を提案する。
人間はスキルと知識を伝達することができる。
仕事へのサイクルと店へのドライブが可能な場合は、ストアへのサイクルと作業へのドライブも可能です。
このことから着想を得て、ポリシーネットワークの潜在記憶を2つのパーティションに切り離すことができると仮定する。
これらは、タスクの環境コンテキストに関する知識や、タスクの解決に必要な一般化可能なスキルを含んでいる。
これにより、トレーニング効率が向上し、同じ環境でのスキルと、目に見えない環境でのスキルの組み合わせよりも一般化できる。
提案手法を用いて,2つの異なるマルチタスクIL環境に対するアンタングルエージェントのトレーニングを行った。
どちらのケースでも、タスクの成功率でSOTAを30%上回りました。
また、実際のロボットのナビゲーションもデモした。
関連論文リスト
- Multitask Learning with No Regret: from Improved Confidence Bounds to
Active Learning [79.07658065326592]
推定タスクの不確実性の定量化は、オンラインやアクティブな学習など、多くの下流アプリケーションにとって重要な課題である。
タスク間の類似性やタスクの特徴を学習者に提供できない場合、課題設定において新しいマルチタスク信頼区間を提供する。
本稿では,このパラメータを事前に知らないまま,このような改善された後悔を実現する新しいオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-03T13:08:09Z) - Choreographer: Learning and Adapting Skills in Imagination [60.09911483010824]
我々は、その世界モデルを利用して想像力のスキルを学び、適応するモデルベースのエージェントであるChoreographerを紹介する。
提案手法は探索とスキル学習のプロセスを切り離し,モデルの潜在状態空間におけるスキルの発見を可能にする。
Choreographerはオフラインデータからスキルを学ぶことができ、探索ポリシーと同時にデータを集めることができる。
論文 参考訳(メタデータ) (2022-11-23T23:31:14Z) - Transferring Knowledge for Reinforcement Learning in Contact-Rich
Manipulation [10.219833196479142]
複数のスキルの前提を活かして、類似したタスクのファミリー内で知識を伝達するという課題に対処する。
提案手法は, 先行タスク毎の実証軌道から, スキル埋め込みを表す潜在行動空間を学習する。
我々は,ペグ・イン・ホール・イン・イン・イン・イン・イン・イン・イン・イン・イン・インサート・タスクのセットを用いて本手法の評価を行い,トレーニング中に遭遇したことのない新しいタスクへのより良い一般化を実証した。
論文 参考訳(メタデータ) (2022-09-19T10:31:13Z) - Hierarchical Skills for Efficient Exploration [70.62309286348057]
強化学習において、事前訓練された低レベルスキルは、探索を大幅に促進する可能性がある。
下流タスクの以前の知識は、スキルデザインにおける一般性(きめ細かい制御)と特異性(より高速な学習)の適切なバランスをとるために必要である。
教師なしの方法で様々な複雑さのスキルを習得する階層的スキル学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-20T22:29:32Z) - Discovering Generalizable Skills via Automated Generation of Diverse
Tasks [82.16392072211337]
本稿では,多種多様なタスクの自動生成による一般化可能なスキルの発見手法を提案する。
教師なしスキル発見の先行研究とは対照的に,本手法では各スキルをトレーニング可能なタスクジェネレータが生成するユニークなタスクとペアリングする。
生成したタスクにおけるロボットの動作に定義されたタスク判別器を共同で訓練し、多様性目標の低いエビデンスを推定する。
学習スキルは階層的な強化学習アルゴリズムで構成され、目に見えない目標タスクを解決する。
論文 参考訳(メタデータ) (2021-06-26T03:41:51Z) - Robot in a China Shop: Using Reinforcement Learning for
Location-Specific Navigation Behaviour [24.447207633447363]
本稿では,マルチタスク学習問題として扱われるナビゲーションに対する新しいアプローチを提案する。
これによりロボットは、異なる環境における視覚的なナビゲーションタスクにおいて、異なる振る舞いを学ぶことができる。
論文 参考訳(メタデータ) (2021-06-02T19:31:27Z) - Efficient and robust multi-task learning in the brain with modular task
primitives [2.6166087473624318]
タスクプリミティブを具備したモジュールネットワークは,パラメータ数と更新率を低く保ちながら,複数のタスクを適切に学習することができることを示す。
また,本手法により得られたスキルは,他のマルチタスク学習戦略に比べて幅広い摂動に対してより堅牢であることを示す。
論文 参考訳(メタデータ) (2021-05-28T21:07:54Z) - Latent Skill Planning for Exploration and Transfer [49.25525932162891]
本稿では,この2つの手法を1つの強化学習エージェントに統合する方法について検討する。
テスト時の高速適応に部分的償却の考え方を活用する。
私たちは、困難なロコモーションタスクのスイートでデザイン決定のメリットを実演しています。
論文 参考訳(メタデータ) (2020-11-27T18:40:03Z) - Measuring and Harnessing Transference in Multi-Task Learning [58.48659733262734]
マルチタスク学習は、あるタスクによって学習された情報を活用して、他のタスクのトレーニングに役立てることができる。
情報伝達や伝達のダイナミクスを、トレーニングを通して分析する。
論文 参考訳(メタデータ) (2020-10-29T08:25:43Z) - ELSIM: End-to-end learning of reusable skills through intrinsic
motivation [0.0]
本稿では、階層的に学習し、エンドツーエンドで自己生成スキルを表現する新しい強化学習アーキテクチャを提案する。
このアーキテクチャでは、エージェントは、スキルボトムアップの学習プロセスを維持しながら、タスクリワードスキルのみに焦点を当てる。
論文 参考訳(メタデータ) (2020-06-23T11:20:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。