論文の概要: Robots Learn Increasingly Complex Tasks with Intrinsic Motivation and
Automatic Curriculum Learning
- arxiv url: http://arxiv.org/abs/2202.10222v1
- Date: Fri, 11 Feb 2022 08:14:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-27 17:38:34.150639
- Title: Robots Learn Increasingly Complex Tasks with Intrinsic Motivation and
Automatic Curriculum Learning
- Title(参考訳): 内在的動機づけと自動カリキュラム学習による複雑タスクの学習
- Authors: Sao Mai Nguyen (Flowers, U2IS, IMT Atlantique - INFO,
Lab-STICC_RAMBO), Nicolas Duminy (Lab-STICC_RAMBO, IMT Atlantique - INFO,
UBS), Alexandre Manoury (IMT Atlantique - INFO, Lab-STICC_RAMBO), Dominique
Duhaut (UBS, Lab-STICC_RAMBO), C\'edric Buche (ENIB)
- Abstract要約: ロボットによるマルチタスク学習は、タスクの複雑さ、必要なアクションの複雑さ、伝達学習におけるタスク間の関係といった、ドメイン知識の課題を提起する。
このドメイン知識は、生涯学習の課題に対処するために学習できることを実証する。
そこで本稿では,ロボットが複雑度の高い複数の制御タスクを実現するために,非境界複雑性の動作列を学習するためのフレームワークを提案する。
- 参考スコア(独自算出の注目度): 44.62475518267084
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-task learning by robots poses the challenge of the domain knowledge:
complexity of tasks, complexity of the actions required, relationship between
tasks for transfer learning. We demonstrate that this domain knowledge can be
learned to address the challenges in life-long learning. Specifically, the
hierarchy between tasks of various complexities is key to infer a curriculum
from simple to composite tasks. We propose a framework for robots to learn
sequences of actions of unbounded complexity in order to achieve multiple
control tasks of various complexity. Our hierarchical reinforcement learning
framework, named SGIM-SAHT, offers a new direction of research, and tries to
unify partial implementations on robot arms and mobile robots. We outline our
contributions to enable robots to map multiple control tasks to sequences of
actions: representations of task dependencies, an intrinsically motivated
exploration to learn task hierarchies, and active imitation learning. While
learning the hierarchy of tasks, it infers its curriculum by deciding which
tasks to explore first, how to transfer knowledge, and when, how and whom to
imitate.
- Abstract(参考訳): ロボットによるマルチタスク学習は、タスクの複雑さ、必要なアクションの複雑さ、トランスファー学習におけるタスク間の関係といった、ドメイン知識の課題を提起する。
このドメイン知識は、生涯学習の課題に対処するために学習できることを実証する。
特に、様々な複雑さのタスク間の階層構造は、単純なタスクから複合タスクへカリキュラムを推論する鍵となる。
本稿では,ロボットが様々な複雑性の複数の制御タスクを実現するために,非境界複雑性の動作列を学習するためのフレームワークを提案する。
我々の階層的な強化学習フレームワークであるSGIM-SAHTは、新しい研究の方向性を提供し、ロボットアームと移動ロボットに部分的な実装を統合する。
我々はロボットが複数の制御タスクをアクションのシーケンスにマッピングできるようにするための貢献について概説する:タスク依存の表現、タスク階層を学ぶ本質的動機づけのある探索、アクティブな模倣学習。
タスクの階層を学習しながら、まずどのタスクを探索するか、どのように知識を移すか、いつ、どのように模倣するかを決め、カリキュラムを推測する。
関連論文リスト
- Continual Robot Learning using Self-Supervised Task Inference [19.635428830237842]
新しいタスクを継続的に学習するための自己教師型タスク推論手法を提案する。
我々は、行動マッチング型自己教師型学習目標を用いて、新しいタスク推論ネットワーク(TINet)を訓練する。
マルチタスクポリシはTINet上に構築され、タスクよりもパフォーマンスを最適化するために強化学習でトレーニングされている。
論文 参考訳(メタデータ) (2023-09-10T09:32:35Z) - LEMMA: Learning Language-Conditioned Multi-Robot Manipulation [21.75163634731677]
LanguagE-Conditioned Multi-robot Manipulation (LEMMA)
LeMMAは、手続き的に生成されるタスクが8種類あり、複雑さは様々である。
それぞれのタスクに対して,800の専門的なデモンストレーションと,トレーニングと評価のためのヒューマンインストラクションを提供します。
論文 参考訳(メタデータ) (2023-08-02T04:37:07Z) - RObotic MAnipulation Network (ROMAN) $\unicode{x2013}$ Hybrid
Hierarchical Learning for Solving Complex Sequential Tasks [70.69063219750952]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。
ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。
実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文 参考訳(メタデータ) (2023-06-30T20:35:22Z) - Saliency-Regularized Deep Multi-Task Learning [7.3810864598379755]
マルチタスク学習は、知識を共有するために複数の学習タスクを強制し、一般化能力を改善する。
現代のディープマルチタスク学習は、潜在機能とタスク共有を共同で学習することができるが、それらはタスク関係において不明瞭である。
本稿では,潜在的特徴と明示的な課題関係を共同で学習するマルチタスク学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-03T20:26:44Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Lifelong Robotic Reinforcement Learning by Retaining Experiences [61.79346922421323]
多くのマルチタスク強化学習は、ロボットが常にすべてのタスクからデータを収集できると仮定している。
本研究では,物理ロボットシステムの実用的制約を動機として,現実的なマルチタスクRL問題について検討する。
我々は、ロボットのスキルセットを累積的に成長させるために、過去のタスクで学んだデータとポリシーを効果的に活用するアプローチを導出する。
論文 参考訳(メタデータ) (2021-09-19T18:00:51Z) - MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale [103.7609761511652]
大規模集団ロボット学習システムが,行動のレパートリーを同時に獲得できることを示す。
新しいタスクは、以前学んだタスクから継続的にインスタンス化できる。
我々は,7台のロボットから収集したデータを用いて,実世界のタスク12組でシステムを訓練し,評価する。
論文 参考訳(メタデータ) (2021-04-16T16:38:02Z) - Intrinsically Motivated Open-Ended Multi-Task Learning Using Transfer
Learning to Discover Task Hierarchy [0.0]
オープンエンド環境では、ロボットは階層的強化学習において複数のパラメータ化された制御タスクを学習する必要がある。
最も複雑なタスクは、より単純なタスクから知識を転送することでより簡単に学習でき、タスクにアクションの複雑さを適用することでより早く学習できることを示します。
複雑な行動のタスク指向表現(手順と呼ばれる)を提案し、オンラインのタスク関係とアクションプリミティブの無制限のシーケンスを学び、環境の異なる可観測性を制御する。
論文 参考訳(メタデータ) (2021-02-19T10:44:08Z) - Modeling Long-horizon Tasks as Sequential Interaction Landscapes [75.5824586200507]
本稿では,一連のデモビデオからのみ,サブタスク間の依存関係と遷移を学習するディープラーニングネットワークを提案する。
これらのシンボルは、画像観察から直接学習し、予測できることが示される。
我々は,(1)人間によって実行されるパズル片のブロック積み重ね,(2)物体のピック・アンド・プレイスとキャビネットドアを7-DoFロボットアームで滑らせるロボット操作という,2つの長期水平作業において,我々の枠組みを評価する。
論文 参考訳(メタデータ) (2020-06-08T18:07:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。