論文の概要: ASC me to Do Anything: Multi-task Training for Embodied AI
- arxiv url: http://arxiv.org/abs/2202.06987v1
- Date: Mon, 14 Feb 2022 19:02:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 10:15:03.784214
- Title: ASC me to Do Anything: Multi-task Training for Embodied AI
- Title(参考訳): asc me to do anything: 具体化されたaiのためのマルチタスクトレーニング
- Authors: Jiasen Lu, Jordi Salvador, Roozbeh Mottaghi, Aniruddha Kembhavi
- Abstract要約: Embodied AIのためのマルチタスクトレーニング手法を提案する。
複数のタスク間で共有されるアトミックスキルのセットは、タスクを実行するために組み立てられる。
ASCは、未学習のシーンに比べて、Seenのシーンでは2倍、Unseenのシーンでは4倍の成功率を向上させる。
- 参考スコア(独自算出の注目度): 33.741899086608264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied AI has seen steady progress across a diverse set of independent
tasks. While these varied tasks have different end goals, the basic skills
required to complete them successfully overlap significantly. In this paper,
our goal is to leverage these shared skills to learn to perform multiple tasks
jointly. We propose Atomic Skill Completion (ASC), an approach for multi-task
training for Embodied AI, where a set of atomic skills shared across multiple
tasks are composed together to perform the tasks. The key to the success of
this approach is a pre-training scheme that decouples learning of the skills
from the high-level tasks making joint training effective. We use ASC to train
agents within the AI2-THOR environment to perform four interactive tasks
jointly and find it to be remarkably effective. In a multi-task setting, ASC
improves success rates by a factor of 2x on Seen scenes and 4x on Unseen scenes
compared to no pre-training. Importantly, ASC enables us to train a multi-task
agent that has a 52% higher Success Rate than training 4 independent single
task agents. Finally, our hierarchical agents are more interpretable than
traditional black-box architectures.
- Abstract(参考訳): Embodied AIは、さまざまな独立したタスクセットで着実に進歩している。
これらのタスクには異なる目標があるが、完了に必要な基本的なスキルは大幅に重複する。
本稿では、これらの共有スキルを活用して、複数のタスクを共同で実行することを目的とする。
我々は,複数のタスク間で共有されるアトミックスキルのセットをまとめてタスクを実行する,Embodied AIのためのマルチタスクトレーニングのためのアプローチであるAtomic Skill Completion (ASC)を提案する。
このアプローチの成功の鍵は、共同トレーニングを効果的にするハイレベルなタスクからスキルの学習を分離する事前学習スキームである。
ASCを用いてAI2-THOR環境内のエージェントを訓練し、4つの対話的なタスクを共同で実行し、極めて効果的であることを示す。
マルチタスク環境では、ASCは未学習に比べてSeenシーンの2倍、Unseenシーンの4倍の成功率を向上させる。
重要なことに、ASCは4つの独立したタスクエージェントのトレーニングよりも52%高い成功率を持つマルチタスクエージェントのトレーニングを可能にします。
最後に、我々の階層的エージェントは従来のブラックボックスアーキテクチャよりも解釈可能である。
関連論文リスト
- Robust Subtask Learning for Compositional Generalization [20.54144051436337]
我々は、どんなタスクでも実行できるように、サブタスクポリシーをトレーニングする問題に焦点を合わせます。
我々は、平均的なケースのパフォーマンスとは対照的に、すべてのタスクで最悪のケースのパフォーマンスを最大化することを目指している。
論文 参考訳(メタデータ) (2023-02-06T18:19:25Z) - CompoSuite: A Compositional Reinforcement Learning Benchmark [20.89464587308586]
合成マルチタスク強化学習(RL)のためのオープンソースのベンチマークであるCompoSuiteを提案する。
それぞれのCompoSuiteタスクは、障害物を避けながらタスク目標を達成するために、特定のロボットアームが1つの個々のオブジェクトを操作する必要がある。
我々は,既存のシングルタスク,マルチタスク,コンポジション学習のアルゴリズムを,様々なトレーニング設定でベンチマークし,それらが目に見えないタスクに合成的に一般化する能力を評価する。
論文 参考訳(メタデータ) (2022-07-08T22:01:52Z) - SKILL-IL: Disentangling Skill and Knowledge in Multitask Imitation
Learning [21.222568055417717]
人間はスキルと知識を伝達することができる。仕事のサイクルと店へのドライブができれば、店へのサイクルと仕事へのドライブも可能だ。
このことから着想を得て、ポリシーネットワークの潜在記憶を2つのパーティションに切り離すことができると仮定する。
これらは、タスクの環境コンテキストに関する知識や、タスクの解決に必要な一般化可能なスキルを含んでいる。
論文 参考訳(メタデータ) (2022-05-06T10:38:01Z) - LDSA: Learning Dynamic Subtask Assignment in Cooperative Multi-Agent
Reinforcement Learning [122.47938710284784]
協調型MARLにおける動的サブタスク代入(LDSA)を学習するための新しいフレームワークを提案する。
エージェントを異なるサブタスクに合理的に割り当てるために,能力に基づくサブタスク選択戦略を提案する。
LDSAは、より優れたコラボレーションのために、合理的で効果的なサブタスクの割り当てを学習していることを示す。
論文 参考訳(メタデータ) (2022-05-05T10:46:16Z) - Towards More Generalizable One-shot Visual Imitation Learning [81.09074706236858]
汎用ロボットは、幅広いタスクを習得し、過去の経験を生かして、新しいタスクを素早く学ぶことができるべきである。
ワンショット模倣学習(OSIL)は、専門家のデモンストレーションでエージェントを訓練することで、この目標にアプローチする。
我々は、より野心的なマルチタスク設定を調査することで、より高度な一般化能力を追求する。
論文 参考訳(メタデータ) (2021-10-26T05:49:46Z) - Example-Driven Model-Based Reinforcement Learning for Solving
Long-Horizon Visuomotor Tasks [85.56153200251713]
長軸ビズモータタスクの完了に適したプリミティブスキルを学習するためのモデルベースRL手法EMBRを紹介する。
フランカ・エミカのロボットアームでは、EMBRによってロボットは85%の成功率で3つの長い水平視運動タスクを完了できることがわかった。
論文 参考訳(メタデータ) (2021-09-21T16:48:07Z) - Measuring and Harnessing Transference in Multi-Task Learning [58.48659733262734]
マルチタスク学習は、あるタスクによって学習された情報を活用して、他のタスクのトレーニングに役立てることができる。
情報伝達や伝達のダイナミクスを、トレーニングを通して分析する。
論文 参考訳(メタデータ) (2020-10-29T08:25:43Z) - Gradient Surgery for Multi-Task Learning [119.675492088251]
マルチタスク学習は、複数のタスク間で構造を共有するための有望なアプローチとして登場した。
マルチタスク学習がシングルタスク学習と比較して難しい理由は、完全には理解されていない。
本稿では,他の作業の勾配の正規平面上にタスクの勾配を投影する勾配手術の一形態を提案する。
論文 参考訳(メタデータ) (2020-01-19T06:33:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。