論文の概要: Modular Adaptive Policy Selection for Multi-Task Imitation Learning
through Task Division
- arxiv url: http://arxiv.org/abs/2203.14855v1
- Date: Mon, 28 Mar 2022 15:53:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 19:33:14.477951
- Title: Modular Adaptive Policy Selection for Multi-Task Imitation Learning
through Task Division
- Title(参考訳): タスク分割によるマルチタスク模倣学習のためのモジュール適応ポリシー選択
- Authors: Dafni Antotsiou, Carlo Ciliberto and Tae-Kyun Kim
- Abstract要約: マルチタスク学習は、しばしば負の伝達に悩まされ、タスク固有の情報を共有する。
これは、プロトポリケーションをモジュールとして使用して、タスクを共有可能な単純なサブ振る舞いに分割する。
また、タスクを共有サブ行動とタスク固有のサブ行動の両方に自律的に分割する能力を示す。
- 参考スコア(独自算出の注目度): 60.232542918414985
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep imitation learning requires many expert demonstrations, which can be
hard to obtain, especially when many tasks are involved. However, different
tasks often share similarities, so learning them jointly can greatly benefit
them and alleviate the need for many demonstrations. But, joint multi-task
learning often suffers from negative transfer, sharing information that should
be task-specific. In this work, we introduce a method to perform multi-task
imitation while allowing for task-specific features. This is done by using
proto-policies as modules to divide the tasks into simple sub-behaviours that
can be shared. The proto-policies operate in parallel and are adaptively chosen
by a selector mechanism that is jointly trained with the modules. Experiments
on different sets of tasks show that our method improves upon the accuracy of
single agents, task-conditioned and multi-headed multi-task agents, as well as
state-of-the-art meta learning agents. We also demonstrate its ability to
autonomously divide the tasks into both shared and task-specific
sub-behaviours.
- Abstract(参考訳): 深い模倣学習は、多くの専門家によるデモンストレーションを必要とするが、特に多くのタスクが関与している場合には、取得が困難である。
しかし、異なるタスクはしばしば類似点を共有するため、それらを一緒に学ぶことは彼らにとって大きな利益となり、多くのデモの必要性を軽減できる。
しかし、共同マルチタスク学習はしばしば負の伝達に悩まされ、タスク固有の情報を共有する。
本稿では,タスク特有の特徴を生かしながらマルチタスク模倣を行う手法を提案する。
これは、プロトポリケーションをモジュールとして使用して、タスクを共有可能な単純なサブ振る舞いに分割する。
プロトポリアは並列に動作し、モジュールと共同で訓練されたセレクタ機構によって適応的に選択される。
異なるタスクセットにおける実験により,単一エージェント,タスクコンディショニングエージェント,マルチヘッドマルチタスクエージェント,最先端のメタ学習エージェントの精度が向上した。
また、タスクを共有行動とタスク固有のサブ行動の両方に自律的に分割する能力を示す。
関連論文リスト
- Musketeer: Joint Training for Multi-task Vision Language Model with Task Explanation Prompts [75.75548749888029]
本稿では,全てのタスクに対してパラメータを共同で訓練し,複数の異種タスク間で完全に共有する視覚言語モデルを提案する。
単一のモデルで、Musteteerは単一のタスクでトレーニングされた強いベースラインに匹敵する結果を得る。
論文 参考訳(メタデータ) (2023-05-11T17:57:49Z) - Sparsely Activated Mixture-of-Experts are Robust Multi-Task Learners [67.5865966762559]
本研究では,Mixture-of-Experts (MoE) がマルチタスク学習を改善するかを検討した。
タスク認識ゲーティング関数を考案し、異なるタスクから専門の専門家にサンプルをルーティングする。
これにより、多数のパラメータを持つ疎活性化マルチタスクモデルが得られるが、高密度モデルの計算コストは同じである。
論文 参考訳(メタデータ) (2022-04-16T00:56:12Z) - Learning Multi-Tasks with Inconsistent Labels by using Auxiliary Big
Task [24.618094251341958]
マルチタスク学習は,タスク間の共通知識の伝達と活用により,モデルの性能を向上させることを目的とする。
本稿では,これらの課題をカバーするために,学習した補助的大タスクから豊富な情報と十分な数のクラスを両立させることにより,これらの課題を学習するための枠組みを提案する。
実験により, 現状のアプローチと比較し, その有効性を示した。
論文 参考訳(メタデータ) (2022-01-07T02:46:47Z) - Revisit Multimodal Meta-Learning through the Lens of Multi-Task Learning [33.19179706038397]
マルチモーダルなメタラーニングは、その設定を多様なマルチモーダルなタスク分布に一般化することで、従来の数発メタラーニングを拡張した最近の問題である。
これまでの研究では、マルチモーダル分布で訓練された1つのメタラーナーは、個々の単調分布で訓練された複数のメタラーナーを上回ることがあると主張している。
まず,マイクロレベルで異なるモードのタスク間の知識伝達を定量化する手法を提案する。
第二に、マルチタスク学習におけるハードパラメータ共有と関連する作業の新たな解釈から着想を得た、新しいマルチモーダルメタラーンを提案する。
論文 参考訳(メタデータ) (2021-10-27T06:23:45Z) - Towards More Generalizable One-shot Visual Imitation Learning [81.09074706236858]
汎用ロボットは、幅広いタスクを習得し、過去の経験を生かして、新しいタスクを素早く学ぶことができるべきである。
ワンショット模倣学習(OSIL)は、専門家のデモンストレーションでエージェントを訓練することで、この目標にアプローチする。
我々は、より野心的なマルチタスク設定を調査することで、より高度な一般化能力を追求する。
論文 参考訳(メタデータ) (2021-10-26T05:49:46Z) - Multi-Task Learning with Sequence-Conditioned Transporter Networks [67.57293592529517]
シーケンスコンディショニングと重み付きサンプリングのレンズによるマルチタスク学習の実現を目指している。
合成タスクを対象とした新しいベンチマークであるMultiRavensを提案する。
次に,視覚に基づくエンドツーエンドシステムアーキテクチャであるSequence-Conditioned Transporter Networksを提案する。
論文 参考訳(メタデータ) (2021-09-15T21:19:11Z) - Efficiently Identifying Task Groupings for Multi-Task Learning [55.80489920205404]
マルチタスク学習は、あるタスクによって学習された情報を活用して、他のタスクのトレーニングに役立てることができる。
マルチタスク学習モデルにおいて、どのタスクを一緒にトレーニングすべきかを選択するアプローチを提案する。
本手法は,全タスクを協調学習し,タスクの勾配が他のタスクの損失に影響を及ぼす影響を定量化する。
論文 参考訳(メタデータ) (2021-09-10T02:01:43Z) - Navigating the Trade-Off between Multi-Task Learning and Learning to
Multitask in Deep Neural Networks [9.278739724750343]
マルチタスク学習(マルチタスクきゅう、英: Multi-task learning)とは、機械学習において、ネットワークがタスクの取得を容易にするために様々なタスクで訓練されるパラダイムである。
マルチタスクは、特に認知科学の文献において、複数のタスクを同時に実行する能力を示すために用いられる。
深層ネットワークでも同様の緊張が生じていることを示し、エージェントが不慣れな環境でこのトレードオフを管理するためのメタ学習アルゴリズムについて議論する。
論文 参考訳(メタデータ) (2020-07-20T23:26:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。