論文の概要: CompoSuite: A Compositional Reinforcement Learning Benchmark
- arxiv url: http://arxiv.org/abs/2207.04136v1
- Date: Fri, 8 Jul 2022 22:01:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-12 13:39:17.084313
- Title: CompoSuite: A Compositional Reinforcement Learning Benchmark
- Title(参考訳): CompoSuite: 構成強化学習ベンチマーク
- Authors: Jorge A. Mendez, Marcel Hussing, Meghna Gummadi, Eric Eaton
- Abstract要約: 合成マルチタスク強化学習(RL)のためのオープンソースのベンチマークであるCompoSuiteを提案する。
それぞれのCompoSuiteタスクは、障害物を避けながらタスク目標を達成するために、特定のロボットアームが1つの個々のオブジェクトを操作する必要がある。
我々は,既存のシングルタスク,マルチタスク,コンポジション学習のアルゴリズムを,様々なトレーニング設定でベンチマークし,それらが目に見えないタスクに合成的に一般化する能力を評価する。
- 参考スコア(独自算出の注目度): 20.89464587308586
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We present CompoSuite, an open-source simulated robotic manipulation
benchmark for compositional multi-task reinforcement learning (RL). Each
CompoSuite task requires a particular robot arm to manipulate one individual
object to achieve a task objective while avoiding an obstacle. This
compositional definition of the tasks endows CompoSuite with two remarkable
properties. First, varying the robot/object/objective/obstacle elements leads
to hundreds of RL tasks, each of which requires a meaningfully different
behavior. Second, RL approaches can be evaluated specifically for their ability
to learn the compositional structure of the tasks. This latter capability to
functionally decompose problems would enable intelligent agents to identify and
exploit commonalities between learning tasks to handle large varieties of
highly diverse problems. We benchmark existing single-task, multi-task, and
compositional learning algorithms on various training settings, and assess
their capability to compositionally generalize to unseen tasks. Our evaluation
exposes the shortcomings of existing RL approaches with respect to
compositionality and opens new avenues for investigation.
- Abstract(参考訳): 我々は、コンポジションマルチタスク強化学習(RL)のためのオープンソースのシミュレーションロボット操作ベンチマークCompoSuiteを紹介する。
それぞれのCompoSuiteタスクは、障害物を避けながらタスク目標を達成するために、特定のロボットアームを操作する必要がある。
このタスクの構成的定義はCompoSuiteに2つの顕著な特性を与える。
まず、ロボット/オブジェクト/オブジェクト/オブジェクト/オブジェクトの要素を変えると、数百のRLタスクが発生します。
第二に、RLアプローチはタスクの構成構造を学習する能力に特化して評価することができる。
問題を機能的に分解するこの後者の能力により、知的エージェントは学習タスク間の共通性を識別し、活用し、多種多様な問題を扱うことができる。
我々は,既存のシングルタスク,マルチタスク,コンポジション学習アルゴリズムを,様々なトレーニング設定でベンチマークし,その構成的一般化能力を評価した。
本評価では,構成性に関する既存のRLアプローチの欠点を明らかにするとともに,新たな研究の道を開く。
関連論文リスト
- MmAP : Multi-modal Alignment Prompt for Cross-domain Multi-task Learning [29.88567810099265]
マルチタスク学習は複数の相関タスクを同時に訓練するように設計されている。
この課題に対処するために、デコーダフリーの視覚言語モデルCLIPを統合する。
CLIPのためのマルチモーダルアライメント・プロンプト(MmAP)を提案する。
論文 参考訳(メタデータ) (2023-12-14T03:33:02Z) - Zero-Shot Policy Transfer with Disentangled Task Representation of
Meta-Reinforcement Learning [30.633075584454275]
本研究では,タスク構成性を活用して,強化学習(RL)エージェントのゼロショットポリシーの一般化を実現することを目的とする。
提案手法は,タスクの異なる側面を明示的に符号化した,切り離されたタスク表現を持つメタRLアルゴリズムである。
政策一般化は、得られた不整合を通して、目に見えない構成的タスク表現を推測することによって行われる。
論文 参考訳(メタデータ) (2022-10-01T19:31:46Z) - Cross-task Attention Mechanism for Dense Multi-task Learning [16.040894192229043]
我々は2次元セマンティックセグメンテーションと2つの幾何学的タスク、すなわち密度深度と表面正規度推定を共同で扱う。
相関誘導型注意と自己注意によってペアワイズなクロスタスク交換を利用する,新しいマルチタスク学習アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-06-17T17:59:45Z) - Task-Agnostic Continual Reinforcement Learning: Gaining Insights and
Overcoming Challenges [27.474011433615317]
連続学習(CL)は、一連のタスクから学習するモデルやエージェントの開発を可能にする。
タスクに依存しないCLとマルチタスク(MTL)エージェントのパフォーマンス差に寄与する要因について検討する。
論文 参考訳(メタデータ) (2022-05-28T17:59:00Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Combining Modular Skills in Multitask Learning [149.8001096811708]
モジュラー設計は、ニューラルネットワークが様々な知識の面をアンタングルして再結合し、新しいタスクにより系統的に一般化することを奨励する。
この研究では、各タスクは(潜在的に小さな)インベントリから潜在的な離散スキルのサブセットと関連付けられていると仮定する。
ネットワークのモジュラー設計により、強化学習におけるサンプル効率が著しく向上し、教師あり学習における数ショットの一般化が図られる。
論文 参考訳(メタデータ) (2022-02-28T16:07:19Z) - Efficiently Identifying Task Groupings for Multi-Task Learning [55.80489920205404]
マルチタスク学習は、あるタスクによって学習された情報を活用して、他のタスクのトレーニングに役立てることができる。
マルチタスク学習モデルにおいて、どのタスクを一緒にトレーニングすべきかを選択するアプローチを提案する。
本手法は,全タスクを協調学習し,タスクの勾配が他のタスクの損失に影響を及ぼす影響を定量化する。
論文 参考訳(メタデータ) (2021-09-10T02:01:43Z) - Exploring Relational Context for Multi-Task Dense Prediction [76.86090370115]
我々は,共通バックボーンと独立タスク固有のヘッドで表される,密集予測タスクのためのマルチタスク環境を考える。
マルチタスク設定では,グローバルやローカルなど,さまざまな注意に基づくコンテキストを探索する。
タスクペアごとに利用可能なすべてのコンテキストのプールをサンプリングするAdaptive Task-Relational Contextモジュールを提案する。
論文 参考訳(メタデータ) (2021-04-28T16:45:56Z) - CausalWorld: A Robotic Manipulation Benchmark for Causal Structure and
Transfer Learning [138.40338621974954]
CausalWorldは、ロボット操作環境における因果構造と伝達学習のベンチマークである。
タスクは、ブロックのセットから3D形状を構築することで構成される。
論文 参考訳(メタデータ) (2020-10-08T23:01:13Z) - LEMMA: A Multi-view Dataset for Learning Multi-agent Multi-task
Activities [119.88381048477854]
LEMMAデータセットを導入し、細心の注意深い設定で、行方不明な次元に対処するための単一の家を提供する。
我々は、人間と物体の相互作用による原子間相互作用を密に注釈し、日常の活動の構成性、スケジューリング、割り当ての土台として提供する。
この取り組みにより、マシンビジョンコミュニティは、目標指向の人間活動を調べ、現実世界におけるタスクのスケジューリングと割り当てをさらに研究できることを期待します。
論文 参考訳(メタデータ) (2020-07-31T00:13:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。