論文の概要: Visual Goal-Directed Meta-Learning with Contextual Planning Networks
- arxiv url: http://arxiv.org/abs/2111.09908v1
- Date: Thu, 18 Nov 2021 19:11:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-11-23 04:54:24.287571
- Title: Visual Goal-Directed Meta-Learning with Contextual Planning Networks
- Title(参考訳): コンテキスト計画ネットワークを用いた視覚目標指向メタラーニング
- Authors: Corban G. Rivera, David A Handelman
- Abstract要約: 最初の試みで、新しい目標とタスクを一般化するために、文脈計画ネットワーク(CPN)を導入します。
我々は、ゼロショットゴール指向メタ学習に適応した他のいくつかのアプローチとともにCPNを評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The goal of meta-learning is to generalize to new tasks and goals as quickly
as possible. Ideally, we would like approaches that generalize to new goals and
tasks on the first attempt. Toward that end, we introduce contextual planning
networks (CPN). Tasks are represented as goal images and used to condition the
approach. We evaluate CPN along with several other approaches adapted for
zero-shot goal-directed meta-learning. We evaluate these approaches across 24
distinct manipulation tasks using Metaworld benchmark tasks. We found that CPN
outperformed several approaches and baselines on one task and was competitive
with existing approaches on others. We demonstrate the approach on a physical
platform on Jenga tasks using a Kinova Jaco robotic arm.
- Abstract(参考訳): メタラーニングの目標は、新しいタスクと目標をできるだけ早く一般化することである。
理想的には、最初の試みで新しい目標とタスクに一般化したアプローチを望みます。
そこで我々は,文脈計画ネットワーク(CPN)を導入する。
タスクはゴールイメージとして表現され、アプローチの条件付けに使用される。
ゼロショット目標指向メタラーニングに適応した他の手法とともにcpnを評価した。
メタワールドベンチマークタスクを用いて、24個の異なる操作タスクにまたがるこれらのアプローチを評価する。
CPNは、あるタスクにおけるいくつかのアプローチやベースラインよりも優れており、他のタスクに対する既存のアプローチと競合していることがわかった。
我々は,Kinova Jacoロボットアームを用いたJengaタスクの物理プラットフォームへのアプローチを示す。
関連論文リスト
- Planning to Practice: Efficient Online Fine-Tuning by Composing Goals in
Latent Space [76.46113138484947]
汎用ロボットは、現実世界の非構造環境において困難なタスクを完了するために、多様な行動レパートリーを必要とする。
この問題に対処するため、目標条件強化学習は、コマンド上の幅広いタスクの目標に到達可能なポリシーを取得することを目的としている。
本研究では,長期的課題に対する目標条件付き政策を実践的に訓練する手法であるPlanning to Practiceを提案する。
論文 参考訳(メタデータ) (2022-05-17T06:58:17Z) - C-Planning: An Automatic Curriculum for Learning Goal-Reaching Tasks [133.40619754674066]
ゴール条件強化学習は、ナビゲーションや操作を含む幅広い領域のタスクを解決できる。
本研究では,学習時間における探索を用いて,中間状態を自動生成する遠隔目標獲得タスクを提案する。
E-stepはグラフ検索を用いて最適な経路点列を計画することに対応し、M-stepはそれらの経路点に到達するための目標条件付きポリシーを学習することを目的としている。
論文 参考訳(メタデータ) (2021-10-22T22:05:31Z) - Meta-Learning with Fewer Tasks through Task Interpolation [67.03769747726666]
現在のメタ学習アルゴリズムは多数のメタトレーニングタスクを必要としており、実際のシナリオではアクセスできない可能性がある。
タスクグラデーションを用いたメタラーニング(MLTI)により,タスクのペアをランダムにサンプリングし,対応する特徴やラベルを補間することにより,タスクを効果的に生成する。
実証的な実験では,提案する汎用MLTIフレームワークが代表的なメタ学習アルゴリズムと互換性があり,他の最先端戦略を一貫して上回っていることがわかった。
論文 参考訳(メタデータ) (2021-06-04T20:15:34Z) - Hierarchical and Partially Observable Goal-driven Policy Learning with
Goals Relational Graph [21.260858893505183]
目標グラフ(GRG)を用いた新しい2層階層学習手法を提案する。
我々のGRGはディリクレカテゴリーのプロセスを通じて、ゴール空間におけるすべてのゴールの根底にある関係を捉えます。
実験の結果,我々のアプローチは未発見の環境と新しい目標の両方において優れた一般化を示すことがわかった。
論文 参考訳(メタデータ) (2021-03-01T23:21:46Z) - Lessons from Chasing Few-Shot Learning Benchmarks: Rethinking the
Evaluation of Meta-Learning Methods [9.821362920940631]
メタラーニングのための簡単なベースライン、FIX-MLを紹介します。
メタラーニングの2つの可能性を探る:(i)トレーニングセット(in-distriion)を生成する同じタスク分布に一般化する手法を開発する、(ii)新しい未確認タスク分布(out-of-distriion)に一般化する手法を開発する。
本研究は,この領域の進歩を推論するためには,メタラーニングの目標を明確に説明し,より適切な評価戦略を開発する必要があることを強調した。
論文 参考訳(メタデータ) (2021-02-23T05:34:30Z) - Automatic Curriculum Learning through Value Disagreement [95.19299356298876]
新しい未解決タスクを継続的に解決することが、多様な行動を学ぶための鍵です。
エージェントが複数の目標を達成する必要があるマルチタスク領域では、トレーニング目標の選択はサンプル効率に大きな影響を与える可能性がある。
そこで我々は,エージェントが解決すべき目標のための自動カリキュラムを作成することを提案する。
提案手法は,13のマルチゴールロボットタスクと5つのナビゲーションタスクにまたがって評価し,現在の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2020-06-17T03:58:25Z) - Meta-Baseline: Exploring Simple Meta-Learning for Few-Shot Learning [79.25478727351604]
評価基準に基づいて,分類済みモデル全体に対するメタラーニング(メタラーニング)を提案する。
我々は,この単純な手法が標準ベンチマークにおける最先端手法との競合性能を達成するのを観察する。
論文 参考訳(メタデータ) (2020-03-09T20:06:36Z) - Incremental Meta-Learning via Indirect Discriminant Alignment [118.61152684795178]
メタ学習のメタ学習段階において,段階的な学習の概念を発達させる。
我々のアプローチは、完全なメタトレーニングセットでモデルをトレーニングするのと比べて、テスト時に好適に機能する。
論文 参考訳(メタデータ) (2020-02-11T01:39:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。