論文の概要: Language-Informed Transfer Learning for Embodied Household Activities
- arxiv url: http://arxiv.org/abs/2301.05318v1
- Date: Thu, 12 Jan 2023 22:08:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-16 14:16:01.791054
- Title: Language-Informed Transfer Learning for Embodied Household Activities
- Title(参考訳): 家庭内活動のための言語情報伝達学習
- Authors: Yuqian Jiang, Qiaozi Gao, Govind Thattai, Gaurav Sukhatme
- Abstract要約: ホームロボットは、同様のタスクのために訓練された価値とポリシーネットワークを転送することで、メリットを享受できることが示される。
タスクの状態空間間のマッピングを容易にするため、テキストベースの表現を提供し、言語モデルを活用する。
その結果, 目的タスクと状態と目標記述のセマンティックな類似性によって, 類似した活動を選択することができることがわかった。
- 参考スコア(独自算出の注目度): 7.369520570974015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: For service robots to become general-purpose in everyday household
environments, they need not only a large library of primitive skills, but also
the ability to quickly learn novel tasks specified by users. Fine-tuning neural
networks on a variety of downstream tasks has been successful in many vision
and language domains, but research is still limited on transfer learning
between diverse long-horizon tasks. We propose that, compared to reinforcement
learning for a new household activity from scratch, home robots can benefit
from transferring the value and policy networks trained for similar tasks. We
evaluate this idea in the BEHAVIOR simulation benchmark which includes a large
number of household activities and a set of action primitives. For easy mapping
between state spaces of different tasks, we provide a text-based representation
and leverage language models to produce a common embedding space. The results
show that the selection of similar source activities can be informed by the
semantic similarity of state and goal descriptions with the target task. We
further analyze the results and discuss ways to overcome the problem of
catastrophic forgetting.
- Abstract(参考訳): サービスロボットが日常の家庭環境において汎用化するためには、プリミティブなスキルの大きなライブラリだけでなく、ユーザが指定した新しいタスクを素早く学習する能力も必要である。
様々な下流タスクの微調整ニューラルネットワークは多くのビジョンや言語領域で成功したが、多種多様な長距離タスク間の伝達学習についての研究は依然として限られている。
家庭内ロボットは, ゼロから新しい家庭活動の強化学習に比べて, 同様の作業で訓練された価値と政策ネットワークの伝達の恩恵を受けることができる。
このアイデアを行動シミュレーションベンチマーク(behavior simulation benchmark)で評価し、多数の家庭活動と一連のアクションプリミティブを含む。
異なるタスクの状態空間を簡単にマッピングするために、テキストベースの表現を提供し、言語モデルを利用して共通の埋め込み空間を作ります。
その結果,目標タスクと状態および目標記述の意味的類似性によって,類似したソースアクティビティの選択を知らせることができた。
さらに,結果を分析し,破滅的な忘れを克服する方法について議論する。
関連論文リスト
- GRILL: Grounded Vision-language Pre-training via Aligning Text and Image
Regions [92.96783800362886]
未知のタスクへの一般化は、少数の学習者が多様なタスクにおいてより優れたゼロ/フェーショットのパフォーマンスを達成できる重要な能力である。
GRILLは視覚的質問応答やキャプション,接地タスクなどの多様なタスクに,ほとんど,あるいはごく少数のトレーニングインスタンスで一般化可能な,新しいVLモデルである。
論文 参考訳(メタデータ) (2023-05-24T03:33:21Z) - Task-Attentive Transformer Architecture for Continual Learning of
Vision-and-Language Tasks Using Knowledge Distillation [18.345183818638475]
連続学習(CL)は、逐次到着するタスク間で知識伝達を可能にすることで、治療の役割を果たす。
バイモーダル・ビジョン・アンド・ランゲージ・タスクを学習するためのトランスフォーマーベースのCLアーキテクチャを開発した。
私たちのアプローチは、メモリと時間のオーバーヘッドが少ないため、多数のタスクにスケーラブルに学習するものです。
論文 参考訳(メタデータ) (2023-03-25T10:16:53Z) - Self-Supervised Graph Neural Network for Multi-Source Domain Adaptation [51.21190751266442]
ドメイン適応(DA)は、テストデータがトレーニングデータの同じ分布に完全に従わない場合に、シナリオに取り組む。
大規模未ラベルサンプルから学習することで、自己教師型学習がディープラーニングの新しいトレンドとなっている。
我々は,より効果的なタスク間情報交換と知識共有を実現するために,新しい textbfSelf-textbf Supervised textbfGraph Neural Network (SSG) を提案する。
論文 参考訳(メタデータ) (2022-04-08T03:37:56Z) - Learning Sensorimotor Primitives of Sequential Manipulation Tasks from
Visual Demonstrations [13.864448233719598]
本稿では,低レベルポリシーと高レベルポリシーを同時に学習するニューラルネットワークベースの新しいフレームワークについて述べる。
提案手法の重要な特徴は、これらのポリシーがタスクデモの生のビデオから直接学習されることである。
ロボットアームを用いた物体操作タスクの実証実験の結果,提案するネットワークは実際の視覚的な実演から効率よく学習し,タスクを実行することができることがわかった。
論文 参考訳(メタデータ) (2022-03-08T01:36:48Z) - CALVIN: A Benchmark for Language-conditioned Policy Learning for
Long-horizon Robot Manipulation Tasks [30.936692970187416]
汎用ロボットは、人間の言語を認識や行動に関連付けることを学ばなければならない。
CALVIN(CALVIN)は、長期の言語条件のタスクを学習するためのオープンソースのシミュレーションベンチマークである。
論文 参考訳(メタデータ) (2021-12-06T18:37:33Z) - Multi-Task Neural Processes [105.22406384964144]
我々はマルチタスク学習のためのニューラル・プロセスの新たな変種であるマルチタスク・ニューラル・プロセスを開発する。
特に,各タスク改善のための帰納的バイアスを提供するために,関数空間内の関連するタスクから伝達可能な知識を探索することを提案する。
その結果、マルチタスク学習におけるタスク間の有用な知識の伝達におけるマルチタスクニューラルプロセスの有効性が示された。
論文 参考訳(メタデータ) (2021-11-10T17:27:46Z) - Learning Language-Conditioned Robot Behavior from Offline Data and
Crowd-Sourced Annotation [80.29069988090912]
本研究では,ロボットインタラクションの大規模なオフラインデータセットから視覚に基づく操作タスクを学習する問題について検討する。
クラウドソースの自然言語ラベルを用いたオフラインロボットデータセットの活用を提案する。
提案手法は目標画像仕様と言語条件付き模倣技術の両方を25%以上上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-02T17:42:13Z) - COG: Connecting New Skills to Past Experience with Offline Reinforcement
Learning [78.13740204156858]
我々は、動的プログラミングによって新しいスキルを拡張するために、事前データを再利用できることを示します。
我々は、新しいタスクを解決するために、以前のデータセットに見られるいくつかの動作をチェーンすることで、アプローチの有効性を実証する。
我々は、高次元画像観察を低レベルのロボット制御コマンドにマッピングし、エンドツーエンドでポリシーを訓練する。
論文 参考訳(メタデータ) (2020-10-27T17:57:29Z) - Concept Learners for Few-Shot Learning [76.08585517480807]
本研究では,人間の解釈可能な概念次元に沿って学習することで,一般化能力を向上させるメタ学習手法であるCOMETを提案する。
我々は,細粒度画像分類,文書分類,セルタイプアノテーションなど,さまざまな領域からの少数ショットタスクによるモデルの評価を行った。
論文 参考訳(メタデータ) (2020-07-14T22:04:17Z) - Pre-trained Word Embeddings for Goal-conditional Transfer Learning in
Reinforcement Learning [0.0]
本稿では,事前訓練されたタスク非依存言語モデルによって,目標条件付きRLエージェントをより効率的にする方法について述べる。
私たちは、異なる関連するタスク間の伝達学習を容易にすることで、これを実現します。
論文 参考訳(メタデータ) (2020-07-10T06:42:00Z) - Transforming task representations to perform novel tasks [12.008469282323492]
知性の重要な側面は、直接の経験(ゼロショット)なしで新しいタスクに適応できる能力である。
本稿では,従来のタスクとの関係に基づいて,新しいタスクに適応するための一般的な計算フレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-08T23:41:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。