論文の概要: Language-guided Task Adaptation for Imitation Learning
- arxiv url: http://arxiv.org/abs/2301.09770v1
- Date: Tue, 24 Jan 2023 00:56:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 14:39:24.784508
- Title: Language-guided Task Adaptation for Imitation Learning
- Title(参考訳): 模倣学習のための言語誘導タスク適応
- Authors: Prasoon Goyal, Raymond J. Mooney, Scott Niekum
- Abstract要約: 本稿では,自然言語でコミュニケーションするタスク間の差異を指標として,関連するタスクのデモンストレーションからタスクを学習する,新たな設定を提案する。
提案した設定では、低労力の言語記述を提供することで、他のタスクからのデモを再利用することができ、エージェントエラーの修正にフィードバックを提供することもできる。
- 参考スコア(独自算出の注目度): 40.1007184209417
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a novel setting, wherein an agent needs to learn a task from a
demonstration of a related task with the difference between the tasks
communicated in natural language. The proposed setting allows reusing
demonstrations from other tasks, by providing low effort language descriptions,
and can also be used to provide feedback to correct agent errors, which are
both important desiderata for building intelligent agents that assist humans in
daily tasks. To enable progress in this proposed setting, we create two
benchmarks -- Room Rearrangement and Room Navigation -- that cover a diverse
set of task adaptations. Further, we propose a framework that uses a
transformer-based model to reason about the entities in the tasks and their
relationships, to learn a policy for the target task
- Abstract(参考訳): 本稿では,自然言語でコミュニケーションするタスク間の差異を指標として,関連するタスクのデモンストレーションからタスクを学習する,新たな設定を提案する。
提案された設定では、少ない労力の言語記述を提供することで、他のタスクからのデモンストレーションを再利用することが可能であり、エージェントエラーを修正するためのフィードバックを提供するためにも使用できる。
この提案された設定の進捗を可能にするために、さまざまなタスク適応をカバーする2つのベンチマーク、Room RearrangementとRoom Navigationを作成します。
さらに、タスクのエンティティとその関係を推論するためにトランスフォーマティブベースのモデルを用いて、対象タスクのポリシーを学ぶフレームワークを提案する。
関連論文リスト
- Leverage Task Context for Object Affordance Ranking [57.59106517732223]
25の共通タスク、50k以上の画像、661k以上のオブジェクトからなる、最初の大規模タスク指向のアベイランスランキングデータセットを構築しました。
その結果,タスクコンテキストに基づくアベイランス学習のパラダイムの実現可能性と,サリエンシランキングやマルチモーダルオブジェクト検出の分野における最先端モデルよりも,我々のモデルの方が優れていることが示された。
論文 参考訳(メタデータ) (2024-11-25T04:22:33Z) - UniverSLU: Universal Spoken Language Understanding for Diverse Tasks with Natural Language Instructions [64.50935101415776]
我々は,様々な音声言語理解(SLU)タスクを共同で行う単一モデルを構築した。
我々は17のデータセットと9の言語にまたがる12の音声分類とシーケンス生成タスクタイプに対して,1つのマルチタスク学習モデル"UniverSLU"の有効性を実証した。
論文 参考訳(メタデータ) (2023-10-04T17:10:23Z) - Learning Task Embeddings for Teamwork Adaptation in Multi-Agent
Reinforcement Learning [13.468555224407764]
エージェントのチームは,タスク埋め込みを備えた場合,新しいタスクに適応できることを示す。
我々は、独立MATE、集中MATE、混合MATEの3つのMATE訓練パラダイムを提案する。
MATEが学習した埋め込みはタスクを識別し、新しいタスクへの適応中にエージェントが活用する有用な情報を提供する。
論文 参考訳(メタデータ) (2022-07-05T18:23:20Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - One-Shot Learning from a Demonstration with Hierarchical Latent Language [43.140223608960554]
DescribeWorldは、接地エージェントにおけるこのような一般化スキルをテストするために設計された環境である。
エージェントはMinecraftのようなグリッドワールドでひとつのタスクのデモを観察し、その後、新しいマップで同じタスクを実行するように要求される。
テキストベースの推論を行うエージェントは,タスクをランダムに分割した状態での課題に対して,より適していることがわかった。
論文 参考訳(メタデータ) (2022-03-09T15:36:43Z) - Multi-Agent Policy Transfer via Task Relationship Modeling [28.421365805638953]
我々は、タスク間の共通構造を発見し、活用し、より効率的な転送を試みる。
本稿では,タスクの共通空間として効果に基づくタスク表現を学習する。
その結果,提案手法は,学習した協調知識をいくつかのソースタスクの学習後に新しいタスクに伝達するのに役立つ。
論文 参考訳(メタデータ) (2022-03-09T01:49:21Z) - Learning to Follow Language Instructions with Compositional Policies [22.778677208048475]
本稿では,目標達成タスクからなる環境下で自然言語命令を実行することを学習するフレームワークを提案する。
我々は強化学習エージェントを訓練し、その後ブール代数を通して構成できる値関数を学習する。
我々は、Webスケールコーパスで事前訓練されたSeq2seqモデルを微調整し、言語を論理式にマッピングする。
論文 参考訳(メタデータ) (2021-10-09T21:28:26Z) - Zero-shot Task Adaptation using Natural Language [43.807555235240365]
本稿では,エージェントにデモンストレーションと説明の両方を付与する,新しい環境を提案する。
テンプレートベースの記述を使用すれば,目標タスクの95%以上を達成できる。
論文 参考訳(メタデータ) (2021-06-05T21:39:04Z) - Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。
私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。
学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文 参考訳(メタデータ) (2020-07-01T09:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。