論文の概要: OCEAN: Online Task Inference for Compositional Tasks with Context
Adaptation
- arxiv url: http://arxiv.org/abs/2008.07087v1
- Date: Mon, 17 Aug 2020 04:50:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-28 02:50:08.630252
- Title: OCEAN: Online Task Inference for Compositional Tasks with Context
Adaptation
- Title(参考訳): OCEAN: コンテキスト適応による構成タスクのオンラインタスク推論
- Authors: Hongyu Ren, Yuke Zhu, Jure Leskovec, Anima Anandkumar, Animesh Garg
- Abstract要約: 構成タスクに対するオンラインタスク推論を行うための変分推論フレームワークを提案する。
本フレームワークは,タスク構造に関する事前の知識に基づいて,柔軟な潜伏分布をサポートし,教師なしで訓練することができる。
- 参考スコア(独自算出の注目度): 150.1979017130774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Real-world tasks often exhibit a compositional structure that contains a
sequence of simpler sub-tasks. For instance, opening a door requires reaching,
grasping, rotating, and pulling the door knob. Such compositional tasks require
an agent to reason about the sub-task at hand while orchestrating global
behavior accordingly. This can be cast as an online task inference problem,
where the current task identity, represented by a context variable, is
estimated from the agent's past experiences with probabilistic inference.
Previous approaches have employed simple latent distributions, e.g., Gaussian,
to model a single context for the entire task. However, this formulation lacks
the expressiveness to capture the composition and transition of the sub-tasks.
We propose a variational inference framework OCEAN to perform online task
inference for compositional tasks. OCEAN models global and local context
variables in a joint latent space, where the global variables represent a
mixture of sub-tasks required for the task, while the local variables capture
the transitions between the sub-tasks. Our framework supports flexible latent
distributions based on prior knowledge of the task structure and can be trained
in an unsupervised manner. Experimental results show that OCEAN provides more
effective task inference with sequential context adaptation and thus leads to a
performance boost on complex, multi-stage tasks.
- Abstract(参考訳): 現実世界のタスクは、単純なサブタスクのシーケンスを含む構成構造を示すことが多い。
例えば、ドアを開けるには、手を伸ばし、つかみ、回転させ、ドアノブを引っ張る必要がある。
このような構成的タスクは、エージェントが手元のサブタスクについて推論し、それに従ってグローバルな振る舞いを編成する必要がある。
これは、現在のタスクid(コンテキスト変数で表される)がエージェントの過去の確率的推論の経験から推定されるオンラインタスク推論問題としてキャストすることができる。
以前のアプローチでは、タスク全体の単一コンテキストをモデル化するために、単純な潜在分布(例えばガウス分布)を使用していた。
しかし、この定式化はサブタスクの構成と遷移をキャプチャする表現力に欠ける。
構成タスクに対するオンラインタスク推論を行うための変分推論フレームワークOCEANを提案する。
グローバル変数はタスクに必要なサブタスクの混合を表し、ローカル変数はサブタスク間の遷移をキャプチャする。
我々のフレームワークは、タスク構造に関する事前知識に基づいて柔軟な潜在分布をサポートし、教師なしの方法でトレーニングできる。
実験結果から,OCEANは逐次的コンテキスト適応によるタスク推論により,複雑なマルチステージタスクの性能向上につながることがわかった。
関連論文リスト
- Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。
タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文 参考訳(メタデータ) (2024-11-02T05:49:14Z) - Task Indicating Transformer for Task-conditional Dense Predictions [16.92067246179703]
この課題に対処するために,タスク表示変換(TIT)と呼ばれる新しいタスク条件フレームワークを導入する。
本手法では,行列分解によるタスク指示行列を組み込んだMix Task Adapterモジュールをトランスフォーマーブロック内に設計する。
また,タスク表示ベクトルとゲーティング機構を利用するタスクゲートデコーダモジュールを提案する。
論文 参考訳(メタデータ) (2024-03-01T07:06:57Z) - TDAG: A Multi-Agent Framework based on Dynamic Task Decomposition and
Agent Generation [45.028795422801764]
動的タスク分解・エージェント生成(TDAG)に基づくマルチエージェントフレームワークを提案する。
このフレームワークは複雑なタスクを小さなサブタスクに動的に分解し、それぞれが特定の生成されたサブエージェントに割り当てる。
ItineraryBenchは、さまざまな複雑さのタスク間でのメモリ、計画、ツール使用量のエージェントの能力を評価するように設計されている。
論文 参考訳(メタデータ) (2024-02-15T18:27:37Z) - Improving Task Generalization via Unified Schema Prompt [87.31158568180514]
Unified Promptはフレキシブルでプロンプトの手法で、タスク入力スキーマに従って各タスクの学習可能なプロンプトを自動的にカスタマイズする。
異なるタスクスキーマの特徴を維持しながら、タスク間の共有知識をモデル化する。
このフレームワークは、8つのタスクタイプから下流に見えない16のタスクに対して、強力なゼロショットと少数ショットのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-05T15:26:36Z) - Fast Inference and Transfer of Compositional Task Structures for
Few-shot Task Generalization [101.72755769194677]
本稿では,タスクがサブタスクグラフによって特徴づけられる,数発の強化学習問題として定式化する。
我々のマルチタスクサブタスクグラフ推論器(MTSGI)は、トレーニングタスクから、まず、サブタスクグラフの観点から、一般的なハイレベルなタスク構造を推測する。
提案手法は,2次元グリッドワールドおよび複雑なWebナビゲーション領域において,タスクの共通基盤構造を学習し,活用し,未知のタスクへの適応を高速化する。
論文 参考訳(メタデータ) (2022-05-25T10:44:25Z) - Exploring Relational Context for Multi-Task Dense Prediction [76.86090370115]
我々は,共通バックボーンと独立タスク固有のヘッドで表される,密集予測タスクのためのマルチタスク環境を考える。
マルチタスク設定では,グローバルやローカルなど,さまざまな注意に基づくコンテキストを探索する。
タスクペアごとに利用可能なすべてのコンテキストのプールをサンプリングするAdaptive Task-Relational Contextモジュールを提案する。
論文 参考訳(メタデータ) (2021-04-28T16:45:56Z) - Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。
私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。
学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文 参考訳(メタデータ) (2020-07-01T09:38:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。