論文の概要: Demonstration Informed Specification Search
- arxiv url: http://arxiv.org/abs/2112.10807v4
- Date: Mon, 24 Apr 2023 04:55:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-26 00:53:57.802425
- Title: Demonstration Informed Specification Search
- Title(参考訳): 実演インフォームド仕様検索
- Authors: Marcell Vazquez-Chanlatte, Ameesh Shah, Gil Lederman, Sanjit A. Seshia
- Abstract要約: 本稿では,時間的タスク仕様(例えばオートマタや時間的論理など)を専門家による実証から学習する際の問題点について考察する。
3つの特徴は, 時間的タスク仕様の学習を困難にしている。(1) 考慮中のタスクの無限個数, (2) タスクのエンコードに必要なメモリの予備的無知,(3) 離散解空間。
本稿では,最大エントロピープランナにブラックボックスアクセスを要求されるアルゴリズム群と,ラベル付き例からタスクサンプリングを行うタスク群であるDemonstration Informed Specification Search (DISS)を提案する。
- 参考スコア(独自算出の注目度): 9.03950827864517
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper considers the problem of learning temporal task specifications,
e.g. automata and temporal logic, from expert demonstrations. Task
specifications are a class of sparse memory augmented rewards with explicit
support for temporal and Boolean composition. Three features make learning
temporal task specifications difficult: (1) the (countably) infinite number of
tasks under consideration; (2) an a-priori ignorance of what memory is needed
to encode the task; and (3) the discrete solution space - typically addressed
by (brute force) enumeration. To overcome these hurdles, we propose
Demonstration Informed Specification Search (DISS): a family of algorithms
requiring only black box access to a maximum entropy planner and a task sampler
from labeled examples. DISS then works by alternating between conjecturing
labeled examples to make the provided demonstrations less surprising and
sampling tasks consistent with the conjectured labeled examples. We provide a
concrete implementation of DISS in the context of tasks described by
Deterministic Finite Automata, and show that DISS is able to efficiently
identify tasks from only one or two expert demonstrations.
- Abstract(参考訳): 本稿では,専門家による実演から時間的タスク仕様(オートマトンや時間的論理など)を学習する問題を考察する。
タスク仕様はスパースメモリの拡張報酬のクラスであり、時間とブールの構成を明確にサポートする。
3つの特徴は時間的タスク仕様の学習を困難にしている。(1) 考慮中の無限のタスク数、(2) タスクをエンコードするために必要なメモリのプリオリな無知、(3) 離散的なソリューション空間(通常は(ブルートフォース)列挙によって対処される)。
これらのハードルを克服するために,提案するDemonstration Informed Specification Search (DISS): ラベル付き例から最大エントロピープランナーとタスクサンプリング器へのブラックボックスアクセスのみを必要とするアルゴリズム群を提案する。
DISSは、ラベル付き例を推論することで、提供されたデモンストレーションの驚きを和らげ、推測されたラベル付き例と整合したタスクをサンプリングする。
本研究では,決定論的有限オートマタによって記述されたタスクの文脈におけるDISの具体的実装について述べるとともに,DESが1つないし2つの専門家によるデモンストレーションからタスクを効率的に識別できることを示す。
関連論文リスト
- Temporal2Seq: A Unified Framework for Temporal Video Understanding Tasks [26.007846170517055]
本研究では、時間的ビデオ理解タスクの出力を離散トークンのシーケンスとして定式化するために、Temporal2Seqと呼ばれる単一の統合フレームワークを提案する。
この統一されたトークン表現により、Temporal2Seqは、異なるビデオ理解タスクで単一のアーキテクチャ内でジェネラリストモデルをトレーニングすることができる。
我々はTemporal2Seqジェネリストモデルを3つのタスクの対応するテストセット上で評価し、Temporal2Seqが様々なタスクに対して合理的な結果が得られることを示した。
論文 参考訳(メタデータ) (2024-09-27T06:37:47Z) - A Minimalist Prompt for Zero-Shot Policy Learning [61.65128628634916]
トランスフォーマーに基づく手法は、推論中にターゲットドメインのデモや例解を誘導するときに、かなりの一般化能力を示す。
本稿では,タスクパラメータのみに決定変換器を条件付けすることで,実演条件と同等以上のゼロショット一般化を実現できることを示す。
我々は、ロボット制御、操作、ナビゲーションベンチマークタスクの範囲で、ゼロショットの一般化をさらに促進するために、さらに学習可能なプロンプトを導入する。
論文 参考訳(メタデータ) (2024-05-09T19:15:33Z) - Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - DemoNSF: A Multi-task Demonstration-based Generative Framework for Noisy
Slot Filling Task [22.105151515616363]
ノイズの多いスロットフィリングのためのデモベース生成フレームワークDemoNSFを提案する。
具体的には、ノイズ回復(NR)、ランダムマスク(RM)、ハイブリッド識別(HD)の3つのノイズ補助タスクを導入する。
下流のメインタスクでは、学習と推論中にタスク固有の情報と摂動分布を明示的に組み込んだ、生成フレームワークのためのノイズの多い実演構成戦略を設計する。
2つのベンチマークの実験では、DemoNSFはすべてのベースラインメソッドより優れ、強力な一般化を実現している。
論文 参考訳(メタデータ) (2023-10-16T08:16:53Z) - A Dynamic Feature Interaction Framework for Multi-task Visual Perception [100.98434079696268]
複数の共通認識課題を解決するための効率的な統合フレームワークを考案する。
これらのタスクには、インスタンスセグメンテーション、セマンティックセグメンテーション、モノクル3D検出、深さ推定が含まれる。
提案するフレームワークはD2BNetと呼ばれ,マルチタスク認識のためのパラメータ効率予測に一意なアプローチを示す。
論文 参考訳(メタデータ) (2023-06-08T09:24:46Z) - Unified Demonstration Retriever for In-Context Learning [56.06473069923567]
Unified Demonstration Retriever (textbfUDR)は、幅広いタスクのデモを検索する単一のモデルである。
我々は,高品質な候補を見つけるための反復的なマイニング戦略を備えたマルチタスクリストワイド・トレーニング・フレームワークを提案する。
13のタスクファミリーと複数のデータドメインにわたる30以上のタスクの実験は、UDRがベースラインを大幅に上回っていることを示している。
論文 参考訳(メタデータ) (2023-05-07T16:07:11Z) - On Steering Multi-Annotations per Sample for Multi-Task Learning [79.98259057711044]
マルチタスク学習の研究はコミュニティから大きな注目を集めている。
目覚ましい進歩にもかかわらず、異なるタスクを同時に学習するという課題はまだ検討されていない。
従来の研究は、異なるタスクから勾配を修正しようとするが、これらの手法はタスク間の関係の主観的な仮定を与え、修正された勾配はより正確でないかもしれない。
本稿では,タスク割り当てアプローチによってこの問題に対処する機構であるタスク割当(STA)を紹介し,各サンプルをランダムにタスクのサブセットに割り当てる。
さらなる進展のために、我々は全てのタスクを反復的に割り当てるためにInterleaved Task Allocation(ISTA)を提案する。
論文 参考訳(メタデータ) (2022-03-06T11:57:18Z) - Supervised Bayesian Specification Inference from Demonstrations [11.855400596862275]
本稿では,時間論理式としてタスク仕様を推論する確率モデルを提案する。
提案手法は,提案仕様と基礎的真理との間に90%以上の類似性を観測し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2021-07-06T21:16:37Z) - MIST: Multiple Instance Self-Training Framework for Video Anomaly
Detection [76.80153360498797]
タスク固有の識別表現を効率的に洗練するためのマルチインスタンス自己学習フレームワーク(MIST)を開発した。
mistは1)スパース連続サンプリング戦略を適用し,より信頼性の高いクリップレベル擬似ラベルを生成するマルチインスタンス擬似ラベル生成器,2)自己誘導型注意強調特徴エンコーダで構成される。
本手法は,上海技術におけるフレームレベルのAUC 94.83%の取得において,既存の教師付きおよび弱教師付き手法と同等あるいはそれ以上に機能する。
論文 参考訳(メタデータ) (2021-04-04T15:47:14Z) - Conditional Channel Gated Networks for Task-Aware Continual Learning [44.894710899300435]
畳み込みニューラルネットワークは、一連の学習問題に最適化された場合、破滅的な忘れを経験する。
本稿では,この問題に条件付き計算で対処する新しい枠組みを提案する。
提案手法を4つの連続学習データセットで検証する。
論文 参考訳(メタデータ) (2020-03-31T19:35:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。