論文の概要: Supervised Bayesian Specification Inference from Demonstrations
- arxiv url: http://arxiv.org/abs/2107.02912v1
- Date: Tue, 6 Jul 2021 21:16:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-08 14:11:48.414037
- Title: Supervised Bayesian Specification Inference from Demonstrations
- Title(参考訳): デモによるベイズ仕様の教師付き推論
- Authors: Ankit Shah, Pritish Kamath, Shen Li, Patrick Craven, Kevin Landers,
Kevin Oden, Julie Shah
- Abstract要約: 本稿では,時間論理式としてタスク仕様を推論する確率モデルを提案する。
提案手法は,提案仕様と基礎的真理との間に90%以上の類似性を観測し,提案手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 11.855400596862275
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When observing task demonstrations, human apprentices are able to identify
whether a given task is executed correctly long before they gain expertise in
actually performing that task. Prior research into learning from demonstrations
(LfD) has failed to capture this notion of the acceptability of a task's
execution; meanwhile, temporal logics provide a flexible language for
expressing task specifications. Inspired by this, we present Bayesian
specification inference, a probabilistic model for inferring task specification
as a temporal logic formula. We incorporate methods from probabilistic
programming to define our priors, along with a domain-independent likelihood
function to enable sampling-based inference. We demonstrate the efficacy of our
model for inferring specifications, with over 90% similarity observed between
the inferred specification and the ground truth, both within a synthetic domain
and during a real-world table setting task.
- Abstract(参考訳): タスクのデモンストレーションを観察する際、人間の見習いは、そのタスクを実際に実行する専門知識を得る前に、与えられたタスクが正しく実行されるかどうかを特定できる。
実証から学ぶこと(LfD)に関する以前の研究は、タスクの実行の受け入れ可能性というこの概念を捉えられなかったが、一方で時間論理はタスク仕様を表現するための柔軟な言語を提供する。
そこで本研究では,タスク仕様を時相論理式として推定する確率モデルであるベイズ仕様推論を提案する。
我々は,確率的プログラミングの手法を事前定義に取り入れ,サンプリングに基づく推論を可能にするために,ドメインに依存しない確率関数を組み込んだ。
提案手法は,合成領域内と実世界のテーブル設定タスク中の両方において,推論された仕様と基礎的真理との間に90%以上の類似性が観察された仕様を推定するためのモデルの有効性を示す。
関連論文リスト
- Reasoning or Reciting? Exploring the Capabilities and Limitations of Language Models Through Counterfactual Tasks [71.19560970717495]
最近の言語モデルは、幅広いタスクで印象的なパフォーマンスを示している。
これらのスキルは一般的で、移行可能か、あるいは事前トレーニング中に見られる特定のタスクに特化していますか?
本稿では,標準タスクの既定前提から逸脱する「数値的」タスク変種に基づく評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-05T17:50:42Z) - Breakpoint Transformers for Modeling and Tracking Intermediate Beliefs [37.754787051387034]
本稿では,ブレークポイントモデリングと呼ばれる表現学習フレームワークを提案する。
私たちのアプローチは、中間表現を構築するために、効率的でエンドツーエンドの方法でモデルをトレーニングします。
我々は,従来の表現学習手法よりも,T5に基づく主要なブレークポイント変換器の利点を示す。
論文 参考訳(メタデータ) (2022-11-15T07:28:14Z) - Demonstration Informed Specification Search [9.03950827864517]
本稿では,時間的タスク仕様(例えばオートマタや時間的論理など)を専門家による実証から学習する際の問題点について考察する。
3つの特徴は, 時間的タスク仕様の学習を困難にしている。(1) 考慮中のタスクの無限個数, (2) タスクのエンコードに必要なメモリの予備的無知,(3) 離散解空間。
本稿では,最大エントロピープランナにブラックボックスアクセスを要求されるアルゴリズム群と,ラベル付き例からタスクサンプリングを行うタスク群であるDemonstration Informed Specification Search (DISS)を提案する。
論文 参考訳(メタデータ) (2021-12-20T19:08:25Z) - PROMPT WAYWARDNESS: The Curious Case of Discretized Interpretation of
Continuous Prompts [99.03864962014431]
目標タスクの微調整連続プロンプトは、フルモデルの微調整に代わるコンパクトな代替品として登場した。
実際には、連続的なプロンプトによって解決されたタスクと、最も近い隣人との間の「方向」の挙動を観察する。
論文 参考訳(メタデータ) (2021-12-15T18:55:05Z) - Probing as Quantifying the Inductive Bias of Pre-trained Representations [99.93552997506438]
本稿では,特定のタスクに対する表現の帰納的バイアスを評価することを目的とした,探索のための新しいフレームワークを提案する。
トークン、アーク、文レベルの一連のタスクに我々のフレームワークを適用します。
論文 参考訳(メタデータ) (2021-10-15T22:01:16Z) - Multi-Agent Reinforcement Learning with Temporal Logic Specifications [65.79056365594654]
本研究では,時間論理仕様を満たすための学習課題を,未知の環境下でエージェントのグループで検討する。
我々は、時間論理仕様のための最初のマルチエージェント強化学習手法を開発した。
主アルゴリズムの正確性と収束性を保証する。
論文 参考訳(メタデータ) (2021-02-01T01:13:03Z) - OCEAN: Online Task Inference for Compositional Tasks with Context
Adaptation [150.1979017130774]
構成タスクに対するオンラインタスク推論を行うための変分推論フレームワークを提案する。
本フレームワークは,タスク構造に関する事前の知識に基づいて,柔軟な潜伏分布をサポートし,教師なしで訓練することができる。
論文 参考訳(メタデータ) (2020-08-17T04:50:34Z) - Counterfactual Detection meets Transfer Learning [48.82717416666232]
既存のモデルアーキテクチャに最小限の適応で実装可能な,単純なバイナリ分類タスクであることを示す。
本稿では,先行者や後続者をエンティティ認識タスクとして処理するエンド・ツー・エンドパイプラインを導入し,それらをトークン分類に適用する。
論文 参考訳(メタデータ) (2020-05-27T02:02:57Z) - Probing the Probing Paradigm: Does Probing Accuracy Entail Task
Relevance? [27.64235687067883]
モデルが訓練されたタスクに必要のないモデルでも,言語特性の符号化を学習できることが示される。
ランダムノイズとしてデータに分散しても,これらの特性を確率レベルよりかなり上まで符号化できることを示す。
論文 参考訳(メタデータ) (2020-05-02T06:19:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。