論文の概要: Adaptive Teaching of Temporal Logic Formulas to Learners with
Preferences
- arxiv url: http://arxiv.org/abs/2001.09956v1
- Date: Mon, 27 Jan 2020 18:22:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-06 08:17:20.993736
- Title: Adaptive Teaching of Temporal Logic Formulas to Learners with
Preferences
- Title(参考訳): 選好学習者に対する時間論理式の適応的指導
- Authors: Zhe Xu, Yuxin Chen and Ufuk Topcu
- Abstract要約: 時間論理式に対する機械教育について検討する。
ミオピック溶液の徹底的な探索には指数的時間を要する。
パラメトリック線形時間論理式を効率よく教える手法を提案する。
- 参考スコア(独自算出の注目度): 44.63937003271641
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine teaching is an algorithmic framework for teaching a target hypothesis
via a sequence of examples or demonstrations. We investigate machine teaching
for temporal logic formulas -- a novel and expressive hypothesis class amenable
to time-related task specifications. In the context of teaching temporal logic
formulas, an exhaustive search even for a myopic solution takes exponential
time (with respect to the time span of the task). We propose an efficient
approach for teaching parametric linear temporal logic formulas. Concretely, we
derive a necessary condition for the minimal time length of a demonstration to
eliminate a set of hypotheses. Utilizing this condition, we propose a myopic
teaching algorithm by solving a sequence of integer programming problems. We
further show that, under two notions of teaching complexity, the proposed
algorithm has near-optimal performance. The results strictly generalize the
previous results on teaching preference-based version space learners. We
evaluate our algorithm extensively under a variety of learner types (i.e.,
learners with different preference models) and interactive protocols (e.g.,
batched and adaptive). The results show that the proposed algorithms can
efficiently teach a given target temporal logic formula under various settings,
and that there are significant gains of teaching efficacy when the teacher
adapts to the learner's current hypotheses or uses oracles.
- Abstract(参考訳): 機械教育(英: Machine teaching)は、一連の例や実演を通して対象仮説を教えるアルゴリズムフレームワークである。
時間関連タスク仕様に対応可能な新しい表現型仮説クラスである時間論理式に対する機械教育について検討する。
時相論理式を教える文脈において、ミオピック解に対する排他的探索は(タスクの時間スパンに関して)指数関数的な時間を要する。
パラメトリック線形時間論理式を効率的に教える手法を提案する。
具体的には、仮説の集合を排除するために、デモの最小時間長に必要な条件を導出する。
この条件を利用して,整数計画問題の系列を解き明快な指導アルゴリズムを提案する。
さらに,2つの概念により,提案アルゴリズムがほぼ最適性能を持つことを示す。
その結果, 好みに基づくバージョン空間学習者に対して, 前回の結果を厳密に一般化した。
アルゴリズムを様々な学習者タイプ(例えば、異なる選好モデルを持つ学習者)と対話型プロトコル(例えば、バッチ型および適応型)で広範囲に評価した。
その結果,提案アルゴリズムは,学習者の現在の仮説に適応した場合や,オラクルを用いた場合の教育効果が著しく向上することが示唆された。
関連論文リスト
- Manipulating Predictions over Discrete Inputs in Machine Teaching [43.914943603238996]
本稿では,個別領域における機械教育,特に教師の目標に基づいて学生モデルの予測を効率的に学習データを変更することに焦点を当てた。
本稿では,この課題を最適化問題として定式化し,反復探索アルゴリズムを提案する。
本アルゴリズムは,教師が生徒のモデルを改善するために誤予測を修正しようとする場合や,特定のサンプルを対象のクラスに不正に分類するために悪質な操作を行う場合において,有意義な数値的メリットを示す。
論文 参考訳(メタデータ) (2024-01-31T14:23:51Z) - Understanding Self-Predictive Learning for Reinforcement Learning [61.62067048348786]
強化学習のための自己予測学習の学習ダイナミクスについて検討する。
本稿では,2つの表現を同時に学習する新しい自己予測アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-06T20:43:37Z) - TEMPERA: Test-Time Prompting via Reinforcement Learning [57.48657629588436]
強化学習(TEMPERA)を用いたテスト時間プロンプト編集を提案する。
従来のプロンプト生成手法とは対照的に、TEMPERAは事前知識を効率的に活用することができる。
本手法は従来の微調整法と比較して試料効率の平均改善率を5.33倍に向上させる。
論文 参考訳(メタデータ) (2022-11-21T22:38:20Z) - Learning Interpretable Temporal Properties from Positive Examples Only [27.929058359327186]
我々は,人間の解釈可能なモデルを用いて,ブラックボックスシステムの時間的挙動を説明する問題を考察する。
我々は決定論的有限オートマトン(DFAs)と線形時間論理(LTL)の基本的な解釈可能なモデルに依存している。
私たちのモチベーションは、特にブラックボックスシステムから否定的な例を観察することは一般的に困難であるということです。
論文 参考訳(メタデータ) (2022-09-06T17:04:09Z) - Efficient Sub-structured Knowledge Distillation [52.5931565465661]
定式化においてよりシンプルで,既存のアプローチよりもはるかに効率的にトレーニングできるアプローチを提案する。
教師モデルから学生モデルへの知識の伝達は、出力空間全体ではなく、すべてのサブ構造上の予測を局所的に一致させることで行う。
論文 参考訳(メタデータ) (2022-03-09T15:56:49Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Teaching an Active Learner with Contrastive Examples [35.926575235046634]
本研究では,学習者が補助的な教師によって支援される追加のツイストを用いて,能動的学習の課題について検討する。
比較例を適応的に選択する効率的な学習アルゴリズムについて検討する。
2つの問題依存パラメータに基づいてアルゴリズムの性能保証を行う。
論文 参考訳(メタデータ) (2021-10-28T05:00:55Z) - Towards Optimally Efficient Tree Search with Deep Learning [76.64632985696237]
本稿では,線形モデルから信号整数を推定する古典整数最小二乗問題について検討する。
問題はNPハードであり、信号処理、バイオインフォマティクス、通信、機械学習といった様々な応用でしばしば発生する。
本稿では, 深いニューラルネットワークを用いて, 単純化されたメモリバウンドA*アルゴリズムの最適推定を推定し, HATSアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-01-07T08:00:02Z) - Learning to Actively Learn: A Robust Approach [22.75298609290053]
本研究では,アクティブラーニングや純粋探索型マルチアームバンディットといった適応データ収集タスクのアルゴリズム設計手法を提案する。
我々の適応アルゴリズムは、情報理論の下界から導かれる問題の同値クラスに対する逆学習によって学習される。
我々は,訓練手順の安定性と有効性を正当化するための合成実験を行い,実データから導出される課題について評価する。
論文 参考訳(メタデータ) (2020-10-29T06:48:22Z) - Learning Interpretable Models in the Property Specification Language [6.875312133832079]
IEEE標準時相論理PSLにおける公式の学習アルゴリズムを開発した。
私たちの研究は、n番目の点ごとに起こる事象のような多くの自然の性質が、言葉で表現できないという事実に動機づけられている。
論文 参考訳(メタデータ) (2020-02-10T11:42:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。