論文の概要: Teaching an Active Learner with Contrastive Examples
- arxiv url: http://arxiv.org/abs/2110.14888v2
- Date: Fri, 29 Oct 2021 06:09:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-01 11:42:00.911410
- Title: Teaching an Active Learner with Contrastive Examples
- Title(参考訳): コントラスト的事例によるアクティブラーニングの指導
- Authors: Chaoqi Wang, Adish Singla, Yuxin Chen
- Abstract要約: 本研究では,学習者が補助的な教師によって支援される追加のツイストを用いて,能動的学習の課題について検討する。
比較例を適応的に選択する効率的な学習アルゴリズムについて検討する。
2つの問題依存パラメータに基づいてアルゴリズムの性能保証を行う。
- 参考スコア(独自算出の注目度): 35.926575235046634
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the problem of active learning with the added twist that the learner
is assisted by a helpful teacher. We consider the following natural interaction
protocol: At each round, the learner proposes a query asking for the label of
an instance $x^q$, the teacher provides the requested label $\{x^q, y^q\}$
along with explanatory information to guide the learning process. In this
paper, we view this information in the form of an additional contrastive
example ($\{x^c, y^c\}$) where $x^c$ is picked from a set constrained by $x^q$
(e.g., dissimilar instances with the same label). Our focus is to design a
teaching algorithm that can provide an informative sequence of contrastive
examples to the learner to speed up the learning process. We show that this
leads to a challenging sequence optimization problem where the algorithm's
choices at a given round depend on the history of interactions. We investigate
an efficient teaching algorithm that adaptively picks these contrastive
examples. We derive strong performance guarantees for our algorithm based on
two problem-dependent parameters and further show that for specific types of
active learners (e.g., a generalized binary search learner), the proposed
teaching algorithm exhibits strong approximation guarantees. Finally, we
illustrate our bounds and demonstrate the effectiveness of our teaching
framework via two numerical case studies.
- Abstract(参考訳): 本研究では,学習者が補助的な教師によって支援される追加のツイストを用いて,能動的学習の問題を研究する。
各ラウンドにおいて、学習者は、インスタンス $x^q$ のラベルを求めるクエリを提案し、教師は、学習プロセスを導くための説明情報と共に、要求されたラベル $\{x^q, y^q\}$ を提供する。
本稿では、この情報を追加のコントラスト例($x^c, y^c\}$)の形で見るので、$x^c$は、$x^q$で制約された集合から選択される(例えば、同じラベルを持つ異種インスタンス)。
私たちの焦点は、学習者にコントラストのある例のインフォメーションシーケンスを提供し、学習プロセスを高速化する教示アルゴリズムを設計することです。
このことは、与えられたラウンドにおけるアルゴリズムの選択が相互作用の歴史に依存するような、困難なシーケンス最適化問題につながることを示す。
本稿では,これらの比較例を適応的に選択する効率的な学習アルゴリズムについて検討する。
提案アルゴリズムは,2つの問題依存パラメータに基づいて高い性能保証を導出し,さらに,特定のタイプの能動学習者(例えば,一般化二分探索学習者)に対して,強い近似保証を示す。
最後に, 2つの数値ケーススタディを通して, 限界を説明し, 指導枠組みの有効性を示す。
関連論文リスト
- Probably Approximately Precision and Recall Learning [62.912015491907994]
精度とリコールは機械学習の基本的な指標である。
一方的なフィードバック – トレーニング中にのみ肯定的な例が観察される – は,多くの実践的な問題に固有のものだ。
PAC学習フレームワークでは,各仮説をグラフで表現し,エッジは肯定的な相互作用を示す。
論文 参考訳(メタデータ) (2024-11-20T04:21:07Z) - $Se^2$: Sequential Example Selection for In-Context Learning [83.17038582333716]
インコンテキスト学習(ICL)のための大規模言語モデル(LLM)は、実演例によって起動する必要がある。
以前の研究は、主に"select then organize"パラダイムに従って、ICLの例の選択を幅広く検討してきた。
本稿では,この問題を$Se$quential $Se$lection問題として定式化し,シーケンシャル・アウェア法である$Se2$を導入する。
論文 参考訳(メタデータ) (2024-02-21T15:35:04Z) - Optimally Teaching a Linear Behavior Cloning Agent [29.290523215922015]
線形行動クローニング(LBC)学習者の最適指導について検討する。
この設定では、教師はLBC学習者に示す状態を選択することができる。
学習者は、証明と整合した無限線型仮説のバージョン空間を維持する。
論文 参考訳(メタデータ) (2023-11-26T19:47:39Z) - Contextual Bandits and Imitation Learning via Preference-Based Active
Queries [17.73844193143454]
本研究では,学習者が実行された行動報酬の直接的な知識を欠いている文脈的包帯と模倣学習の問題を考察する。
その代わり、学習者は各ラウンドのエキスパートに積極的に問い合わせて2つのアクションを比較し、ノイズの多い好みのフィードバックを受け取ることができる。
学習者の目的は、実行されたアクションに関連する後悔を最小限に抑えると同時に、専門家が行った比較クエリの数を最小化することである。
論文 参考訳(メタデータ) (2023-07-24T16:36:04Z) - Active Learning Principles for In-Context Learning with Large Language
Models [65.09970281795769]
本稿では,アクティブ・ラーニング・アルゴリズムが,文脈内学習における効果的な実演選択手法としてどのように機能するかを検討する。
ALによる文脈内サンプル選択は,不確実性の低い高品質な事例を優先し,試験例と類似性を有することを示す。
論文 参考訳(メタデータ) (2023-05-23T17:16:04Z) - Active Learning with Label Comparisons [41.82179028046654]
我々は、$k-1$のアクティブクエリで、$k$ラベルのベストを見つけることができることを示した。
我々の分析の鍵となる要素は、真の分布の「ラベル近傍グラフ」である。
論文 参考訳(メタデータ) (2022-04-10T12:13:46Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Iterative Teaching by Label Synthesis [40.11199328434789]
本稿では,反復型機械教育のためのラベル合成学習フレームワークを提案する。
このフレームワークは、指数的な授業性を確保しつつ、コストのかかるサンプル選択を回避できることを示す。
論文 参考訳(メタデータ) (2021-10-27T13:45:29Z) - Learning by Examples Based on Multi-level Optimization [12.317568257671427]
我々はLBE(Learning By Examples)と呼ばれる新しい学習手法を提案する。
提案手法では,クエリサンプルに類似したトレーニングサンプルの集合を自動的に検索し,検索したサンプルのクラスラベルを用いてクエリサンプルのラベルを予測する。
様々なベンチマークにおいて,教師付き学習と少数ショット学習の両方において,本手法の有効性を実証する実験を行った。
論文 参考訳(メタデータ) (2021-09-22T16:33:06Z) - Distribution Matching for Machine Teaching [64.39292542263286]
機械学習の逆問題である機械学習は、学習者の目標仮説に向けて学習者を操ることを目的としている。
機械教育に関するこれまでの研究は、それらの最良の指導例を見つけるための教育のリスクとコストのバランスに重点を置いていた。
本稿では,分布マッチングに基づく機械教育戦略を提案する。
論文 参考訳(メタデータ) (2021-05-06T09:32:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。