論文の概要: Preference-Based Batch and Sequential Teaching
- arxiv url: http://arxiv.org/abs/2010.10012v1
- Date: Sat, 17 Oct 2020 14:39:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-06 11:41:20.113660
- Title: Preference-Based Batch and Sequential Teaching
- Title(参考訳): 嗜好に基づくバッチとシーケンス指導
- Authors: Farnam Mansouri, Yuxin Chen, Ara Vartanian, Xiaojin Zhu, Adish Singla
- Abstract要約: 我々は、選好関数$Sigma$を介して授業プロセスをキャプチャする新しいフレームワークを開発する。
我々のフレームワークでは、Sigma の各関数 $sigma は、TD(sigma)$ として教える複雑さを持つ教師と教師のペアを誘導する。
選好関数の異なる族に関連付けられた教示複雑性パラメータ $TD(sigma)$ のいくつかの特性を解析する。
- 参考スコア(独自算出の注目度): 36.71839025132527
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Algorithmic machine teaching studies the interaction between a teacher and a
learner where the teacher selects labeled examples aiming at teaching a target
hypothesis. In a quest to lower teaching complexity, several teaching models
and complexity measures have been proposed for both the batch settings (e.g.,
worst-case, recursive, preference-based, and non-clashing models) and the
sequential settings (e.g., local preference-based model). To better understand
the connections between these models, we develop a novel framework that
captures the teaching process via preference functions $\Sigma$. In our
framework, each function $\sigma \in \Sigma$ induces a teacher-learner pair
with teaching complexity as $TD(\sigma)$. We show that the above-mentioned
teaching models are equivalent to specific types/families of preference
functions. We analyze several properties of the teaching complexity parameter
$TD(\sigma)$ associated with different families of the preference functions,
e.g., comparison to the VC dimension of the hypothesis class and
additivity/sub-additivity of $TD(\sigma)$ over disjoint domains. Finally, we
identify preference functions inducing a novel family of sequential models with
teaching complexity linear in the VC dimension: this is in contrast to the
best-known complexity result for the batch models, which is quadratic in the VC
dimension.
- Abstract(参考訳): アルゴリズム機械による学習は、教師と学習者の相互作用を研究し、教師が対象仮説を教えるためのラベル付き例を選択する。
教育の複雑さを減らすために、いくつかの教育モデルと複雑さ対策がバッチ設定(例えば、最悪のケース、再帰的、優先順位ベース、非クラッシングモデル)とシーケンシャル設定(例えば、局所的な嗜好ベースモデル)の両方に提案されている。
これらのモデル間の関係をよりよく理解するために、選好関数$\Sigma$を介して学習プロセスをキャプチャする新しいフレームワークを開発する。
このフレームワークでは、各関数 $\sigma \in \Sigma$ は、TD(\sigma)$ という、教師と教師のペアを誘導する。
上記の指導モデルは,好み関数の特定の型/ファミリと等価であることを示す。
学習複雑性パラメータ $td(\sigma)$ と選好関数の異なる族(例えば、仮説クラスのvc次元と非連結領域上の$td(\sigma)$ の加法的/副加法性との比較)のいくつかの性質を解析した。
最後に、VC次元において複雑性を線形に教えるシーケンシャルモデルの新しいファミリーを誘導する選好関数を同定する:これはVC次元において二次的なバッチモデルにおいて最もよく知られた複雑性結果とは対照的である。
関連論文リスト
- Sample Efficient Reinforcement Learning with Partial Dynamics Knowledge [0.704590071265998]
オンラインQ-ラーニング手法のサンプル複雑性について,動的知識が利用可能であったり,効率的に学習できたりした場合に検討する。
我々は,$f$の完全知識の下で,$tildemathcalO(textPoly(H)sqrtSAT)$ regretを達成する楽観的なQ-ラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-19T19:53:58Z) - Model Selection in Reinforcement Learning with General Function
Approximations [10.97775622611135]
強化学習環境におけるモデル選択の検討 - マルチアームバンド(MAB)とマルコフ決定プロセス(MDP)-
モデル選択フレームワークでは、$mathcalF$と$mathcalM$で表される関数クラスを知らない。
適応アルゴリズムの累積的後悔は、正しい関数クラスを知っているオラクルの後悔と一致することを示す。
論文 参考訳(メタデータ) (2022-07-06T21:52:07Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Teaching an Active Learner with Contrastive Examples [35.926575235046634]
本研究では,学習者が補助的な教師によって支援される追加のツイストを用いて,能動的学習の課題について検討する。
比較例を適応的に選択する効率的な学習アルゴリズムについて検討する。
2つの問題依存パラメータに基づいてアルゴリズムの性能保証を行う。
論文 参考訳(メタデータ) (2021-10-28T05:00:55Z) - Bilinear Classes: A Structural Framework for Provable Generalization in
RL [119.42509700822484]
Bilinear Classesは強化学習の一般化を可能にする新しい構造フレームワークである。
このフレームワークは、サンプルの複雑さが達成可能な、ほとんどすべての既存のモデルを取り込んでいる。
我々の主な成果は、双線形クラスのためのサンプル複雑性を持つRLアルゴリズムである。
論文 参考訳(メタデータ) (2021-03-19T16:34:20Z) - On Function Approximation in Reinforcement Learning: Optimism in the
Face of Large State Spaces [208.67848059021915]
強化学習のコアにおける探索・探索トレードオフについて検討する。
特に、関数クラス $mathcalF$ の複雑さが関数の複雑さを特徴づけていることを証明する。
私たちの後悔の限界はエピソードの数とは無関係です。
論文 参考訳(メタデータ) (2020-11-09T18:32:22Z) - Stochastic Flows and Geometric Optimization on the Orthogonal Group [52.50121190744979]
直交群 $O(d)$ 上の幾何駆動最適化アルゴリズムの新しいクラスを示す。
提案手法は,深層,畳み込み,反復的なニューラルネットワーク,強化学習,フロー,メトリック学習など,機械学習のさまざまな分野に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-03-30T15:37:50Z) - Learning Gaussian Graphical Models via Multiplicative Weights [54.252053139374205]
乗算重み更新法に基づいて,Klivans と Meka のアルゴリズムを適用した。
アルゴリズムは、文献の他のものと質的に類似したサンプル複雑性境界を楽しみます。
ランタイムが低い$O(mp2)$で、$m$サンプルと$p$ノードの場合には、簡単にオンライン形式で実装できる。
論文 参考訳(メタデータ) (2020-02-20T10:50:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。