論文の概要: Improved Algorithms for Agnostic Pool-based Active Classification
- arxiv url: http://arxiv.org/abs/2105.06499v1
- Date: Thu, 13 May 2021 18:24:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-18 02:47:19.158022
- Title: Improved Algorithms for Agnostic Pool-based Active Classification
- Title(参考訳): プール型アクティブ分類のための改良アルゴリズム
- Authors: Julian Katz-Samuels, Jifan Zhang, Lalit Jain, Kevin Jamieson
- Abstract要約: プールに依存しない環境でのバイナリ分類のためのアクティブラーニングを検討する。
我々のアルゴリズムは、画像分類データセットにおけるアートアクティブな学習アルゴリズムの状況よりも優れている。
- 参考スコア(独自算出の注目度): 20.12178157010804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider active learning for binary classification in the agnostic
pool-based setting. The vast majority of works in active learning in the
agnostic setting are inspired by the CAL algorithm where each query is
uniformly sampled from the disagreement region of the current version space.
The sample complexity of such algorithms is described by a quantity known as
the disagreement coefficient which captures both the geometry of the hypothesis
space as well as the underlying probability space. To date, the disagreement
coefficient has been justified by minimax lower bounds only, leaving the door
open for superior instance dependent sample complexities. In this work we
propose an algorithm that, in contrast to uniform sampling over the
disagreement region, solves an experimental design problem to determine a
distribution over examples from which to request labels. We show that the new
approach achieves sample complexity bounds that are never worse than the best
disagreement coefficient-based bounds, but in specific cases can be
dramatically smaller. From a practical perspective, the proposed algorithm
requires no hyperparameters to tune (e.g., to control the aggressiveness of
sampling), and is computationally efficient by means of assuming access to an
empirical risk minimization oracle (without any constraints). Empirically, we
demonstrate that our algorithm is superior to state of the art agnostic active
learning algorithms on image classification datasets.
- Abstract(参考訳): 我々は,非依存プール設定における二項分類のための能動的学習について検討する。
能動的学習におけるほとんどの研究は、現在のバージョン空間の不一致領域から各クエリを一様にサンプリングするCALアルゴリズムにインスパイアされている。
このようなアルゴリズムのサンプル複雑性は、仮説空間の幾何学と基礎となる確率空間の両方を捉える不一致係数として知られる量によって記述される。
これまでのところ、不一致係数は最小限の低い境界のみによって正当化されており、ドアはより優れたインスタンス依存サンプル複合体に開放されている。
本研究では,不一致領域上の一様サンプリングとは対照的に,実験的な設計問題を解くアルゴリズムを提案する。
提案手法は, 最良不一致係数ベース境界よりも決して悪くないサンプル複雑性境界を実現するが, 特定の場合において, 劇的に小さくすることができることを示す。
実用的な観点からは、提案アルゴリズムはチューニングするハイパーパラメータ(例えばサンプリングのアグレッシブ性を制御する)を必要とせず、経験的リスク最小化のオラクルへのアクセスを仮定して(いかなる制約も伴わない)計算的に効率的である。
実験により,画像分類データセットにおける技術非依存なアクティブラーニングアルゴリズムよりもアルゴリズムが優れていることを示す。
関連論文リスト
- Optimal Multi-Distribution Learning [88.3008613028333]
マルチディストリビューション学習は、$k$の異なるデータ分散における最悪のリスクを最小限に抑える共有モデルを学ぶことを目指している。
本稿では, (d+k)/varepsilon2の順に, サンプルの複雑さを伴って, ヴァレプシロン最適ランダム化仮説を導出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-08T16:06:29Z) - Optimal PAC Bounds Without Uniform Convergence [11.125968799758436]
我々は、一様収束論の極限を超えるフレームワークを通して、最適な高確率リスク境界を提供する。
我々のフレームワークは、置換不変予測器の残余誤差を高い確率リスク境界に変換する。
具体的には, 1-inclusion graph アルゴリズムの特定のアグリゲーションが最適であることを示す。
論文 参考訳(メタデータ) (2023-04-18T17:57:31Z) - Accelerated and instance-optimal policy evaluation with linear function
approximation [17.995515643150657]
既存のアルゴリズムはこれらの下界の少なくとも1つと一致しない。
我々は,両下界を同時に一致させる高速時間差分アルゴリズムを開発し,インスタンス最適性という強い概念を実現する。
論文 参考訳(メタデータ) (2021-12-24T17:21:04Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Stochastic Compositional Gradient Descent under Compositional
constraints [13.170519806372075]
目的関数と制約関数が凸であり,関数の合成として表される制約最適化問題について検討する。
この問題は、公平な分類/回帰とキューシステムの設計に生じる。
提案手法は最適かつ実現可能な解をほぼ確実に見つけることが保証されている。
論文 参考訳(メタデータ) (2020-12-17T05:38:37Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - An Empirical Process Approach to the Union Bound: Practical Algorithms
for Combinatorial and Linear Bandits [34.06611065493047]
本稿では、信頼度と予算設定の固定化において、純探索線形帯域問題に対する近似アルゴリズムを提案する。
サンプルの複雑性がインスタンスの幾何でスケールし、アームの数に縛られた明示的な結合を避けるアルゴリズムを提供する。
また,固定予算設定における線形帯域幅に対する最初のアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-21T00:56:33Z) - Beyond Worst-Case Analysis in Stochastic Approximation: Moment
Estimation Improves Instance Complexity [58.70807593332932]
近似問題に対する勾配に基づく手法のオラクル複雑性について検討する。
最悪のケースの複雑さではなく、インスタンス依存の複雑さに焦点を当てます。
提案アルゴリズムとその解析はモーメント推定の成功を理論的に正当化する。
論文 参考訳(メタデータ) (2020-06-08T09:25:47Z) - The Simulator: Understanding Adaptive Sampling in the
Moderate-Confidence Regime [52.38455827779212]
エミュレータと呼ばれる適応サンプリングを解析するための新しい手法を提案する。
適切なログファクタを組み込んだトップk問題の最初のインスタンスベースの下位境界を証明します。
我々の新しい分析は、後者の問題に対するこの種の最初のエミュレータであるベストアームとトップkの識別に、シンプルでほぼ最適であることを示した。
論文 参考訳(メタデータ) (2017-02-16T23:42:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。