論文の概要: R\'{e}nyi Entropy Bounds on the Active Learning Cost-Performance
Tradeoff
- arxiv url: http://arxiv.org/abs/2002.02025v1
- Date: Wed, 5 Feb 2020 22:38:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 22:04:59.556044
- Title: R\'{e}nyi Entropy Bounds on the Active Learning Cost-Performance
Tradeoff
- Title(参考訳): アクティブラーニングコストパフォーマンストレードオフにおけるr\'{e}nyiエントロピー境界
- Authors: Vahid Jamali, Antonia Tulino, Jaime Llorca, and Elza Erkip
- Abstract要約: 半教師付き分類は、しばしば豊富なラベル付けされていないデータの統計的知識と、しばしば制限されたラベル付けされたデータを組み合わせて、全体的な分類精度を最大化する方法について研究する。
本稿では,ラベル付きラベル付きデータを用いた半教師付き分類における最適ポリシーの非漸近解析を開始する。
本稿では,ラベルクエリ予算によるコスト対効果のトレードオフと全体分類精度の観点から,共同最適化型アクティブラーニングと半教師付き分類ポリシーを初めて評価する。
- 参考スコア(独自算出の注目度): 27.436483977171328
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semi-supervised classification, one of the most prominent fields in machine
learning, studies how to combine the statistical knowledge of the often
abundant unlabeled data with the often limited labeled data in order to
maximize overall classification accuracy. In this context, the process of
actively choosing the data to be labeled is referred to as active learning. In
this paper, we initiate the non-asymptotic analysis of the optimal policy for
semi-supervised classification with actively obtained labeled data. Considering
a general Bayesian classification model, we provide the first characterization
of the jointly optimal active learning and semi-supervised classification
policy, in terms of the cost-performance tradeoff driven by the label query
budget (number of data items to be labeled) and overall classification
accuracy. Leveraging recent results on the R\'enyi Entropy, we derive tight
information-theoretic bounds on such active learning cost-performance tradeoff.
- Abstract(参考訳): 機械学習の最も顕著な分野の一つである半教師付き分類は、分類精度を最大化するために、しばしば豊富なラベル付きデータの統計的知識と、しばしば制限されたラベル付きデータの統計的知識を組み合わせる方法を研究する。
この文脈では、ラベル付け対象のデータを積極的に選択するプロセスは、アクティブラーニングと呼ばれる。
本稿では,ラベル付きデータを用いた半教師付き分類の最適方針の非漸近的解析を開始する。
一般的なベイズ分類モデルを考えると,ラベルクエリ予算(ラベル付きデータ項目数)と全体分類精度によって引き起こされる費用対効果のトレードオフから,共同最適化されたアクティブラーニングと半教師付き分類ポリシーを初めて評価する。
R'enyi Entropyの最近の成果を活用して、このようなアクティブな学習コストパフォーマンストレードオフに関する厳密な情報理論境界を導出する。
関連論文リスト
- Classification Tree-based Active Learning: A Wrapper Approach [4.706932040794696]
本稿では,木構造にサンプリングプロセスを整理し,分類のためのラッパー能動的学習法を提案する。
ラベル付き標本の初期集合上に構築された分類木は、空間を低エントロピー領域に分解すると考えられる。
この適応は、既存のアクティブラーニング手法よりも大幅に向上することが証明されている。
論文 参考訳(メタデータ) (2024-04-15T17:27:00Z) - OTMatch: Improving Semi-Supervised Learning with Optimal Transport [2.4355694259330467]
我々はOTMatchと呼ばれる新しい手法を提案する。OTMatchはクラス間の意味的関係を利用して、最適輸送損失関数を用いて分布を一致させる。
実験結果から,本手法のベースライン上における改善が示され,半教師付き環境での学習性能向上に意味的関係を活用する上でのアプローチの有効性と優位性が示された。
論文 参考訳(メタデータ) (2023-10-26T15:01:54Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - Active Transfer Prototypical Network: An Efficient Labeling Algorithm
for Time-Series Data [1.7205106391379026]
本稿では,プロトタイプネットワーク(ProtoNet)をALイテレーションに組み込むことで,トレードオフ問題に対処する新しいFew-Shot Learning(FSL)ベースのALフレームワークを提案する。
このフレームワークは、UCI HAR/HAPTデータセットと現実世界のブレーキ操作データセットに基づいて検証された。
学習性能は、両方のデータセットにおける従来のALアルゴリズムを大幅に上回り、それぞれ10%と5%のラベル付け作業で90%の分類精度を達成した。
論文 参考訳(メタデータ) (2022-09-28T16:14:40Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - Learning from Multiple Unlabeled Datasets with Partial Risk
Regularization [80.54710259664698]
本稿では,クラスラベルを使わずに正確な分類器を学習することを目的とする。
まず、与えられたラベルのない集合から推定できる分類リスクの偏りのない推定器を導出する。
その結果、経験的リスクがトレーニング中に負になるにつれて、分類器が過度に適合する傾向があることが判明した。
実験により,本手法は,複数の未ラベル集合から学習する最先端の手法を効果的に緩和し,性能を向上することを示した。
論文 参考訳(メタデータ) (2022-07-04T16:22:44Z) - Class-Balanced Active Learning for Image Classification [29.5211685759702]
本稿では,クラスバランスを考慮に入れた汎用最適化フレームワークを提案する。
3つのデータセットの結果から,本手法は汎用的(既存のほとんどのアクティブラーニングアルゴリズムと組み合わせることができる)であり,情報と代表に基づくアクティブラーニング手法の性能向上に効果的に適用可能であることが示された。
論文 参考訳(メタデータ) (2021-10-09T11:30:26Z) - ORDisCo: Effective and Efficient Usage of Incremental Unlabeled Data for
Semi-supervised Continual Learning [52.831894583501395]
連続学習は、入力されたデータが完全にラベル付けされていると仮定し、実際のアプリケーションでは適用できないかもしれない。
我々は、条件付き生成逆数ネットワーク(GAN)を用いた分類器を相互に学習するために、識別器整合(ORDisCo)を用いたディープオンライン再生を提案する。
ORDisCo が SSCL の様々な半教師付き学習ベンチマークデータセットで大幅なパフォーマンス向上を達成していることを示します。
論文 参考訳(メタデータ) (2021-01-02T09:04:14Z) - Out-distribution aware Self-training in an Open World Setting [62.19882458285749]
オープンワールド環境ではラベルのないデータを活用して予測性能をさらに向上します。
注意深いサンプル選択戦略を含む,自己学習を意識したアウト・ディストリビューションを導入する。
当社の分類器は、設計外分布を意識しており、タスク関連の入力と無関係な入力を区別できます。
論文 参考訳(メタデータ) (2020-12-21T12:25:04Z) - Semi-supervised Batch Active Learning via Bilevel Optimization [89.37476066973336]
両レベル最適化によるデータ要約問題として,本手法を定式化する。
本手法は,ラベル付きサンプルがほとんど存在しない場合,レジーム内のキーワード検出タスクにおいて極めて有効であることを示す。
論文 参考訳(メタデータ) (2020-10-19T16:53:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。