論文の概要: Integrating Informativeness, Representativeness and Diversity in
Pool-Based Sequential Active Learning for Regression
- arxiv url: http://arxiv.org/abs/2003.11786v1
- Date: Thu, 26 Mar 2020 08:10:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-19 21:04:17.844974
- Title: Integrating Informativeness, Representativeness and Diversity in
Pool-Based Sequential Active Learning for Regression
- Title(参考訳): リグレッションのためのプール型逐次アクティブラーニングにおける情報性,代表性,多様性の統合
- Authors: Ziang Liu and Dongrui Wu
- Abstract要約: ラベル付けするサンプルを最適に選択することで、ラベル付けされたサンプルの数から、より優れた機械学習モデルをトレーニングすることができる。
回帰問題に対して、情報性、代表性、多様性の3つの必須基準が提案されている。
我々は3つの基準を統合するための異なる戦略を持つ3つの新しいALRアプローチを提案する。
- 参考スコア(独自算出の注目度): 29.321275647107928
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many real-world machine learning applications, unlabeled samples are easy
to obtain, but it is expensive and/or time-consuming to label them. Active
learning is a common approach for reducing this data labeling effort. It
optimally selects the best few samples to label, so that a better machine
learning model can be trained from the same number of labeled samples. This
paper considers active learning for regression (ALR) problems. Three essential
criteria -- informativeness, representativeness, and diversity -- have been
proposed for ALR. However, very few approaches in the literature have
considered all three of them simultaneously. We propose three new ALR
approaches, with different strategies for integrating the three criteria.
Extensive experiments on 12 datasets in various domains demonstrated their
effectiveness.
- Abstract(参考訳): 多くの現実世界の機械学習アプリケーションでは、ラベルのないサンプルは簡単に手に入るが、ラベル付けは高価で時間がかかる。
アクティブラーニングは、このデータラベリングの労力を減らすための一般的なアプローチです。
ラベル付けに最適なサンプルを最適に選択するので、同じ数のラベル付きサンプルからより良い機械学習モデルをトレーニングすることができる。
本稿では,回帰(ALR)問題に対する能動的学習について考察する。
ALRには、情報性、代表性、多様性の3つの必須基準が提案されている。
しかし、文学における3つのアプローチはいずれも同時に検討されているものはほとんどない。
3つの基準を統合するための異なる戦略を持つ3つの新しいALRアプローチを提案する。
様々な領域における12のデータセットに対する大規模な実験は、その効果を実証した。
関連論文リスト
- Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - A Lagrangian Duality Approach to Active Learning [119.36233726867992]
トレーニングデータのサブセットのみをラベル付けするバッチアクティブな学習問題を考察する。
制約付き最適化を用いて学習問題を定式化し、各制約はラベル付きサンプルにモデルの性能を拘束する。
数値実験により,提案手法は最先端の能動学習法と同等かそれ以上に機能することを示した。
論文 参考訳(メタデータ) (2022-02-08T19:18:49Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - Active Learning in Incomplete Label Multiple Instance Multiple Label
Learning [17.5720245903743]
MIML設定におけるアクティブラーニングのための新しいバッグクラスペア方式を提案する。
我々のアプローチは、効率的かつ正確な推論を伴う識別的グラフィカルモデルに基づいている。
論文 参考訳(メタデータ) (2021-07-22T17:01:28Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Deep Active Learning via Open Set Recognition [0.0]
多くのアプリケーションでは、データは簡単に取得できるが、顕著な例を示すのに高価で時間がかかる。
オープンセット認識問題として能動的学習を定式化する。
現在のアクティブな学習方法とは異なり、我々のアルゴリズムはタスクラベルを必要とせずにタスクを学習することができる。
論文 参考訳(メタデータ) (2020-07-04T22:09:17Z) - Pool-Based Unsupervised Active Learning for Regression Using Iterative
Representativeness-Diversity Maximization (iRDM) [22.037639625586667]
アクティブラーニング(AL)はラベル付けに最も有用な未ラベルのサンプルを選択するため、同じラベル付けされたサンプルからより優れた機械学習モデルをトレーニングすることができる。
回帰(ALR)アプローチのための既存のアクティブラーニングは監視されており、サンプリングプロセスはラベル情報を使用する必要がある。
提案手法は, 新規な教師なしALR手法, 反復代表性多様性 (iRDM) を用いて, 選択したサンプルの表現性と多様性のバランスをとるものである。
論文 参考訳(メタデータ) (2020-03-17T12:20:46Z) - Unsupervised Pool-Based Active Learning for Linear Regression [29.321275647107928]
本稿では,線形回帰問題に対する教師なしプールベースALについて検討する。
本稿では,ALにおける3つの重要な基準である,情報性,代表性,多様性を同時に考慮した新たなALアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-14T20:00:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。