論文の概要: Cost-Accuracy Aware Adaptive Labeling for Active Learning
- arxiv url: http://arxiv.org/abs/2105.11418v1
- Date: Mon, 24 May 2021 17:21:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 14:51:02.300994
- Title: Cost-Accuracy Aware Adaptive Labeling for Active Learning
- Title(参考訳): 能動学習のための適応ラベル認識のコスト精度
- Authors: Ruijiang Gao, Maytal Saar-tsechansky
- Abstract要約: 多くの実環境において、異なるラベルには異なるラベルのコストがあり、異なるラベルの精度が得られる。
本稿では, インスタンス, ラベル付け者と対応するコストを選択し, ラベル付け精度を向上するための新しいアルゴリズムを提案する。
提案アルゴリズムは,5つのUCIおよび実際のクラウドソーシングデータセット上での最先端のパフォーマンスを示す。
- 参考スコア(独自算出の注目度): 9.761953860259942
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional active learning algorithms assume a single labeler that produces
noiseless label at a given, fixed cost, and aim to achieve the best
generalization performance for given classifier under a budget constraint.
However, in many real settings, different labelers have different labeling
costs and can yield different labeling accuracies. Moreover, a given labeler
may exhibit different labeling accuracies for different instances. This setting
can be referred to as active learning with diverse labelers with varying costs
and accuracies, and it arises in many important real settings. It is therefore
beneficial to understand how to effectively trade-off between labeling accuracy
for different instances, labeling costs, as well as the informativeness of
training instances, so as to achieve the best generalization performance at the
lowest labeling cost. In this paper, we propose a new algorithm for selecting
instances, labelers (and their corresponding costs and labeling accuracies),
that employs generalization bound of learning with label noise to select
informative instances and labelers so as to achieve higher generalization
accuracy at a lower cost. Our proposed algorithm demonstrates state-of-the-art
performance on five UCI and a real crowdsourcing dataset.
- Abstract(参考訳): 従来の能動学習アルゴリズムでは、与えられた固定コストでノイズレスラベルを生成する単一ラベルを仮定し、予算制約の下で与えられた分類器の最高の一般化性能を達成する。
しかし、実際の多くの設定では、異なるラベルには異なるラベルのコストがあり、異なるラベルの精度が得られる。
さらに、与えられたラベル付け者は、異なるインスタンスに対して異なるラベル付け精度を示すことができる。
この設定は、様々なコストと精度を持つ多様なラベル付きでアクティブな学習と呼ばれ、多くの重要な実際の設定で発生する。
したがって、異なるインスタンスのラベル付け精度、ラベル付けコスト、およびトレーニングインスタンスのインフォメーション性を効果的にトレードオフする方法を理解することは、最も低いラベル付けコストで最高の一般化性能を達成するために有益である。
本稿では,ラベルノイズによる学習の一般化バウンダリを用いて,より低コストでより高度な一般化精度を実現するための,インスタンス,ラベル(およびそれに対応するコストとラベル付け精度)を選択するための新しいアルゴリズムを提案する。
提案アルゴリズムは,5つのUCIおよび実際のクラウドソーシングデータセット上での最先端のパフォーマンスを示す。
関連論文リスト
- Imprecise Label Learning: A Unified Framework for Learning with Various
Imprecise Label Configurations [95.12263518034939]
imprecise label learning (ILL)は、様々な不正確なラベル構成で学習を統合するためのフレームワークである。
我々は、ILLが部分ラベル学習、半教師付き学習、雑音ラベル学習にシームレスに適応できることを実証した。
論文 参考訳(メタデータ) (2023-05-22T04:50:28Z) - Improved Adaptive Algorithm for Scalable Active Learning with Weak
Labeler [89.27610526884496]
Weak Labeler Active Cover (WL-AC)は、要求される精度を維持しながら、クエリの複雑さを低減するために、低品質の弱いラベルを堅牢に活用することができる。
受動学習と同一の精度を維持しつつラベル数を著しく削減し, 劣化したMNISTデータセット上での有効性を示す。
論文 参考訳(メタデータ) (2022-11-04T02:52:54Z) - Eliciting and Learning with Soft Labels from Every Annotator [31.10635260890126]
個々のアノテータからソフトラベルを効率よく抽出することに注力する。
ラベルによる学習は,従来の手法と同等のモデル性能を達成できることを実証する。
論文 参考訳(メタデータ) (2022-07-02T12:03:00Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z) - Learning with Noisy Labels by Targeted Relabeling [52.0329205268734]
クラウドソーシングプラットフォームは、ディープニューラルネットワークをトレーニングするためのデータセット収集によく使用される。
本稿では,少数のアノテーションを予約して,高い確率でラベル付け可能なエラーを明示的に緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T20:37:29Z) - A Study on the Autoregressive and non-Autoregressive Multi-label
Learning [77.11075863067131]
本稿では,ラベルとラベルの依存関係を共同で抽出する自己アテンションに基づく変分エンコーダモデルを提案する。
したがって、ラベルラベルとラベル機能の両方の依存関係を保ちながら、すべてのラベルを並列に予測することができる。
論文 参考訳(メタデータ) (2020-12-03T05:41:44Z) - Active Learning for Noisy Data Streams Using Weak and Strong Labelers [3.9370369973510746]
我々は、人間のラベリング能力に触発された、新しい弱くて強力なラベリング問題を考える。
そこで本研究では,フィルタリング,多様性の追加,情報的サンプル選択,ラベル抽出の4段階からなるオンライン能動学習アルゴリズムを提案する。
我々は,個々のサンプルの情報とモデル信頼度を組み合わせることで,情報ゲインを測定する決定関数を導出する。
論文 参考訳(メタデータ) (2020-10-27T09:18:35Z) - Cost-Quality Adaptive Active Learning for Chinese Clinical Named Entity
Recognition [4.227856561940623]
中国のEHRにおけるCNERに対するCQAAL(Cost-Quality Adaptive Active Learning)アプローチを提案する。
CQAALは、コスト効率の良いインスタンスラベルペアを選択し、より低いコストでより優れたアノテーション品質を適応的に達成する。
論文 参考訳(メタデータ) (2020-08-28T09:27:43Z) - Minimum Cost Active Labeling [2.0754848504005587]
ミンコストラベリングは、モデルを学ぶためにアクティブラーニングの変種を使用し、最適なトレーニングセットサイズを予測する。
いくつかのケースでは、我々のアプローチは人間のラベル付けに比べて6倍のコストがかかり、常に最も安価なアクティブラーニング戦略よりも安い。
論文 参考訳(メタデータ) (2020-06-24T19:01:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。