論文の概要: How to Allocate your Label Budget? Choosing between Active Learning and
Learning to Reject in Anomaly Detection
- arxiv url: http://arxiv.org/abs/2301.02909v1
- Date: Sat, 7 Jan 2023 18:02:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-10 17:37:29.133530
- Title: How to Allocate your Label Budget? Choosing between Active Learning and
Learning to Reject in Anomaly Detection
- Title(参考訳): あなたのレーベルの予算をどう割り当てますか。
異常検出におけるアクティブラーニングと退避学習の選択
- Authors: Lorenzo Perini, Daniele Giannuzzi, Jesse Davis
- Abstract要約: 異常検出は、期待された振る舞いから逸脱する例を見つけようとする。
ラベルの欠如により、一部の地域では異常検知器は高い不確実性を持つ。
複数のラウンドでALラベルを収集するか、ラベルをリジェクトするかを判断する混合戦略を提案する。
- 参考スコア(独自算出の注目度): 15.224212372777002
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection attempts at finding examples that deviate from the expected
behaviour. Usually, anomaly detection is tackled from an unsupervised
perspective because anomalous labels are rare and difficult to acquire.
However, the lack of labels makes the anomaly detector have high uncertainty in
some regions, which usually results in poor predictive performance or low user
trust in the predictions. One can reduce such uncertainty by collecting
specific labels using Active Learning (AL), which targets examples close to the
detector's decision boundary. Alternatively, one can increase the user trust by
allowing the detector to abstain from making highly uncertain predictions,
which is called Learning to Reject (LR). One way to do this is by thresholding
the detector's uncertainty based on where its performance is low, which
requires labels to be evaluated. Although both AL and LR need labels, they work
with different types of labels: AL seeks strategic labels, which are evidently
biased, while LR requires i.i.d. labels to evaluate the detector's performance
and set the rejection threshold. Because one usually has a unique label budget,
deciding how to optimally allocate it is challenging. In this paper, we propose
a mixed strategy that, given a budget of labels, decides in multiple rounds
whether to use the budget to collect AL labels or LR labels. The strategy is
based on a reward function that measures the expected gain when allocating the
budget to either side. We evaluate our strategy on 18 benchmark datasets and
compare it to some baselines.
- Abstract(参考訳): 異常検出は、期待される振る舞いから逸脱する例を見つけようとする。
通常、異常なラベルはまれで取得が困難であるため、教師なしの観点から異常検出に取り組む。
しかし、ラベルの欠如により、一部の地域では異常検知器は高い不確実性を持ち、通常は予測性能の低下や予測に対するユーザの信頼の低下をもたらす。
アクティブラーニング(AL)を使用して特定のラベルを収集することで、検知器の判定境界に近い例をターゲットにすることで、そのような不確実性を低減できる。
あるいは、検知器が極めて不確実な予測をすること、すなわちLearning to Reject (LR) と呼ばれることによって、ユーザの信頼を高めることができる。
この方法の1つは、その性能の低い場所に基づいて検出器の不確かさをしきい値にし、ラベルを評価することである。
ALは明らかに偏りがある戦略ラベルを求め、LRは検出器の性能を評価し拒絶しきい値を設定するためにi.d.ラベルを必要とする。
通常、ラベルの予算がユニークなため、最適な割り当て方法を決定するのは難しいです。
本稿では,ラベルの予算が与えられた場合,予算を用いてALラベルやLRラベルを収集するかを複数ラウンドで決定する混合戦略を提案する。
この戦略は、予算を双方に割り当てるときに期待される利益を測定する報酬関数に基づいている。
私たちは18のベンチマークデータセットで戦略を評価し、いくつかのベースラインと比較します。
関連論文リスト
- Unsupervised Learning of Distributional Properties can Supplement Human
Labeling and Increase Active Learning Efficiency in Anomaly Detection [0.0]
メールによるデータの流出は、多くの組織にとって深刻なサイバーセキュリティの脅威だ。
Active Learningは、データを効率的にラベル付けするための有望なアプローチである。
稀な異常の事例を含むラベル付けされた事例のバッチを生成するための適応型ALサンプリング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-13T22:14:30Z) - Partial-Label Regression [54.74984751371617]
部分ラベル学習は、弱い教師付き学習環境であり、各トレーニング例に候補ラベルのセットをアノテートすることができる。
部分ラベル学習に関する従来の研究は、候補ラベルがすべて離散的な分類設定のみに焦点を当てていた。
本稿では,各トレーニング例に実値付き候補ラベルのセットをアノテートした部分ラベル回帰を初めて検討する。
論文 参考訳(メタデータ) (2023-06-15T09:02:24Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - Dist-PU: Positive-Unlabeled Learning from a Label Distribution
Perspective [89.5370481649529]
本稿では,PU学習のためのラベル分布視点を提案する。
そこで本研究では,予測型と基底型のラベル分布間のラベル分布の整合性を追求する。
提案手法の有効性を3つのベンチマークデータセットで検証した。
論文 参考訳(メタデータ) (2022-12-06T07:38:29Z) - Automated Detection of Label Errors in Semantic Segmentation Datasets via Deep Learning and Uncertainty Quantification [5.279257531335345]
ピクセルワイドラベルを用いたセマンティックセグメンテーションデータセットにおけるラベル誤り検出手法を初めて提案する。
提案手法では,誤検出回数を制御しながら,ラベルエラーの大部分を検出することができる。
論文 参考訳(メタデータ) (2022-07-13T10:25:23Z) - Learning with Proper Partial Labels [87.65718705642819]
部分ラベル学習は、不正確なラベルを持つ弱い教師付き学習の一種である。
この適切な部分ラベル学習フレームワークには,従来の部分ラベル学習設定が数多く含まれていることを示す。
次に、分類リスクの統一的非バイアス推定器を導出する。
論文 参考訳(メタデータ) (2021-12-23T01:37:03Z) - Learning with Noisy Labels by Targeted Relabeling [52.0329205268734]
クラウドソーシングプラットフォームは、ディープニューラルネットワークをトレーニングするためのデータセット収集によく使用される。
本稿では,少数のアノテーションを予約して,高い確率でラベル付け可能なエラーを明示的に緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-10-15T20:37:29Z) - Active WeaSuL: Improving Weak Supervision with Active Learning [2.624902795082451]
アクティブラーニングを弱い監督に組み込んだアプローチであるActive WeaSuLを提案します。
我々は,1) 弱いラベルの組み合わせを通知し改善する弱監督損失関数の修正,2) 専門家ラベルがどのデータポイントに最も有用かを決定するmaxKL分散サンプリング戦略,の2つの貢献を行う。
論文 参考訳(メタデータ) (2021-04-30T08:58:26Z) - Active Learning for Noisy Data Streams Using Weak and Strong Labelers [3.9370369973510746]
我々は、人間のラベリング能力に触発された、新しい弱くて強力なラベリング問題を考える。
そこで本研究では,フィルタリング,多様性の追加,情報的サンプル選択,ラベル抽出の4段階からなるオンライン能動学習アルゴリズムを提案する。
我々は,個々のサンプルの情報とモデル信頼度を組み合わせることで,情報ゲインを測定する決定関数を導出する。
論文 参考訳(メタデータ) (2020-10-27T09:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。