論文の概要: Semi-supervised anomaly detection algorithm based on KL divergence
(SAD-KL)
- arxiv url: http://arxiv.org/abs/2203.14539v1
- Date: Mon, 28 Mar 2022 07:30:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 13:35:18.542933
- Title: Semi-supervised anomaly detection algorithm based on KL divergence
(SAD-KL)
- Title(参考訳): KL発散(SAD-KL)に基づく半教師付き異常検出アルゴリズム
- Authors: Chong Hyun Lee, Kibae Lee
- Abstract要約: KL発散(SAD-KL)を用いた半教師付き異常検出アルゴリズムを提案する。
SAD-KLは学習時間が少なくても既存のアルゴリズムよりも優れた検出確率を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The unlabeled data are generally assumed to be normal data in detecting
abnormal data via semisupervised learning. This assumption, however, causes
inevitable detection error when distribution of unlabeled data is different
from distribution of labeled normal dataset. To deal the problem caused by
distribution gap between labeled and unlabeled data, we propose a
semi-supervised anomaly detection algorithm using KL divergence (SAD-KL). The
proposed SAD-KL is composed of two steps: (1) estimating KL divergence of
probability density functions (PDFs) of the local outlier factors (LOFs) of the
labeled normal data and the unlabeled data (2) estimating detection probability
and threshold for detecting normal data in unlabeled data by using the KL
divergence. We show that the PDFs of the LOFs follow Burr distribution and use
them for detection. Once the threshold is computed, the SAD-KL runs iteratively
until the labeling change rate is lower than the predefined threshold.
Experiments results show that the SAD-KL shows superior detection probability
over the existing algorithms even though it takes less learning time.
- Abstract(参考訳): ラベルなしデータは一般に、半教師付き学習による異常データ検出における正規データと推定される。
しかし、この仮定はラベル付き正規データセットの分布とラベル付きデータの分布が異なる場合、避けられない検出誤差を引き起こす。
ラベル付きデータとラベルなしデータの分散ギャップに起因する問題に対処するために,KL発散(SAD-KL)を用いた半教師付き異常検出アルゴリズムを提案する。
提案したSAD-KLは,(1) ラベル付き正規データと未ラベルデータとの局所外乱係数(LOF)の確率密度関数(PDF)のKL偏差を推定し,(2) KL偏差を用いてラベル付きデータ中の正規データを検出するための検出確率と閾値を推定する。
lofs の pdf はburr 分布に従い,検出に使用する。
しきい値が計算されると、SAD−KLは、ラベル変更率が予め定義されたしきい値よりも低いまで繰り返し実行される。
実験の結果,SAD-KLは学習時間が少なくても既存のアルゴリズムよりも優れた検出確率を示すことがわかった。
関連論文リスト
- FUN-AD: Fully Unsupervised Learning for Anomaly Detection with Noisy Training Data [1.0650780147044159]
ラベルなしおよび潜在的に汚染されたトレーニングデータを用いた完全教師なし異常検出のための新しい学習ベースアプローチを提案する。
本手法は, 2つの観測結果から, 正常試料間の対特徴距離が, 異常試料や異種試料間の対特徴距離よりも平均的に小さい可能性が示唆され, 互いに近接する2つの特徴対が等質な対である可能性が示唆された。
本研究は, 近接する近傍距離が信頼度の高いサンプルと異常を区別できることを示す最初の観測結果に基づいて, 反復的に再構成されたメモリバンクを用いた擬似ラベル方式を提案する。
論文 参考訳(メタデータ) (2024-11-25T05:51:38Z) - Deep Positive-Unlabeled Anomaly Detection for Contaminated Unlabeled Data [31.029029510114448]
本稿では, 深い正のラベルのない異常検出フレームワークを提案する。
肯定的未ラベル学習と深い異常検出モデルを統合する。
提案手法は既存の手法よりも優れた検出性能を実現する。
論文 参考訳(メタデータ) (2024-05-29T09:34:47Z) - MSFlow: Multi-Scale Flow-based Framework for Unsupervised Anomaly
Detection [124.52227588930543]
教師なし異常検出(UAD)は多くの研究の関心を集め、幅広い応用を推進している。
不明瞭だが強力な統計モデルである正規化フローは、教師なしの方法で異常検出と局所化に適している。
非対称な並列フローと融合フローからなるMSFlowと呼ばれる新しいマルチスケールフローベースフレームワークを提案する。
我々のMSFlowは、検出AUORCスコアが99.7%、ローカライゼーションAUCROCスコアが98.8%、プロスコアが97.1%の新たな最先端技術を実現している。
論文 参考訳(メタデータ) (2023-08-29T13:38:35Z) - RoSAS: Deep Semi-Supervised Anomaly Detection with
Contamination-Resilient Continuous Supervision [21.393509817509464]
本稿では, テクスト汚染耐性連続監視信号を考案した, 半教師付き異常検出手法を提案する。
当社のアプローチは、AUC-PRにおいて最先端の競合他社を20%-30%上回っている。
論文 参考訳(メタデータ) (2023-07-25T04:04:49Z) - Anomaly Detection with Score Distribution Discrimination [4.468952886990851]
本稿では,スコア分布の観点から,異常スコア関数の最適化を提案する。
正常試料と異常試料のスコア分布の重なりを最小化するオーバーラップ損失と呼ばれる新しい損失関数を設計する。
論文 参考訳(メタデータ) (2023-06-26T03:32:57Z) - SPADE: Semi-supervised Anomaly Detection under Distribution Mismatch [58.04518381476167]
SPADEは、分布ミスマッチを伴う幅広いシナリオにわたって、最先端の半教師付き異常検出性能を示す。
新しいタイプのラベルのない異常に直面したモデルなど、いくつかの一般的な現実世界設定では、SPADEは最先端の代替品を平均5%のAUCで上回っている。
論文 参考訳(メタデータ) (2022-11-30T23:39:11Z) - How Does Pseudo-Labeling Affect the Generalization Error of the
Semi-Supervised Gibbs Algorithm? [73.80001705134147]
擬似ラベル付き半教師付き学習(SSL)におけるGibsアルゴリズムによる予測一般化誤差(ゲンエラー)を正確に評価する。
ゲンエラーは、出力仮説、擬ラベルデータセット、ラベル付きデータセットの間の対称性付きKL情報によって表現される。
論文 参考訳(メタデータ) (2022-10-15T04:11:56Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - SLA$^2$P: Self-supervised Anomaly Detection with Adversarial
Perturbation [77.71161225100927]
異常検出は、機械学習の基本的な問題であるが、難しい問題である。
本稿では,非教師付き異常検出のための新しい強力なフレームワークであるSLA$2$Pを提案する。
論文 参考訳(メタデータ) (2021-11-25T03:53:43Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。