論文の概要: NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly
Generation
- arxiv url: http://arxiv.org/abs/2311.11961v1
- Date: Mon, 20 Nov 2023 17:38:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-21 17:37:05.876777
- Title: NNG-Mix: Improving Semi-supervised Anomaly Detection with Pseudo-anomaly
Generation
- Title(参考訳): NNG-Mix:擬似異常発生による半教師付き異常検出の改善
- Authors: Hao Dong, Ga\"etan Frusque, Yue Zhao, Eleni Chatzi, Olga Fink
- Abstract要約: 異常検出は、複雑なシステムにおいて稀かつしばしば重要な事象を特定するのに不可欠である。
半教師付きおよび教師付きアプローチは、そのようなラベル付きデータを活用することができ、パフォーマンスが向上する。
ラベル付き異常とラベル付けされていない大量のデータに基づいて擬似異常を新たに生成するアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 11.884004583641325
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection (AD) is essential in identifying rare and often critical
events in complex systems, finding applications in fields such as network
intrusion detection, financial fraud detection, and fault detection in
infrastructure and industrial systems. While AD is typically treated as an
unsupervised learning task due to the high cost of label annotation, it is more
practical to assume access to a small set of labeled anomaly samples from
domain experts, as is the case for semi-supervised anomaly detection.
Semi-supervised and supervised approaches can leverage such labeled data,
resulting in improved performance. In this paper, rather than proposing a new
semi-supervised or supervised approach for AD, we introduce a novel algorithm
for generating additional pseudo-anomalies on the basis of the limited labeled
anomalies and a large volume of unlabeled data. This serves as an augmentation
to facilitate the detection of new anomalies. Our proposed algorithm, named
Nearest Neighbor Gaussian Mixup (NNG-Mix), efficiently integrates information
from both labeled and unlabeled data to generate pseudo-anomalies. We compare
the performance of this novel algorithm with commonly applied augmentation
techniques, such as Mixup and Cutout. We evaluate NNG-Mix by training various
existing semi-supervised and supervised anomaly detection algorithms on the
original training data along with the generated pseudo-anomalies. Through
extensive experiments on 57 benchmark datasets in ADBench, reflecting different
data types, we demonstrate that NNG-Mix outperforms other data augmentation
methods. It yields significant performance improvements compared to the
baselines trained exclusively on the original training data. Notably, NNG-Mix
yields up to 16.4%, 8.8%, and 8.0% improvements on Classical, CV, and NLP
datasets in ADBench. Our source code will be available at
https://github.com/donghao51/NNG-Mix.
- Abstract(参考訳): 異常検出(AD)は、複雑なシステムにおいて稀かつしばしば重要な事象を識別し、ネットワーク侵入検出、金融詐欺検出、インフラや産業システムにおける故障検出などの分野での応用を見つけるために不可欠である。
ADは通常、ラベルアノテーションのコストが高いため教師なしの学習タスクとして扱われるが、半教師付き異常検出のように、ドメインの専門家によるラベル付き異常サンプルの小さなセットにアクセスすることはより現実的である。
半教師付きおよび教師付きアプローチは、そのようなラベル付きデータを活用することができ、パフォーマンスが向上する。
本稿では,adに対する新しい半教師付きあるいは教師付きアプローチを提案するのではなく,限定ラベル付き異常と大量のラベル付きデータに基づいて擬似異常を新たに生成するアルゴリズムを提案する。
これは新しい異常の検出を容易にする拡張として機能する。
提案アルゴリズムはNearest Neighbor Gaussian Mixup (NNG-Mix) と名付けられ,ラベル付きデータとラベルなしデータの両方から情報を効率よく統合して擬似アノマリーを生成する。
本稿では,このアルゴリズムの性能を,MixupやCutoutといった一般的な拡張手法と比較する。
我々は,NNG-Mixの評価を,既存の半教師付きおよび教師付き異常検出アルゴリズムを,生成された擬似異常とともに元のトレーニングデータ上でトレーニングすることで行う。
ADBenchの57のベンチマークデータセットに関する広範な実験を通じて、異なるデータ型を反映し、NNG-Mixが他のデータ拡張手法より優れていることを示す。
オリジナルのトレーニングデータにのみトレーニングされたベースラインと比較して、パフォーマンスが大幅に向上する。
特に、NNG-MixはADBenchのClassical、CV、NLPデータセットを最大16.4%、8.8%、そして8.0%改善する。
ソースコードはhttps://github.com/donghao51/nng-mixで入手できる。
関連論文リスト
- RoSAS: Deep Semi-Supervised Anomaly Detection with
Contamination-Resilient Continuous Supervision [21.393509817509464]
本稿では, テクスト汚染耐性連続監視信号を考案した, 半教師付き異常検出手法を提案する。
当社のアプローチは、AUC-PRにおいて最先端の競合他社を20%-30%上回っている。
論文 参考訳(メタデータ) (2023-07-25T04:04:49Z) - Efficient Anomaly Detection with Budget Annotation Using Semi-Supervised
Residual Transformer [71.12751395582518]
異常検出は、通常、訓練中に通常のサンプルのみが見られ、検出器は飛行中の異常を検出する必要があるため、難しい。
最近提案されたディープラーニングベースのアプローチは、この問題を緩和する可能性があるが、実世界の応用のための産業レベルの異常検知器を得るには、まだまだ長い道のりがある。
論文 参考訳(メタデータ) (2023-06-06T08:19:30Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Anomaly Detection with Test Time Augmentation and Consistency Evaluation [13.709281244889691]
本稿では,TTA-AD(Test Time Augmentation Anomaly Detection)と呼ばれる簡易かつ効果的な異常検出アルゴリズムを提案する。
我々は、分散データよりもトレーニングされたネットワーク上でのオリジナルバージョンと拡張バージョンについて、分散データの方が一貫性のある予測を楽しむことを観察した。
様々な高解像度画像ベンチマークデータセットの実験は、TTA-ADが同等またはより良い検出性能を達成することを示した。
論文 参考訳(メタデータ) (2022-06-06T04:27:06Z) - From Unsupervised to Few-shot Graph Anomaly Detection: A Multi-scale
Contrastive Learning Approach [49.439021563395976]
グラフデータからの異常検出は、ソーシャルネットワーク、金融、eコマースなど、多くのアプリケーションにおいて重要なデータマイニングタスクである。
マルチスケールcONtrastive lEarning(略してANEMONE)を用いた新しいフレームワーク, graph Anomaly dEtection フレームワークを提案する。
グラフニューラルネットワークをバックボーンとして、複数のグラフスケール(ビュー)から情報をエンコードすることで、グラフ内のノードのより良い表現を学習する。
論文 参考訳(メタデータ) (2022-02-11T09:45:11Z) - Normality-Calibrated Autoencoder for Unsupervised Anomaly Detection on
Data Contamination [4.547161155818913]
正規度校正オートエンコーダ(NCAE)は、汚染されたデータセットの異常検出性能を高めることができる。
NCAEは、エントロピーの低い潜在空間から高信頼な正規サンプルを逆向きに生成する。
論文 参考訳(メタデータ) (2021-10-28T00:23:01Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - DAAIN: Detection of Anomalous and Adversarial Input using Normalizing
Flows [52.31831255787147]
我々は、アウト・オブ・ディストリビューション(OOD)インプットと敵攻撃(AA)を検出する新しい手法であるDAINを導入する。
本手法は,ニューラルネットワークの内部動作を監視し,活性化分布の密度推定器を学習する。
当社のモデルは,特別なアクセラレータを必要とせずに,効率的な計算とデプロイが可能な単一のGPUでトレーニングすることが可能です。
論文 参考訳(メタデータ) (2021-05-30T22:07:13Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Regularized Cycle Consistent Generative Adversarial Network for Anomaly
Detection [5.457279006229213]
本稿では, ニューラルネットワークを逆向きに訓練し, 異常なサンプルをよりよく認識するRCGAN(Regularized Cycle Consistent Generative Adversarial Network)を提案する。
実世界のデータと合成データの両方に対する実験結果から,我々のモデルが過去の異常検出ベンチマークにおいて有意かつ一貫した改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-01-18T03:35:05Z) - History-based Anomaly Detector: an Adversarial Approach to Anomaly
Detection [3.908842679355254]
異常検出は多くの領域で難しい問題であり、最近は多くの注目を集めている。
我々は,ヒストリーベースの異常検知器 (HistoryAD) と呼ばれる,この問題に対処するための,単純かつ新しい逆法を提案する。
自己教師型モデルで構成されており、以前に訓練されたGANのトレーニング履歴に基づいてサンプルと比較することで、正常なサンプルを認識するように訓練されている。
論文 参考訳(メタデータ) (2019-12-26T11:41:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。