論文の概要: Benchmarking Unsupervised Outlier Detection with Realistic Synthetic
Data
- arxiv url: http://arxiv.org/abs/2004.06947v1
- Date: Wed, 15 Apr 2020 08:55:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-13 02:56:42.008663
- Title: Benchmarking Unsupervised Outlier Detection with Realistic Synthetic
Data
- Title(参考訳): リアル合成データを用いた教師なし異常検出のベンチマーク
- Authors: Georg Steinbuss and Klemens B\"ohm
- Abstract要約: 教師なしの異常検出のベンチマークは難しい。
このようなベンチマークのためのデータセットを生成するための汎用的なプロセスを提案する。
本稿では,特定の特性を持つアウトレーヤを生成するジェネリックプロセスの3つのインスタンス化について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Benchmarking unsupervised outlier detection is difficult. Outliers are rare,
and existing benchmark data contains outliers with various and unknown
characteristics. Fully synthetic data usually consists of outliers and regular
instance with clear characteristics and thus allows for a more meaningful
evaluation of detection methods in principle. Nonetheless, there have only been
few attempts to include synthetic data in benchmarks for outlier detection.
This might be due to the imprecise notion of outliers or to the difficulty to
arrive at a good coverage of different domains with synthetic data. In this
work we propose a generic process for the generation of data sets for such
benchmarking. The core idea is to reconstruct regular instances from existing
real-world benchmark data while generating outliers so that they exhibit
insightful characteristics. This allows both for a good coverage of domains and
for helpful interpretations of results. We also describe three instantiations
of the generic process that generate outliers with specific characteristics,
like local outliers. A benchmark with state-of-the-art detection methods
confirms that our generic process is indeed practical.
- Abstract(参考訳): 教師なしの異常検出のベンチマークは難しい。
外乱はまれであり、既存のベンチマークデータは様々な特徴と未知の特徴を持つ外乱を含む。
完全な合成データは、通常、外れ値と明確な特徴を持つ通常のインスタンスで構成されており、原理的に検出方法のより有意義な評価を可能にする。
それでも、異常検出のためのベンチマークに合成データを含める試みはごくわずかである。
これは、不正確な外れ値の概念や、合成データで異なるドメインの適切なカバレッジに到達するのが難しいためかもしれない。
本研究では,このようなベンチマークのためのデータセット生成のための汎用プロセスを提案する。
コアとなるアイデアは、既存の実世界のベンチマークデータから通常のインスタンスを再構築し、異常値を生成して洞察に富んだ特性を示すことだ。
これにより、ドメインの優れたカバレッジと結果の有用な解釈の両方が可能になる。
また、局所的な外れ値のような特定の特性を持つ外れ値を生成する一般的なプロセスの3つのインスタンス化についても述べる。
最先端検出手法を用いたベンチマークでは,本手法が実用的であることを確認した。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Late Stopping: Avoiding Confidently Learning from Mislabeled Examples [61.00103151680946]
そこで本研究では,DNNの長期学習プロセスを通じて,本質的な頑健な学習能力を生かした新しいフレームワークであるLatlas Stoppingを提案する。
誤ラベルとクリーンな例は、それらが一貫して正しく分類されるために必要なエポックの数に相違があることを実証的に観察する。
ベンチマークシミュレーションと実世界のノイズデータセットによる実験結果から,提案手法は最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-26T12:43:25Z) - DeepfakeBench: A Comprehensive Benchmark of Deepfake Detection [55.70982767084996]
ディープフェイク検出の分野で見落とされがちな課題は、標準化され、統一され、包括的なベンチマークがないことである。
DeepfakeBenchと呼ばれる,3つの重要なコントリビューションを提供するディープフェイク検出のための,最初の包括的なベンチマークを提示する。
DeepfakeBenchには15の最先端検出方法、9CLデータセット、一連のDeepfake検出評価プロトコルと分析ツール、包括的な評価ツールが含まれている。
論文 参考訳(メタデータ) (2023-07-04T01:34:41Z) - On the Universal Adversarial Perturbations for Efficient Data-free
Adversarial Detection [55.73320979733527]
本稿では,UAPに対して正常サンプルと逆サンプルの異なる応答を誘導する,データに依存しない逆検出フレームワークを提案する。
実験結果から,本手法は様々なテキスト分類タスクにおいて,競合検出性能を実現することが示された。
論文 参考訳(メタデータ) (2023-06-27T02:54:07Z) - Normalizing Flow based Feature Synthesis for Outlier-Aware Object
Detection [8.249143014271887]
Faster R-CNNのような汎用オブジェクト検出器は、外れ値のオブジェクトに対して過信的な予測を提供する傾向にある。
我々は,不整形オブジェクトと不整形オブジェクトを区別する,新しい不整形オブジェクト検出フレームワークを提案する。
提案手法は,画像データとビデオデータの両方において,外部認識オブジェクト検出の最先端性を大幅に向上させる。
論文 参考訳(メタデータ) (2023-02-01T13:12:00Z) - C-AllOut: Catching & Calling Outliers by Type [10.69970450827617]
C-AllOutは、型別に外れ値に注釈を付ける新しい外れ値検出器である。
パラメータフリーでスケーラブルであり、必要であればペアワイズな類似点(あるいは距離)でのみ動作する。
論文 参考訳(メタデータ) (2021-10-13T14:25:52Z) - Unsupervised Outlier Detection using Memory and Contrastive Learning [53.77693158251706]
特徴空間における外乱検出は,外乱検出から外乱検出までの特徴距離を測定することで行うことができると考えている。
本稿では,メモリモジュールとコントラスト学習モジュールを用いたMCODフレームワークを提案する。
提案したMCODは高い性能を達成し,9つの最先端手法より優れる。
論文 参考訳(メタデータ) (2021-07-27T07:35:42Z) - Homophily Outlier Detection in Non-IID Categorical Data [43.51919113927003]
この研究は、新しい外れ値検出フレームワークとその2つのインスタンスを導入し、カテゴリデータの外れ値を特定する。
まず、分布に敏感な外部因子とその相互依存性を値値グラフベースの表現に定義し、組み込む。
学習した値の外れ度は、直接の外れ値検出または特徴選択の除外を可能にする。
論文 参考訳(メタデータ) (2021-03-21T23:29:33Z) - Anomaly Detection based on Zero-Shot Outlier Synthesis and Hierarchical
Feature Distillation [2.580765958706854]
合成生成された異常は、そのような不適切なデータに対する解決策である。
Inliersの特徴記述子を蒸留する2階層階層型潜在空間表現を提案する。
トレーニングデータの外側にあるものを,合成外乱発生器として選択する。
論文 参考訳(メタデータ) (2020-10-10T23:34:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。