論文の概要: Unsupervised Model Selection for Time-series Anomaly Detection
- arxiv url: http://arxiv.org/abs/2210.01078v1
- Date: Mon, 3 Oct 2022 16:49:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 16:46:45.245382
- Title: Unsupervised Model Selection for Time-series Anomaly Detection
- Title(参考訳): 時系列異常検出のための教師なしモデル選択
- Authors: Mononito Goswami, Cristian Challu, Laurent Callot, Lenon Minorics,
Andrey Kan
- Abstract要約: 提案手法は, 予測誤差, モデル中心性, および, 注入された合成異常に対する性能の3種類のサロゲート(教師なし)メトリクスを同定する。
我々は、厳密なランク集約問題として、複数の不完全なサロゲート指標との計量結合を定式化する。
複数の実世界のデータセットに対する大規模な実験は、我々の提案した教師なしアプローチが、最も正確なモデルを選択するのと同じくらい効果的であることを示す。
- 参考スコア(独自算出の注目度): 7.8027110514393785
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Anomaly detection in time-series has a wide range of practical applications.
While numerous anomaly detection methods have been proposed in the literature,
a recent survey concluded that no single method is the most accurate across
various datasets. To make matters worse, anomaly labels are scarce and rarely
available in practice. The practical problem of selecting the most accurate
model for a given dataset without labels has received little attention in the
literature. This paper answers this question i.e. Given an unlabeled dataset
and a set of candidate anomaly detectors, how can we select the most accurate
model? To this end, we identify three classes of surrogate (unsupervised)
metrics, namely, prediction error, model centrality, and performance on
injected synthetic anomalies, and show that some metrics are highly correlated
with standard supervised anomaly detection performance metrics such as the
$F_1$ score, but to varying degrees. We formulate metric combination with
multiple imperfect surrogate metrics as a robust rank aggregation problem. We
then provide theoretical justification behind the proposed approach.
Large-scale experiments on multiple real-world datasets demonstrate that our
proposed unsupervised approach is as effective as selecting the most accurate
model based on partially labeled data.
- Abstract(参考訳): 時系列における異常検出は、幅広い実用的応用がある。
文献で多くの異常検出法が提案されているが、最近の調査では、様々なデータセットで最も正確な方法は1つもないと結論付けている。
さらに悪いことに、異常ラベルは少なく、実際に利用できない。
ラベルのないデータセットの最も正確なモデルを選択するという現実的な問題は、文献ではほとんど注目されていない。
本稿では,ラベルのないデータセットと候補異常検出器が与えられた場合,最も正確なモデルを選択するにはどうすればよいか,という疑問に答える。
この目的のために, 予測誤差, モデル中心性, および注入された合成異常に対する性能の3つのサロゲート(教師なし)指標を同定し, 標準教師あり異常検出性能指標($f_1$スコアなど)と高い相関関係を示した。
我々は,複数の不完全サロゲートメトリクスと計量の組み合わせをロバストなランクアグリゲーション問題として定式化する。
次に、提案手法の理論的正当性を示す。
複数の実世界のデータセットにおける大規模実験により,提案手法は,ラベル付きデータに基づいて最も正確なモデルを選択するのと同じくらい有効であることが示された。
関連論文リスト
- An Iterative Method for Unsupervised Robust Anomaly Detection Under Data
Contamination [24.74938110451834]
ほとんどの深層異常検出モデルは、データセットから正規性を学ぶことに基づいている。
実際、正規性仮定は実データ分布の性質によってしばしば破られる。
このギャップを減らし、より優れた正規性表現を実現するための学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T02:36:19Z) - Few-shot Anomaly Detection in Text with Deviation Learning [13.957106119614213]
偏差学習を用いたエンドツーエンド手法で異常スコアを明示的に学習するフレームワークであるFATEを紹介する。
本モデルは,マルチヘッド・セルフアテンション・レイヤと複数インスタンス・ラーニング・アプローチを用いて,異常の異なる振る舞いを学習するために最適化されている。
論文 参考訳(メタデータ) (2023-08-22T20:40:21Z) - Hard Nominal Example-aware Template Mutual Matching for Industrial
Anomaly Detection [74.9262846410559]
textbfHard Nominal textbfExample-aware textbfTemplate textbfMutual textbfMatching (HETMM)
textitHETMMは、厳密なプロトタイプベースの決定境界を構築することを目的としており、ハードノミナルな例と異常を正確に区別することができる。
論文 参考訳(メタデータ) (2023-03-28T17:54:56Z) - Active Learning by Feature Mixing [52.16150629234465]
本稿では,ALFA-Mixと呼ばれるバッチ能動学習手法を提案する。
予測の不整合を求めることにより,不整合な特徴を持つインスタンスを同定する。
これらの予測の不整合は、モデルが未認識のインスタンスで認識できない特徴を発見するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-14T12:20:54Z) - Latent Outlier Exposure for Anomaly Detection with Contaminated Data [31.446666264334528]
異常検出は、ラベルなしデータセットの大多数のデータから体系的なずれを示すデータポイントを特定することを目的としている。
本稿では,広範囲のモデルと互換性のあるラベルのない異常が存在する場合に,異常検知器を訓練するための戦略を提案する。
論文 参考訳(メタデータ) (2022-02-16T14:21:28Z) - Explainable Deep Few-shot Anomaly Detection with Deviation Networks [123.46611927225963]
本稿では,弱い教師付き異常検出フレームワークを導入し,検出モデルを訓練する。
提案手法は,ラベル付き異常と事前確率を活用することにより,識別正規性を学習する。
我々のモデルはサンプル効率が高く頑健であり、クローズドセットとオープンセットの両方の設定において最先端の競合手法よりもはるかに優れている。
論文 参考訳(メタデータ) (2021-08-01T14:33:17Z) - Self-Trained One-class Classification for Unsupervised Anomaly Detection [56.35424872736276]
異常検出(AD)は、製造から医療まで、さまざまな分野に応用されている。
本研究は、トレーニングデータ全体がラベル付けされておらず、正規サンプルと異常サンプルの両方を含む可能性のある、教師なしAD問題に焦点を当てる。
この問題に対処するため,データリファインメントによる堅牢な一級分類フレームワークを構築した。
本手法は6.3AUCと12.5AUCの平均精度で最先端の1クラス分類法より優れていることを示す。
論文 参考訳(メタデータ) (2021-06-11T01:36:08Z) - Time Series Anomaly Detection with label-free Model Selection [0.6303112417588329]
ラベルのない時系列データに対するラベルなしモデル選択を用いた新しい異常検出アルゴリズムであるLaF-ADを提案する。
我々のアルゴリズムは容易に並列化可能であり、不条件データや季節データに対してより堅牢であり、多数の異常モデルに対して非常にスケーラブルである。
論文 参考訳(メタデータ) (2021-06-11T00:21:06Z) - Toward Deep Supervised Anomaly Detection: Reinforcement Learning from
Partially Labeled Anomaly Data [150.9270911031327]
本稿では,一部のラベル付き異常事例と大規模ラベルなしデータセットを用いた異常検出の問題点について考察する。
既存の関連手法は、通常、一連の異常にまたがらない限られた異常例にのみ適合するか、ラベルのないデータから教師なしの学習を進めるかのいずれかである。
そこで本研究では,ラベル付きおよびラベルなし両方の異常の検出をエンドツーエンドに最適化する,深層強化学習に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2020-09-15T03:05:39Z) - Unsupervised Anomaly Detection with Adversarial Mirrored AutoEncoders [51.691585766702744]
本稿では,識別器のミラー化ワッサースタイン損失を利用して,よりセマンティックレベルの再構築を行う逆自動エンコーダの変種を提案する。
我々は,再建基準の代替として,異常スコアの代替尺度を提案した。
提案手法は,OOD検出ベンチマークにおける異常検出の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2020-03-24T08:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。