論文の概要: Robust Learning of Deep Time Series Anomaly Detection Models with
Contaminated Training Data
- arxiv url: http://arxiv.org/abs/2208.01841v1
- Date: Wed, 3 Aug 2022 04:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-04 14:01:17.746971
- Title: Robust Learning of Deep Time Series Anomaly Detection Models with
Contaminated Training Data
- Title(参考訳): 汚染トレーニングデータを用いた深部時系列異常検出モデルのロバスト学習
- Authors: Wenkai Li, Cheng Feng, Ting Chen, Jun Zhu
- Abstract要約: 時系列異常検出(TSAD)は、IoT時代の多くのアプリケーションにおいて重要なデータマイニングタスクである。
ディープTSADメソッドは通常、基礎となるダイナミクスの"正規プロファイル"を学ぶために、異常によって汚染されないクリーンなトレーニングデータセットに依存します。
本研究では,潜在的に汚染されたデータを用いて,メインストリームの深部TSADモデルの堅牢性を効果的に向上するモデルに依存しない手法を提案する。
- 参考スコア(独自算出の注目度): 29.808942473293108
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Time series anomaly detection (TSAD) is an important data mining task with
numerous applications in the IoT era. In recent years, a large number of deep
neural network-based methods have been proposed, demonstrating significantly
better performance than conventional methods on addressing challenging TSAD
problems in a variety of areas. Nevertheless, these deep TSAD methods typically
rely on a clean training dataset that is not polluted by anomalies to learn the
"normal profile" of the underlying dynamics. This requirement is nontrivial
since a clean dataset can hardly be provided in practice. Moreover, without the
awareness of their robustness, blindly applying deep TSAD methods with
potentially contaminated training data can possibly incur significant
performance degradation in the detection phase. In this work, to tackle this
important challenge, we firstly investigate the robustness of commonly used
deep TSAD methods with contaminated training data which provides a guideline
for applying these methods when the provided training data are not guaranteed
to be anomaly-free. Furthermore, we propose a model-agnostic method which can
effectively improve the robustness of learning mainstream deep TSAD models with
potentially contaminated data. Experiment results show that our method can
consistently prevent or mitigate performance degradation of mainstream deep
TSAD models on widely used benchmark datasets.
- Abstract(参考訳): 時系列異常検出(TSAD)はIoT時代の多くのアプリケーションにおいて重要なデータマイニングタスクである。
近年、深層ニューラルネットワークに基づく手法が多数提案されており、様々な領域におけるtsad問題に対処する従来の手法よりもかなり優れた性能を示している。
それにもかかわらず、これらの深いtsadメソッドは通常、基礎となるダイナミクスの"通常のプロファイル"を学ぶために異常によって汚染されないクリーンなトレーニングデータセットに依存している。
クリーンなデータセットを実際に提供できないため、この要件は簡単ではない。
さらに、その頑健さを意識せずに、潜在的に汚染されたトレーニングデータを用いた深部TSAD法を盲目的に適用することで、検出フェーズにおいて大幅な性能劣化を引き起こす可能性がある。
そこで本研究では,本研究の課題である深層tsad法のロバスト性について,まず,提供されるトレーニングデータが異常のない場合に適用するためのガイドラインを提供する汚染トレーニングデータを用いて検討する。
さらに, 汚染される可能性のあるデータを用いて, 主流の深層tsadモデルのロバスト性を効果的に改善できるモデル非依存手法を提案する。
実験結果から,本手法は広く使用されているベンチマークデータセット上で,メインストリームの深部TSADモデルの性能劣化を継続的に防止・緩和できることが示された。
関連論文リスト
- Unsupervised Anomaly Detection for Tabular Data Using Noise Evaluation [26.312206159418903]
教師なし異常検出(UAD)は、現代のデータ分析において重要な役割を果たす。
データに含まれるノイズの量を評価することによって,新しいUAD手法を提案する。
提案手法が異常データの検出に有効であることを証明し,理論的保証を提供する。
論文 参考訳(メタデータ) (2024-12-16T05:35:58Z) - Transferring self-supervised pre-trained models for SHM data anomaly detection with scarce labeled data [45.031249077732745]
自己指導型学習(SSL)は、教師なしの事前学習と教師なしの微調整を組み合わせた新興パラダイムである。
SSL技術によりデータ異常検出性能が向上し、従来の教師付きトレーニングに比べてF1スコアが向上した。
本研究は、大規模SHMデータに対するSSL技術の有効性と優位性を示し、ラベル情報の少ない予備異常検出のための効率的なツールを提供する。
論文 参考訳(メタデータ) (2024-12-05T05:25:30Z) - Deep evolving semi-supervised anomaly detection [14.027613461156864]
本研究の目的は,連続的半教師付き異常検出(CSAD)のタスクを形式化することである。
本稿では,半教師付きデータを扱うための変分オートエンコーダ(VAE)のベースラインモデルを提案する。
論文 参考訳(メタデータ) (2024-12-01T15:48:37Z) - Reliable Deep Diffusion Tensor Estimation: Rethinking the Power of Data-Driven Optimization Routine [17.516054970588137]
本研究では,データ駆動型最適化手法であるDoDTIを紹介する。
提案手法はDTIパラメータ推定における最先端性能を実現する。
特に、より優れた一般化、精度、効率を示し、この分野の幅広い応用に高い信頼性を与えている。
論文 参考訳(メタデータ) (2024-09-04T07:35:12Z) - Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - Efficient Deep Reinforcement Learning Requires Regulating Overfitting [91.88004732618381]
本稿では,高時間差(TD)誤差が深部RLアルゴリズムの性能に悪影響を及ぼす主要な原因であることを示す。
検証TDエラーをターゲットとした簡単なオンラインモデル選択法は,状態ベースDMCおよびGymタスク間で有効であることを示す。
論文 参考訳(メタデータ) (2023-04-20T17:11:05Z) - Dataset Distillation: A Comprehensive Review [76.26276286545284]
データセット蒸留(DD)は、トレーニングされたモデルが元のデータセットでトレーニングされたデータセットに匹敵するパフォーマンスを得るために、合成サンプルを含むはるかに小さなデータセットを導出することを目的としている。
本稿ではDDの最近の進歩とその応用について概説する。
論文 参考訳(メタデータ) (2023-01-17T17:03:28Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Distributed Dynamic Safe Screening Algorithms for Sparse Regularization [73.85961005970222]
本稿では,分散動的安全スクリーニング(DDSS)手法を提案し,共有メモリアーキテクチャと分散メモリアーキテクチャにそれぞれ適用する。
提案手法は, 線形収束率を低次複雑度で達成し, 有限個の繰り返しにおいてほとんどすべての不活性な特徴をほぼ確実に除去できることを示す。
論文 参考訳(メタデータ) (2022-04-23T02:45:55Z) - TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate
Time Series Data [13.864161788250856]
TranADはディープトランスネットワークに基づく異常検出および診断モデルである。
注意に基づくシーケンスエンコーダを使用して、データ内のより広い時間的傾向の知識を迅速に推論する。
TranADは、データと時間効率のトレーニングによる検出と診断のパフォーマンスにおいて、最先端のベースラインメソッドよりも優れています。
論文 参考訳(メタデータ) (2022-01-18T19:41:29Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。