論文の概要: Current Time Series Anomaly Detection Benchmarks are Flawed and are
Creating the Illusion of Progress
- arxiv url: http://arxiv.org/abs/2009.13807v5
- Date: Sat, 3 Sep 2022 04:46:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 05:26:43.624519
- Title: Current Time Series Anomaly Detection Benchmarks are Flawed and are
Creating the Illusion of Progress
- Title(参考訳): 現在の時系列異常検出ベンチマークは欠陥があり、進歩の錯覚を生み出している
- Authors: Renjie Wu, Eamonn J. Keogh
- Abstract要約: UCR Time Series Anomaly Archiveを紹介する。
このリソースは、UCR Time Series Classification Archiveと同じような役割を果たす。
- 参考スコア(独自算出の注目度): 11.689905300531917
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Time series anomaly detection has been a perennially important topic in data
science, with papers dating back to the 1950s. However, in recent years there
has been an explosion of interest in this topic, much of it driven by the
success of deep learning in other domains and for other time series tasks. Most
of these papers test on one or more of a handful of popular benchmark datasets,
created by Yahoo, Numenta, NASA, etc. In this work we make a surprising claim.
The majority of the individual exemplars in these datasets suffer from one or
more of four flaws. Because of these four flaws, we believe that many published
comparisons of anomaly detection algorithms may be unreliable, and more
importantly, much of the apparent progress in recent years may be illusionary.
In addition to demonstrating these claims, with this paper we introduce the UCR
Time Series Anomaly Archive. We believe that this resource will perform a
similar role as the UCR Time Series Classification Archive, by providing the
community with a benchmark that allows meaningful comparisons between
approaches and a meaningful gauge of overall progress.
- Abstract(参考訳): 時系列異常検出はデータサイエンスにおいて長年にわたって重要な話題であり、論文は1950年代までさかのぼる。
しかし、近年はこの話題に対する関心が爆発的に高まり、その多くは他のドメインでのディープラーニングの成功や、他の時系列タスクによるものである。
これらの論文のほとんどは、yahoo、numenta、nasaなどによって作成された、人気のあるベンチマークデータセットの1つ以上でテストされている。
この作品では驚くべき主張をする。
これらのデータセットの個々のインスタンスの大多数は、4つ以上の欠陥に苦しむ。
これら4つの欠陥のため、多くの公表された異常検出アルゴリズムの比較は信頼性が低く、さらに重要なことは、近年の明らかな進歩の多くは幻想的なものだと考えている。
本稿では,これらの主張の実証に加えて,UCR Time Series Anomaly Archiveを紹介する。
我々は、このリソースがUCR Time Series Classification Archiveと同じような役割を果たすと信じており、コミュニティにアプローチ間の有意義な比較と全体的な進捗の有意義な指標を可能にするベンチマークを提供する。
関連論文リスト
- Online Model-based Anomaly Detection in Multivariate Time Series: Taxonomy, Survey, Research Challenges and Future Directions [0.017476232824732776]
時系列異常検出は、エンジニアリングプロセスにおいて重要な役割を果たす。
この調査では、オンラインとオフラインの区別とトレーニングと推論を行う新しい分類法を紹介した。
文献で使用される最も一般的なデータセットと評価指標、および詳細な分析を示す。
論文 参考訳(メタデータ) (2024-08-07T13:01:10Z) - Too Good To Be True: performance overestimation in (re)current practices
for Human Activity Recognition [49.1574468325115]
データセグメンテーションのためのスライディングウィンドウと、標準のランダムk倍のクロスバリデーションが続くと、バイアスのある結果が得られる。
この問題に対する科学界の認識を高めることは重要であり、その否定的な影響は見落とされつつある。
異なるタイプのデータセットと異なるタイプの分類モデルを用いたいくつかの実験により、問題を示し、メソッドやデータセットとは独立して持続することを示すことができる。
論文 参考訳(メタデータ) (2023-10-18T13:24:05Z) - Image Classification with Small Datasets: Overview and Benchmark [0.0]
私たちは過去の研究を体系的に組織化し、結合し、現在分断され散らばっているコミュニティを統合する。
本稿では,アプローチの客観的比較を可能にする共通ベンチマークを提案する。
このベンチマークを用いて、標準のクロスエントロピーベースラインと、有名な会場で2017年から2021年にかけて発行された10の既存手法を再評価する。
論文 参考訳(メタデータ) (2022-12-23T17:11:16Z) - Are we certain it's anomalous? [57.729669157989235]
時系列における異常検出は、高度に非線形な時間的相関のため、異常は稀であるため、複雑なタスクである。
本稿では,異常検出(HypAD)におけるハイパボリック不確実性の新しい利用法を提案する。
HypADは自己指導で入力信号を再構築する。
論文 参考訳(メタデータ) (2022-11-16T21:31:39Z) - Geodesics, Non-linearities and the Archive of Novelty Search [69.6462706723023]
このアーカイブの重要な効果は、不適切な行動指標の使用による探索バイアスと相反することである。
我々の観察は、サンプリングにおいてアーカイブにより積極的な役割を担っていることが有益であることを示しているように思われる。
論文 参考訳(メタデータ) (2022-05-06T12:03:40Z) - Time Series Analysis via Network Science: Concepts and Algorithms [62.997667081978825]
本稿では,時系列をネットワークに変換する既存のマッピング手法について概観する。
我々は、主要な概念的アプローチを説明し、権威的な参照を提供し、統一された表記法と言語におけるそれらの利点と限界について洞察を与える。
ごく最近の研究だが、この研究領域には大きな可能性を秘めており、今後の研究の道を開くことを目的としている。
論文 参考訳(メタデータ) (2021-10-11T13:33:18Z) - A Large-Scale Study on Unsupervised Spatiotemporal Representation
Learning [60.720251418816815]
本稿では,ビデオからの教師なし表現学習に関する大規模研究を行う。
目的は同じビデオにおける時間的特徴を奨励する。
長時間持続を奨励することは,60秒であっても有効であることがわかった。
論文 参考訳(メタデータ) (2021-04-29T17:59:53Z) - Uncertain Time Series Classification With Shapelet Transform [1.4467794332678539]
時系列分類は時系列データの分類を目的とした課題である。
ユークリッド距離に基づく新しい不確実な相似性尺度を提案する。
そこで,不確実な時系列の分類のための不確実な形状変換アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-03T14:46:01Z) - Exathlon: A Benchmark for Explainable Anomaly Detection over Time Series [6.085662888748731]
本稿では,高次元時系列データを用いた説明可能な異常検出のための最初のベンチマークであるExathlonを提案する。
Exathlonは、Apache Sparkクラスタ上で大規模なストリーム処理ジョブを繰り返し実行する実際のデータトレースに基づいて構築されている。
各異常事例について、根本原因区間の接地真理ラベルと、延長効果区間の接地真理ラベルとを設ける。
論文 参考訳(メタデータ) (2020-10-10T19:31:22Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z) - Monash University, UEA, UCR Time Series Extrinsic Regression Archive [6.5513221781395465]
我々は,最初のTSERベンチマークアーカイブを導入することで,TSER(Time Series Extrinsic Regression)の研究のモチベーションと支援を目指している。
このアーカイブには、異なるドメインから19のデータセットが含まれており、さまざまな次元、不等長次元、欠落値がある。
本稿では,このアーカイブにデータセットを導入し,既存のモデルに対する初期ベンチマークを行った。
論文 参考訳(メタデータ) (2020-06-19T07:47:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。