論文の概要: Exathlon: A Benchmark for Explainable Anomaly Detection over Time Series
- arxiv url: http://arxiv.org/abs/2010.05073v3
- Date: Sun, 5 Sep 2021 22:03:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 23:28:26.034014
- Title: Exathlon: A Benchmark for Explainable Anomaly Detection over Time Series
- Title(参考訳): exathlon: 時系列で説明可能な異常検出のためのベンチマーク
- Authors: Vincent Jacob, Fei Song, Arnaud Stiegler, Bijan Rad, Yanlei Diao,
Nesime Tatbul
- Abstract要約: 本稿では,高次元時系列データを用いた説明可能な異常検出のための最初のベンチマークであるExathlonを提案する。
Exathlonは、Apache Sparkクラスタ上で大規模なストリーム処理ジョブを繰り返し実行する実際のデータトレースに基づいて構築されている。
各異常事例について、根本原因区間の接地真理ラベルと、延長効果区間の接地真理ラベルとを設ける。
- 参考スコア(独自算出の注目度): 6.085662888748731
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Access to high-quality data repositories and benchmarks have been
instrumental in advancing the state of the art in many experimental research
domains. While advanced analytics tasks over time series data have been gaining
lots of attention, lack of such community resources severely limits scientific
progress. In this paper, we present Exathlon, the first comprehensive public
benchmark for explainable anomaly detection over high-dimensional time series
data. Exathlon has been systematically constructed based on real data traces
from repeated executions of large-scale stream processing jobs on an Apache
Spark cluster. Some of these executions were intentionally disturbed by
introducing instances of six different types of anomalous events (e.g.,
misbehaving inputs, resource contention, process failures). For each of the
anomaly instances, ground truth labels for the root cause interval as well as
those for the extended effect interval are provided, supporting the development
and evaluation of a wide range of anomaly detection (AD) and explanation
discovery (ED) tasks. We demonstrate the practical utility of Exathlon's
dataset, evaluation methodology, and end-to-end data science pipeline design
through an experimental study with three state-of-the-art AD and ED techniques.
- Abstract(参考訳): 高品質なデータリポジトリやベンチマークへのアクセスは、多くの実験研究領域における最先端技術の発展に寄与している。
時系列データによる高度な分析タスクが注目されている一方で、そのようなコミュニティリソースの欠如は科学的進歩を著しく制限している。
本稿では,高次元時系列データ上で説明可能な異常検出を行う最初の総合ベンチマークであるexathlonを提案する。
exathlonは、apache sparkクラスタで大規模ストリーム処理ジョブを繰り返し実行する実際のデータトレースに基づいて、体系的に構築されている。
これらの実行のいくつかは、6種類の異常なイベント(例えば、誤動作、リソース競合、プロセス障害)のインスタンスを導入することで意図的に妨げられた。
各異常インスタンスに対して、広い範囲の異常検出(ad)および説明発見(ed)タスクの開発と評価を支援するとともに、根本原因区間及び拡張効果区間の基底真理ラベルを提供する。
本稿では,Exathlon のデータセット,評価手法,エンドツーエンドデータサイエンスパイプライン設計の実用性を,AD と ED の3つの最先端技術を用いた実験により実証する。
関連論文リスト
- See it, Think it, Sorted: Large Multimodal Models are Few-shot Time Series Anomaly Analyzers [23.701716999879636]
時系列データの急激な増加に伴い,時系列異常検出(TSAD)はますます重要になりつつある。
本稿では,TMA(Time Series Anomaly Multimodal Analyzer)と呼ばれる先駆的なフレームワークを導入し,異常の検出と解釈を両立させる。
論文 参考訳(メタデータ) (2024-11-04T10:28:41Z) - Online Model-based Anomaly Detection in Multivariate Time Series: Taxonomy, Survey, Research Challenges and Future Directions [0.017476232824732776]
時系列異常検出は、エンジニアリングプロセスにおいて重要な役割を果たす。
この調査では、オンラインとオフラインの区別とトレーニングと推論を行う新しい分類法を紹介した。
文献で使用される最も一般的なデータセットと評価指標、および詳細な分析を示す。
論文 参考訳(メタデータ) (2024-08-07T13:01:10Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [52.228708947607636]
本稿では,新しい手法のモジュラーフレームワークであるADerを包括的視覚異常検出ベンチマークとして紹介する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Graph Spatiotemporal Process for Multivariate Time Series Anomaly
Detection with Missing Values [67.76168547245237]
本稿では,グラフ時間過程と異常スコアラを用いて異常を検出するGST-Proという新しいフレームワークを提案する。
実験結果から,GST-Pro法は時系列データ中の異常を効果的に検出し,最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-01-11T10:10:16Z) - Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - A Critical Review of Common Log Data Sets Used for Evaluation of
Sequence-based Anomaly Detection Techniques [2.5339493426758906]
6つの公開ログデータセットを解析し,異常の顕在化と検出のための簡単な手法に着目した。
以上の結果から,ほとんどの異常は逐次的出現とは直接関係がなく,これらのデータセットに対して高い検出率を達成するために高度な検出技術は必要ないことが示唆された。
論文 参考訳(メタデータ) (2023-09-06T09:31:17Z) - DIVERSIFY: A General Framework for Time Series Out-of-distribution
Detection and Generalization [58.704753031608625]
時系列は、機械学習研究における最も困難なモダリティの1つである。
時系列上でのOODの検出と一般化は、その非定常性によって悩まされる傾向がある。
時系列の動的分布のOOD検出と一般化のためのフレームワークであるDIVERSIFYを提案する。
論文 参考訳(メタデータ) (2023-08-04T12:27:11Z) - Sintel: A Machine Learning Framework to Extract Insights from Signals [13.04826679898367]
Sintelは、異常検出などのエンドツーエンドの時系列タスクのための機械学習フレームワークである。
Sintelは異常検出の全ジャーニーをログし、時間とともに異常の詳細なドキュメントを提供する。
ユーザは、インタラクティブな視覚化ツールを使って、信号を分析し、メソッドを比較し、異常を調査できる。
論文 参考訳(メタデータ) (2022-04-19T19:38:27Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。