論文の概要: DQE: A Semantic-Aware Evaluation Metric for Time Series Anomaly Detection
- arxiv url: http://arxiv.org/abs/2603.06131v1
- Date: Fri, 06 Mar 2026 10:38:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:45.514215
- Title: DQE: A Semantic-Aware Evaluation Metric for Time Series Anomaly Detection
- Title(参考訳): DQE:時系列異常検出のための意味認識評価指標
- Authors: Yuewei Li, Dalin Zhang, Huan Li, Xinyi Gong, Hongjun Chu, Zhaohui Song,
- Abstract要約: 本稿では,検出セマンティクスの観点から時系列異常検出の評価を再考する。
検出セマンティクスに基づく分割戦略を導入し、各異常の局所時間領域を3つの機能的に異なる部分領域に分解する。
このパーティショニングを用いて、イベント全体の検出挙動を評価し、各サブリージョンに対してよりきめ細かいスコアリング機構を設計し、より信頼性と解釈可能な評価を可能にする。
- 参考スコア(独自算出の注目度): 10.700735533120257
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Time series anomaly detection has achieved remarkable progress in recent years. However, evaluation practices have received comparatively less attention, despite their critical importance. Existing metrics exhibit several limitations: (1) bias toward point-level coverage, (2) insensitivity or inconsistency in near-miss detections, (3) inadequate penalization of false alarms, and (4) inconsistency caused by threshold or threshold-interval selection. These limitations can produce unreliable or counterintuitive results, hindering objective progress. In this work, we revisit the evaluation of time series anomaly detection from the perspective of detection semantics and propose a novel metric for more comprehensive assessment. We first introduce a partitioning strategy grounded in detection semantics, which decomposes the local temporal region of each anomaly into three functionally distinct subregions. Using this partitioning, we evaluate overall detection behavior across events and design finer-grained scoring mechanisms for each subregion, enabling more reliable and interpretable assessment. Through a systematic study of existing metrics, we identify an evaluation bias associated with threshold-interval selection and adopt an approach that aggregates detection qualities across the full threshold spectrum, thereby eliminating evaluation inconsistency. Extensive experiments on synthetic and real-world data demonstrate that our metric provides stable, discriminative, and interpretable evaluation, while achieving robust assessment compared with ten widely used metrics.
- Abstract(参考訳): 近年,時系列異常検出は顕著な進歩を遂げている。
しかし、評価の実践は、その重要な重要性にもかかわらず、比較的注目を集めていない。
既存の指標には、(1)点レベルのカバレッジに対するバイアス、(2)近距離検出における不感度または不整合、(3)偽アラームの不十分なペナル化、(4)閾値またはしきい値間隔選択による不整合など、いくつかの制限がある。
これらの制限は信頼できない、あるいは直感に反する結果をもたらし、客観的な進歩を妨げる。
本研究では,検出セマンティクスの観点から時系列異常検出の評価を再考し,より包括的な評価のための新しい指標を提案する。
まず、各異常の局所時間領域を3つの機能的に異なる部分領域に分解する、検出セマンティクスに基づく分割戦略を導入する。
このパーティショニングを用いて、イベント全体の検出挙動を評価し、各サブリージョンに対してよりきめ細かいスコアリング機構を設計し、より信頼性と解釈可能な評価を可能にする。
既存の指標の体系的な研究を通じて、しきい値-区間選択に関連する評価バイアスを特定し、全しきい値スペクトルにわたって検出品質を集約し、不整合を除去するアプローチを採用する。
人工的および実世界のデータに対する大規模な実験により、我々の測定値が安定的で差別的で解釈可能な評価を提供する一方で、広く使用されている10の指標と比較して頑健な評価を達成できることが示されている。
関連論文リスト
- A Problem-Oriented Taxonomy of Evaluation Metrics for Time Series Anomaly Detection [11.114573387946498]
時系列異常検出は、IoTやサイバー物理システムで広く使われている。
本研究は, 既存のメトリクスを再解釈する問題指向フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-24T04:09:04Z) - Rethinking Metrics and Benchmarks of Video Anomaly Detection [58.37571339811799]
ビデオ異常検出(VAD)は、期待から外れた異常を検出することを目的としている。
既存のVADメトリクスは、単一のアノテーションバイアスの影響を受けます。
既存のベンチマークには、完全に/弱い教師付きアルゴリズムのシーンオーバーフィットを評価する能力がない。
論文 参考訳(メタデータ) (2025-05-25T08:09:42Z) - OIPR: Evaluation for Time-series Anomaly Detection Inspired by Operator Interest [26.460594836601004]
我々は,OIPRと呼ばれる時系列異常検出評価指標を新たに提案する。
OIPRは、オペレーターが検出アラームを受信し、障害を処理し、オペレーターの関心曲線の下の領域を利用してTADアルゴリズムの性能を評価する過程をモデル化する。
ポイントパースペクティブとイベントパースペクティブのバランスを達成し、主要な制限を克服し、より広い状況に適用性を提供します。
論文 参考訳(メタデータ) (2025-03-03T07:37:24Z) - A Comprehensive Library for Benchmarking Multi-class Visual Anomaly Detection [89.92916473403108]
本稿では,新しい手法のモジュラーフレームワークであるADerの総合的な視覚異常検出ベンチマークを提案する。
このベンチマークには、産業ドメインと医療ドメインからの複数のデータセットが含まれており、15の最先端メソッドと9つの包括的なメトリクスを実装している。
我々は,異なる手法の長所と短所を客観的に明らかにし,多クラス視覚異常検出の課題と今後の方向性について考察する。
論文 参考訳(メタデータ) (2024-06-05T13:40:07Z) - On Pixel-level Performance Assessment in Anomaly Detection [87.7131059062292]
異常検出法は様々な応用において顕著な成功を収めている。
しかし、特にピクセルレベルでのパフォーマンスを評価することは複雑な課題である。
本稿では,視覚的エビデンスと統計的分析により,この課題の複雑さを解明する。
論文 参考訳(メタデータ) (2023-10-25T08:02:27Z) - SoftED: Metrics for Soft Evaluation of Time Series Event Detection [4.139895427110409]
時系列イベント検出法は,検出精度にのみ焦点をあてた標準分類基準によって評価される。
事象を検出する不正確さは、しばしば、隣り合う検出に反映される先行または遅延効果によって生じる。
本稿では,イベント検出手法のソフトアセスメントのために設計された,新しいメトリクスセットであるSoftEDメトリクスを紹介する。
論文 参考訳(メタデータ) (2023-04-02T03:27:31Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - Unsupervised Anomaly Detection in Time-series: An Extensive Evaluation and Analysis of State-of-the-art Methods [10.618572317896515]
時系列における教師なし異常検出は文献で広く研究されている。
本稿では,近年の時系列における教師なし異常検出手法の詳細な評価手法を提案する。
論文 参考訳(メタデータ) (2022-12-06T15:05:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。