論文の概要: Revisiting OmniAnomaly for Anomaly Detection: performance metrics and comparison with PCA-based models
- arxiv url: http://arxiv.org/abs/2603.18985v1
- Date: Thu, 19 Mar 2026 14:54:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-20 17:19:06.209674
- Title: Revisiting OmniAnomaly for Anomaly Detection: performance metrics and comparison with PCA-based models
- Title(参考訳): 異常検出のためのOmniAnomalyの再検討:性能指標とPCAモデルとの比較
- Authors: Bruna Alves, Ana Martins, Armando J. Pinho, Sónia Gouveia,
- Abstract要約: この研究は、MSSADの広く使われているリカレントモデルであるOmniAnomalyを再検討し、主成分分析に基づく単純な線形ベースラインと比較する。
どちらの手法もしきい値と評価手順で評価され、データセット内の28台のマシン毎に100回のラン毎に実験が繰り返される。
その結果,OmniAnomalyに匹敵する性能を達成でき,点調整が適用されない場合にも性能が向上することを示した。
- 参考スコア(独自算出の注目度): 0.08155575318208629
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning models have become the dominant approach for multivariate time series anomaly detection (MTSAD), often reporting substantial performance improvements over classical statistical methods. However, these gains are frequently evaluated under heterogeneous thresholding strategies and evaluation protocols, making fair comparisons difficult. This work revisits OmniAnomaly, a widely used stochastic recurrent model for MTSAD, and systematically compares it with a simple linear baseline based on Principal Component Analysis (PCA) on the Server Machine Dataset (SMD). Both methods are evaluated under identical thresholding and evaluation procedures, with experiments repeated across 100 runs for each of the 28 machines in the dataset. Performance is evaluated using Precision, Recall and F1-score at point-level, with and without point-adjustment, and under different aggregation strategies across machines and runs, with the corresponding standard deviations also reported. The results show large variability across machines and show that PCA can achieve performance comparable to OmniAnomaly, and even outperform it when point-adjustment is not applied. These findings question the added value of more complex architectures under current benchmarking practices and highlight the critical role of evaluation methodology in MTSAD research.
- Abstract(参考訳): 深層学習モデルは多変量時系列異常検出(MTSAD)において支配的なアプローチとなり、古典的な統計手法よりもかなりの性能向上を報告している。
しかし、これらの利得は不均一なしきい値と評価プロトコルの下で頻繁に評価され、公正な比較が困難になる。
この研究は、MSSADの確率的リカレントモデルであるOmniAnomalyを再検討し、サーバマシンデータセット(SMD)上の主成分分析(PCA)に基づく単純な線形ベースラインと体系的に比較する。
どちらの手法も同一のしきい値と評価手順で評価され、データセット内の28マシン毎に100回のラン毎に実験が繰り返される。
性能は、ポイントレベルの精度、リコール、F1スコアで評価され、ポイント調整なしで、マシンや実行中の異なるアグリゲーション戦略の下で評価され、対応する標準偏差も報告されている。
その結果,PCA は OmniAnomaly に匹敵する性能を達成でき,点調整が適用されない場合には性能も向上できることがわかった。
これらの結果は、現在のベンチマークプラクティスの下で、より複雑なアーキテクチャの付加価値を疑問視し、MSSAD研究における評価方法論の重要性を強調した。
関連論文リスト
- Causal Effect Estimation with TMLE: Handling Missing Data and Near-Violations of Positivity [1.1546538067103258]
欠損データシナリオにおける平均処理効果を推定する目的最大推定(TMLE)の性能を評価する。
我々はモデルと設計に基づくシミュレーションを採用し、後者は'WASHベネフィットバングラデシュ'データセット上で、アンダースムースな高度適応型ラッソを用いています。
解析手法としてTMLEと組み合わせて8つの欠落データ手法を比較し,非多重命令法(non-MI)と多重命令法(multiple imputation,MI)を区別する。
論文 参考訳(メタデータ) (2025-10-25T08:01:55Z) - KG-EDAS: A Meta-Metric Framework for Evaluating Knowledge Graph Completion Models [0.0]
知識グラフ(KG)を評価する上での大きな課題は、複数のデータセットとメトリクスのパフォーマンスを比較することだ。
我々は,平均解からの距離に基づくKG評価を提案し,マルチメトリック・マルチデータセットのパフォーマンスを統一的なランキングに組み込む。
EDASは、より情報のあるモデル選択をサポートし、データセット間の評価において公平性を促進するグローバルな視点を提供する。
論文 参考訳(メタデータ) (2025-08-21T08:37:35Z) - Generalization is not a universal guarantee: Estimating similarity to training data with an ensemble out-of-distribution metric [0.09363323206192666]
機械学習モデルの新しいデータへの一般化の失敗は、AIシステムの信頼性を制限する中核的な問題である。
本稿では、一般化可能性推定(SAGE)のための教師付きオートエンコーダを構築することにより、データの類似性を評価するための標準化されたアプローチを提案する。
モデル自体のトレーニングやテストデータセットのデータに適用しても,SAGEスコアのフィルタリング後にアウト・オブ・ボックスモデルの性能が向上することを示す。
論文 参考訳(メタデータ) (2025-02-22T19:21:50Z) - Revisiting BPR: A Replicability Study of a Common Recommender System Baseline [78.00363373925758]
我々は,BPRモデルの特徴を考察し,その性能への影響を示し,オープンソースのBPR実装について検討する。
分析の結果,これらの実装とオリジナルのBPR論文の矛盾が明らかとなり,特定の実装に対して最大50%の性能低下がみられた。
BPRモデルは、トップnのレコメンデーションタスクにおける最先端メソッドに近いパフォーマンスレベルを達成でき、特定のデータセット上でもパフォーマンスが向上することを示す。
論文 参考訳(メタデータ) (2024-09-21T18:39:53Z) - Learning Feature Inversion for Multi-class Anomaly Detection under General-purpose COCO-AD Benchmark [101.23684938489413]
異常検出(AD)は、しばしば産業品質検査や医学的病変検査のための異常の検出に焦点が当てられている。
この研究はまず、COCOをADフィールドに拡張することにより、大規模で汎用的なCOCO-ADデータセットを構築する。
セグメンテーション分野のメトリクスにインスパイアされた我々は、より実用的なしきい値に依存したAD固有のメトリクスをいくつか提案する。
論文 参考訳(メタデータ) (2024-04-16T17:38:26Z) - Consensus-Adaptive RANSAC [104.87576373187426]
本稿では,パラメータ空間の探索を学習する新しいRANSACフレームワークを提案する。
注意機構は、ポイント・ツー・モデル残差のバッチで動作し、軽量のワンステップ・トランスフォーマーで見いだされたコンセンサスを考慮するために、ポイント・ツー・モデル推定状態を更新する。
論文 参考訳(メタデータ) (2023-07-26T08:25:46Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Doing Great at Estimating CATE? On the Neglected Assumptions in
Benchmark Comparisons of Treatment Effect Estimators [91.3755431537592]
もっとも単純な設定であっても、無知性仮定に基づく推定は誤解を招く可能性があることを示す。
異種処理効果評価のための機械学習ベンチマークデータセットを2つ検討した。
ベンチマークデータセットの固有の特性が、他のものよりもいくつかのアルゴリズムを好んでいる点を強調します。
論文 参考訳(メタデータ) (2021-07-28T13:21:27Z) - Model-based clustering of partial records [11.193504036335503]
観測値の限界密度を用いたモデルベースの手法でクラスタリング手法を開発しています。
提案アルゴリズムは,不完全データセットの欠落値を考慮した,対応する全期待最大化(EM)手法と比較する。
シミュレーション研究により,本手法は実クラスタ分割の回復に有利であることが示された。
論文 参考訳(メタデータ) (2021-03-30T13:30:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。