論文の概要: Benchmarking Anomaly Detection Across Heterogeneous Cloud Telemetry Datasets
- arxiv url: http://arxiv.org/abs/2602.13288v1
- Date: Sat, 07 Feb 2026 21:42:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:27.816156
- Title: Benchmarking Anomaly Detection Across Heterogeneous Cloud Telemetry Datasets
- Title(参考訳): 不均一クラウドテレメトリデータセット間のベンチマーク異常検出
- Authors: Mohammad Saiful Islam, Andriy Miranskyy,
- Abstract要約: GRU,TCN,Transformer,TSMixerの4つのディープラーニングモデルを評価する。
モデルは4つのテレメトリデータセットでテストされる。
すべてのデータセットに統一的なトレーニングと評価パイプラインを使用します。
- 参考スコア(独自算出の注目度): 0.5442955439283729
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Anomaly detection is important for keeping cloud systems reliable and stable. Deep learning has improved time-series anomaly detection, but most models are evaluated on one dataset at a time. This raises questions about whether these models can handle different types of telemetry, especially in large-scale and high-dimensional environments. In this study, we evaluate four deep learning models, GRU, TCN, Transformer, and TSMixer. We also include Isolation Forest as a classical baseline. The models are tested across four telemetry datasets: the Numenta Anomaly Benchmark, Microsoft Cloud Monitoring dataset, Exathlon dataset, and IBM Console dataset. These datasets differ in structure, dimensionality, and labelling strategy. They include univariate time series, synthetic multivariate workloads, and real-world production telemetry with over 100,000 features. We use a unified training and evaluation pipeline across all datasets. The evaluation includes NAB-style metrics to capture early detection behaviour for datasets where anomalies persist over contiguous time intervals. This enables window-based scoring in settings where anomalies occur over contiguous time intervals, even when labels are recorded at the point level. The unified setup enables consistent analysis of model behaviour under shared scoring and calibration assumptions. Our results demonstrate that anomaly detection performance in cloud systems is governed not only by model architecture, but critically by calibration stability and feature-space geometry. By releasing our preprocessing pipelines, benchmark configuration, and evaluation artifacts, we aim to support reproducible and deployment-aware evaluation of anomaly detection systems for cloud environments.
- Abstract(参考訳): クラウドシステムの信頼性と安定性を維持するためには,異常検出が重要である。
ディープラーニングは時系列異常検出を改善したが、ほとんどのモデルは一度に1つのデータセットで評価される。
このことは、特に大規模および高次元環境において、これらのモデルが異なるタイプのテレメトリを扱えるかどうかという疑問を提起する。
本研究では,GRU,TCN,Transformer,TSMixerの4つのディープラーニングモデルを評価する。
また、古典的な基準線として孤立林も含んでいる。
これらのモデルは、Numenta Anomaly Benchmark、Microsoft Cloud Monitoringデータセット、Exathlonデータセット、IBM Consoleデータセットの4つのテレメトリデータセットでテストされている。
これらのデータセットは、構造、次元、ラベル付け戦略が異なる。
これには、単変量時系列、合成多変量ワークロード、および10万以上の機能を持つ実世界のテレメトリが含まれる。
すべてのデータセットに統一的なトレーニングと評価パイプラインを使用します。
評価にはNABスタイルのメトリクスが含まれており、連続した時間間隔で異常が持続するデータセットの早期検出動作をキャプチャする。
これにより、ラベルがポイントレベルで記録されている場合でも、連続した時間間隔で異常が発生するような設定でのウィンドウベースのスコアリングが可能になる。
統一された設定は、共有スコアリングとキャリブレーションの仮定の下でモデルの振る舞いを一貫した分析を可能にする。
この結果から, クラウドシステムにおける異常検出性能は, モデルアーキテクチャだけでなく, キャリブレーション安定性と特徴空間幾何によっても支配されていることがわかった。
プレプロセスパイプライン,ベンチマーク構成,評価成果物をリリースすることにより,クラウド環境における異常検出システムの再現性とデプロイメント対応評価を支援することを目指しています。
関連論文リスト
- It's TIME: Towards the Next Generation of Time Series Forecasting Benchmarks [87.7937890373758]
時系列基礎モデル(TSFM)は,特定のデータセットモデルから一般化可能なタスク評価に至るまで,予測環境に革命をもたらしている。
我々は、50の新しいデータセットと98の予測タスクからなる次世代タスク中心のベンチマークであるTIMEを紹介する。
静的なメタラベルに基づく従来のデータセットレベルの評価を超える新しいパターンレベルの評価視点を提案する。
論文 参考訳(メタデータ) (2026-02-12T16:31:01Z) - No One-Model-Fits-All: Uncovering Spatio-Temporal Forecasting Trade-offs with Graph Neural Networks and Foundation Models [8.918505166222875]
本研究は,空間センサ密度とサンプリング間隔の異なる予測モデルについて,系統的研究を行った。
以上の結果から,STGはセンサ配置が小さく,サンプリングレートが適度である場合に有効であることが示唆された。
重要なことは、TSFMは高周波で競合するが、隣り合うセンサーからの空間被覆が減少すると劣化する。
論文 参考訳(メタデータ) (2025-11-07T11:50:39Z) - CALM: A Framework for Continuous, Adaptive, and LLM-Mediated Anomaly Detection in Time-Series Streams [0.42970700836450476]
本稿では,リアルタイム異常検出のための新しいエンドツーエンドフレームワークであるCALMを紹介する。
CALMはApache Beam分散処理フレームワーク上に構築されている。
クローズドループで連続的な微調整機構を実装し、異常検出モデルがほぼリアルタイムで進化するデータパターンに適応できるようにする。
論文 参考訳(メタデータ) (2025-08-29T00:27:35Z) - A Dataset for Semantic Segmentation in the Presence of Unknowns [49.795683850385956]
既存のデータセットは、既知のものや未知のもののみの評価を可能にするが、両方ではない。
乱雑な実環境からの多様な異常な入力を特徴とする,新しい異常セグメンテーションデータセットISSUを提案する。
データセットは、既存の異常セグメンテーションデータセットの2倍大きい。
論文 参考訳(メタデータ) (2025-03-28T10:31:01Z) - PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - An Automated Machine Learning Approach for Detecting Anomalous Peak
Patterns in Time Series Data from a Research Watershed in the Northeastern
United States Critical Zone [3.1747517745997014]
本稿では,米国北東部臨界水域におけるセンサによる時系列データの異常検出を支援する機械学習フレームワークを提案する。
このフレームワークは特に、センサーの故障や自然現象から生じるピークパターンの異常を識別することに焦点を当てている。
論文 参考訳(メタデータ) (2023-09-14T19:07:50Z) - AnomalyBERT: Self-Supervised Transformer for Time Series Anomaly
Detection using Data Degradation Scheme [0.7216399430290167]
時系列、特にラベルなしデータに対する異常検出タスクは、難しい問題である。
自己教師型モデルトレーニングに適切なデータ劣化スキームを適用することで、この問題に対処する。
自己認識機構に触発されて、時間的文脈を認識するトランスフォーマーベースのアーキテクチャを設計する。
論文 参考訳(メタデータ) (2023-05-08T05:42:24Z) - DEGAN: Time Series Anomaly Detection using Generative Adversarial
Network Discriminators and Density Estimation [0.0]
我々は,GANに基づく異常検出フレームワークDEGANを提案する。
これは、適切に構成された識別器(D)をスタンドアロンの異常予測器に訓練するための入力として、通常の時系列データにのみ依存する。
論文 参考訳(メタデータ) (2022-10-05T04:32:12Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z) - Anomaly Detection of Time Series with Smoothness-Inducing Sequential
Variational Auto-Encoder [59.69303945834122]
Smoothness-Inducing Sequential Variational Auto-Encoder (SISVAE) モデルを提案する。
我々のモデルは、フレキシブルニューラルネットワークを用いて各タイムスタンプの平均と分散をパラメータ化する。
合成データセットと公開実世界のベンチマークの両方において,本モデルの有効性を示す。
論文 参考訳(メタデータ) (2021-02-02T06:15:15Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。