論文の概要: Performance Issue Identification in Cloud Systems with
Relational-Temporal Anomaly Detection
- arxiv url: http://arxiv.org/abs/2307.10869v2
- Date: Tue, 1 Aug 2023 07:04:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 22:10:03.855442
- Title: Performance Issue Identification in Cloud Systems with
Relational-Temporal Anomaly Detection
- Title(参考訳): 関係時間異常検出を含むクラウドシステムの性能問題同定
- Authors: Wenwei Gu, Jinyang Liu, Zhuangbin Chen, Jianping Zhang, Yuxin Su,
Jiazhen Gu, Cong Feng, Zengyin Yang and Michael Lyu
- Abstract要約: パフォーマンス上の問題は、大規模なクラウドサービスシステムに浸透し、大きな収益損失をもたらす可能性がある。
信頼性の高いパフォーマンスを保証するためには、サービス監視メトリクスを使用してこれらの問題を正確に識別することが不可欠です。
いくつかの既存手法は、異常を検出するために各計量を独立に解析することでこの問題に対処している。
- 参考スコア(独自算出の注目度): 5.473091770227683
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Performance issues permeate large-scale cloud service systems, which can lead
to huge revenue losses. To ensure reliable performance, it's essential to
accurately identify and localize these issues using service monitoring metrics.
Given the complexity and scale of modern cloud systems, this task can be
challenging and may require extensive expertise and resources beyond the
capacity of individual humans. Some existing methods tackle this problem by
analyzing each metric independently to detect anomalies. However, this could
incur overwhelming alert storms that are difficult for engineers to diagnose
manually. To pursue better performance, not only the temporal patterns of
metrics but also the correlation between metrics (i.e., relational patterns)
should be considered, which can be formulated as a multivariate metrics anomaly
detection problem. However, most of the studies fall short of extracting these
two types of features explicitly. Moreover, there exist some unlabeled
anomalies mixed in the training data, which may hinder the detection
performance. To address these limitations, we propose the Relational- Temporal
Anomaly Detection Model (RTAnomaly) that combines the relational and temporal
information of metrics. RTAnomaly employs a graph attention layer to learn the
dependencies among metrics, which will further help pinpoint the anomalous
metrics that may cause the anomaly effectively. In addition, we exploit the
concept of positive unlabeled learning to address the issue of potential
anomalies in the training data. To evaluate our method, we conduct experiments
on a public dataset and two industrial datasets. RTAnomaly outperforms all the
baseline models by achieving an average F1 score of 0.929 and Hit@3 of 0.920,
demonstrating its superiority.
- Abstract(参考訳): パフォーマンス問題は、大規模なクラウドサービスシステムに浸透し、大きな収益損失につながる可能性がある。
信頼性の高いパフォーマンスを保証するためには、サービス監視メトリクスを使用してこれらの問題を正確に識別し、ローカライズする必要がある。
現代のクラウドシステムの複雑さと規模を考えると、このタスクは困難であり、個々の人間の能力を超えた幅広い専門知識とリソースを必要とする可能性がある。
既存の手法では、各メトリックを独立して分析して異常を検出することでこの問題に対処している。
しかし、これはエンジニアが手動で診断することが難しい圧倒的な警報嵐を引き起こす可能性がある。
より良いパフォーマンスを追求するためには、メトリクスの時間的パターンだけでなく、メトリクス(リレーショナルパターン)間の相関も考慮し、多変量メトリクス異常検出問題として定式化する必要がある。
しかし、ほとんどの研究はこれらの2種類の特徴を明示的に抽出するに足りていない。
さらに、トレーニングデータ中にラベルのない異常が混在しており、検出性能を損なう可能性がある。
これらの制約に対処するために,メトリクスの相関情報と時間情報を組み合わせた関係時間異常検出モデル(RTAnomaly)を提案する。
RTAnomalyは、メトリクス間の依存関係を学習するためにグラフアテンション層を使用し、異常を効果的に発生させる可能性のある異常メトリクスの特定をさらに助ける。
さらに、ポジティブなラベルなし学習の概念を利用して、トレーニングデータの潜在的な異常の問題に対処する。
提案手法を評価するため,公開データセットと2つの産業データセットを用いて実験を行った。
RTAnomaly は、平均 F1 スコア 0.929 と Hit@3 0.920 を達成し、その優位性を示している。
関連論文リスト
- Unraveling the "Anomaly" in Time Series Anomaly Detection: A
Self-supervised Tri-domain Solution [89.16750999704969]
異常ラベルは時系列異常検出において従来の教師付きモデルを妨げる。
自己教師型学習のような様々なSOTA深層学習技術がこの問題に対処するために導入されている。
自己教師型3領域異常検出器(TriAD)を提案する。
論文 参考訳(メタデータ) (2023-11-19T05:37:18Z) - Self-supervised Learning for Anomaly Detection in Computational
Workflows [10.39119516144685]
我々は、ラベルのないワークフローデータから要約統計を学習する自動エンコーダ駆動型自己教師学習(SSL)アプローチを導入する。
提案手法では,合成学習目標とコントラスト学習目標を組み合わせて,要約統計における外れ値を検出する。
潜在空間における正常な挙動の分布を推定することにより、我々のベンチマークデータセットにおける最先端の異常検出方法より優れていることを示す。
論文 参考訳(メタデータ) (2023-10-02T14:31:56Z) - Practical Anomaly Detection over Multivariate Monitoring Metrics for
Online Services [29.37493773435177]
CMAnomalyは、協調マシンに基づく多変量モニタリングメトリクスの異常検出フレームワークである。
提案するフレームワークは,Huawei Cloudの大規模オンラインサービスシステムから収集した公開データと産業データの両方で広く評価されている。
最先端のベースラインモデルと比較して、CMAnomalyは平均F1スコア0.9494を達成し、ベースラインの6.77%から10.68%を上回り、10倍から20倍速く走る。
論文 参考訳(メタデータ) (2023-08-19T08:08:05Z) - WePaMaDM-Outlier Detection: Weighted Outlier Detection using Pattern
Approaches for Mass Data Mining [0.6754597324022876]
外乱検出は、システム障害、不正行為、およびデータ内のパターンに関する重要な情報を明らかにすることができる。
本稿では、異なる質量データマイニング領域を持つWePaMaDM-Outlier Detectionを提案する。
また, 監視, 故障検出, 傾向解析において, 異常検出技術におけるデータモデリングの重要性についても検討した。
論文 参考訳(メタデータ) (2023-06-09T07:00:00Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - TranAD: Deep Transformer Networks for Anomaly Detection in Multivariate
Time Series Data [13.864161788250856]
TranADはディープトランスネットワークに基づく異常検出および診断モデルである。
注意に基づくシーケンスエンコーダを使用して、データ内のより広い時間的傾向の知識を迅速に推論する。
TranADは、データと時間効率のトレーニングによる検出と診断のパフォーマンスにおいて、最先端のベースラインメソッドよりも優れています。
論文 参考訳(メタデータ) (2022-01-18T19:41:29Z) - A2Log: Attentive Augmented Log Anomaly Detection [53.06341151551106]
異常検出は、ITサービスの信頼性とサービス性にとってますます重要になる。
既存の教師なし手法は、適切な決定境界を得るために異常な例を必要とする。
我々は,異常判定と異常判定の2段階からなる教師なし異常検出手法であるA2Logを開発した。
論文 参考訳(メタデータ) (2021-09-20T13:40:21Z) - Graph Neural Network-Based Anomaly Detection in Multivariate Time Series [17.414474298706416]
我々は,高次元時系列データにおける異常を検出する新しい方法を開発した。
我々のアプローチは、構造学習アプローチとグラフニューラルネットワークを組み合わせている。
本研究では,本手法がベースラインアプローチよりも高精度に異常を検出することを示す。
論文 参考訳(メタデータ) (2021-06-13T09:07:30Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z) - TadGAN: Time Series Anomaly Detection Using Generative Adversarial
Networks [73.01104041298031]
TadGANは、GAN(Generative Adversarial Networks)上に構築された教師なしの異常検出手法である。
時系列の時間相関を捉えるために,ジェネレータと批評家のベースモデルとしてLSTMリカレントニューラルネットワークを用いる。
提案手法の性能と一般化性を示すため,いくつかの異常スコアリング手法を検証し,最も適した手法を報告する。
論文 参考訳(メタデータ) (2020-09-16T15:52:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。