論文の概要: GAL-MAD: Towards Explainable Anomaly Detection in Microservice Applications Using Graph Attention Networks
- arxiv url: http://arxiv.org/abs/2504.00058v1
- Date: Mon, 31 Mar 2025 10:11:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-03 13:26:02.957413
- Title: GAL-MAD: Towards Explainable Anomaly Detection in Microservice Applications Using Graph Attention Networks
- Title(参考訳): GAL-MAD:グラフアテンションネットワークを用いたマイクロサービスアプリケーションにおける説明可能な異常検出に向けて
- Authors: Lahiru Akmeemana, Chamodya Attanayake, Husni Faiz, Sandareka Wickramanayake,
- Abstract要約: ネットワークとパフォーマンスの問題に起因する異常は素早く特定され、対処されなければならない。
既存の異常検出技術は統計モデルや機械学習手法に依存していることが多い。
グラフ注意とLSTMに基づくマイクロサービス異常検出(GAL-MAD)と呼ばれる新しい異常検出モデルを提案する。
- 参考スコア(独自算出の注目度): 1.0136215038345013
- License:
- Abstract: The transition to microservices has revolutionized software architectures, offering enhanced scalability and modularity. However, the distributed and dynamic nature of microservices introduces complexities in ensuring system reliability, making anomaly detection crucial for maintaining performance and functionality. Anomalies stemming from network and performance issues must be swiftly identified and addressed. Existing anomaly detection techniques often rely on statistical models or machine learning methods that struggle with the high-dimensional, interdependent data inherent in microservice applications. Current techniques and available datasets predominantly focus on system traces and logs, limiting their ability to support advanced detection models. This paper addresses these gaps by introducing the RS-Anomic dataset generated using the open-source RobotShop microservice application. The dataset captures multivariate performance metrics and response times under normal and anomalous conditions, encompassing ten types of anomalies. We propose a novel anomaly detection model called Graph Attention and LSTM-based Microservice Anomaly Detection (GAL-MAD), leveraging Graph Attention and Long Short-Term Memory architectures to capture spatial and temporal dependencies in microservices. We utilize SHAP values to localize anomalous services and identify root causes to enhance explainability. Experimental results demonstrate that GAL-MAD outperforms state-of-the-art models on the RS-Anomic dataset, achieving higher accuracy and recall across varying anomaly rates. The explanations provide actionable insights into service anomalies, which benefits system administrators.
- Abstract(参考訳): マイクロサービスへの移行はソフトウェアアーキテクチャに革命をもたらし、拡張されたスケーラビリティとモジュール化を提供する。
しかしながら、マイクロサービスの分散および動的性質は、システムの信頼性を保証する複雑さを導入し、異常検出をパフォーマンスと機能の維持に不可欠にする。
ネットワークとパフォーマンスの問題に起因する異常は素早く特定され、対処されなければならない。
既存の異常検出技術は、しばしば、マイクロサービスアプリケーション固有の高次元の相互依存データに苦労する統計モデルや機械学習手法に依存している。
現在の技術と利用可能なデータセットは、主にシステムトレースとログに焦点を当て、高度な検出モデルをサポートする能力を制限する。
本稿では、オープンソースのRobotShopマイクロサービスアプリケーションを用いて生成されたRS-Anomicデータセットを導入することにより、これらのギャップに対処する。
このデータセットは、正常および異常な条件下での多変量パフォーマンスメトリクスとレスポンスタイムをキャプチャし、10種類の異常を含む。
本稿では,グラフアテンションとLSTMに基づくマイクロサービス異常検出(GAL-MAD)と呼ばれる新しい異常検出モデルを提案する。
我々はSHAP値を用いて異常なサービスをローカライズし、説明可能性を高めるために根本原因を特定する。
実験の結果、GAL-MADはRS-Anomicデータセットの最先端モデルより優れており、精度が高く、様々な異常率でリコールできることがわかった。
この説明は、システム管理者に利益をもたらすサービス異常に関する実用的な洞察を提供する。
関連論文リスト
- LLM Assisted Anomaly Detection Service for Site Reliability Engineers: Enhancing Cloud Infrastructure Resilience [5.644170923282226]
本稿では,産業時系列データに適した汎用APIを備えたスケーラブルな異常検出サービスを提案する。
サービスの利用パターンに関する洞察を提供しています。年間500人以上のユーザと20万のAPIコールがあります。
時系列基礎モデルを含むシステムを拡張し、ゼロショット異常検出機能を実現する計画である。
論文 参考訳(メタデータ) (2025-01-28T06:41:37Z) - Transformer-based Multivariate Time Series Anomaly Localization [5.554794295879246]
時空間異常スコア(英: Space-Time Anomaly Score、STAS)は、変圧器の潜在表現と時空間統計モデルとの接続にインスパイアされた新しい計量である。
統計的特徴異常スコア(SFAS)は、異常に関する統計的特徴を分析してSTASを補完し、それらの組み合わせは誤報を減らすのに役立つ。
実世界の実験と合成データセットは、検出タスクとローカライゼーションタスクの両方において、最先端の手法よりもモデルの方が優れていることを示している。
論文 参考訳(メタデータ) (2025-01-15T07:18:51Z) - CHASE: A Causal Heterogeneous Graph based Framework for Root Cause Analysis in Multimodal Microservice Systems [22.00860661894853]
マルチモーダルデータを持つマイクロサービスシステムにおける根本原因解析,すなわちCHASEのための因数不均一なgraAph baSed framEworkを提案する。
CHASEは、因果関係の流れを表すハイパーエッジを持つ構築されたハイパーグラフから学習し、根本原因の局在を実行する。
論文 参考訳(メタデータ) (2024-06-28T07:46:51Z) - ARC: A Generalist Graph Anomaly Detector with In-Context Learning [62.202323209244]
ARCは汎用的なGADアプローチであり、一対一のGADモデルで様々なグラフデータセットの異常を検出することができる。
ARCはコンテキスト内学習を備えており、ターゲットデータセットからデータセット固有のパターンを直接抽出することができる。
各種領域からの複数のベンチマークデータセットに対する大規模な実験は、ARCの優れた異常検出性能、効率、一般化性を示す。
論文 参考訳(メタデータ) (2024-05-27T02:42:33Z) - Multitask Active Learning for Graph Anomaly Detection [48.690169078479116]
MultItask acTIve Graph Anomaly Detection framework,すなわちMITIGATEを提案する。
ノード分類タスクを結合することにより、MITIGATEは既知の異常を伴わずに配布外ノードを検出する能力を得る。
4つのデータセットに関する実証的研究は、MITIGATEが異常検出のための最先端の手法を著しく上回っていることを示している。
論文 参考訳(メタデータ) (2024-01-24T03:43:45Z) - PREM: A Simple Yet Effective Approach for Node-Level Graph Anomaly
Detection [65.24854366973794]
ノードレベルのグラフ異常検出(GAD)は、医学、ソーシャルネットワーク、eコマースなどの分野におけるグラフ構造化データから異常ノードを特定する上で重要な役割を果たす。
本稿では,GADの効率を向上させるために,PREM (preprocessing and Matching) という簡単な手法を提案する。
我々のアプローチは、強力な異常検出機能を維持しながら、GADを合理化し、時間とメモリ消費を削減します。
論文 参考訳(メタデータ) (2023-10-18T02:59:57Z) - Twin Graph-based Anomaly Detection via Attentive Multi-Modal Learning
for Microservice System [24.2074235652359]
我々は,マルチモーダル学習を通じて利用可能なすべてのデータモダリティをシームレスに統合するMSTGADを提案する。
本研究では,異なるモーダル間の相関関係をモデル化するために,空間的および時間的注意機構を備えたトランスフォーマーベースニューラルネットワークを構築した。
これにより、リアルタイムで自動的かつ正確に異常を検出することができる。
論文 参考訳(メタデータ) (2023-10-07T06:28:41Z) - An Outlier Exposure Approach to Improve Visual Anomaly Detection
Performance for Mobile Robots [76.36017224414523]
移動ロボットの視覚異常検出システム構築の問題点を考察する。
標準異常検出モデルは、非異常データのみからなる大規模なデータセットを用いて訓練される。
本研究では,これらのデータを利用してリアルNVP異常検出モデルの性能向上を図る。
論文 参考訳(メタデータ) (2022-09-20T15:18:13Z) - DAE : Discriminatory Auto-Encoder for multivariate time-series anomaly
detection in air transportation [68.8204255655161]
識別オートエンコーダ(DAE)と呼ばれる新しい異常検出モデルを提案する。
通常のLSTMベースのオートエンコーダのベースラインを使用するが、いくつかのデコーダがあり、それぞれ特定の飛行フェーズのデータを取得する。
その結果,DAEは精度と検出速度の両方で良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-09-08T14:07:55Z) - TELESTO: A Graph Neural Network Model for Anomaly Classification in
Cloud Services [77.454688257702]
機械学習(ML)と人工知能(AI)はITシステムの運用とメンテナンスに適用される。
1つの方向は、修復自動化を可能にするために、繰り返し発生する異常タイプを認識することである。
与えられたデータの次元変化に不変な手法を提案する。
論文 参考訳(メタデータ) (2021-02-25T14:24:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。