論文の概要: RADICE: Causal Graph Based Root Cause Analysis for System Performance Diagnostic
- arxiv url: http://arxiv.org/abs/2501.11545v1
- Date: Mon, 20 Jan 2025 15:36:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:24:37.554365
- Title: RADICE: Causal Graph Based Root Cause Analysis for System Performance Diagnostic
- Title(参考訳): RADICE:システム性能診断のための因果グラフに基づく根元原因解析
- Authors: Andrea Tonon, Meng Zhang, Bora Caglayan, Fei Shen, Tong Gui, MingXue Wang, Rong Zhou,
- Abstract要約: ルート原因分析は、システムの性能診断に関して、ソフトウェア信頼性において最も重要な操作の1つである。
本稿では,システムコンポーネントの因果関係を表す新しい因果ドメイン知識モデルを提案する。
次に、因果グラフ発見、強化、洗練、減算処理を通じて根本原因因果部分グラフを出力するアルゴリズムRADICEを紹介する。
- 参考スコア(独自算出の注目度): 3.708415881042821
- License:
- Abstract: Root cause analysis is one of the most crucial operations in software reliability regarding system performance diagnostic. It aims to identify the root causes of system performance anomalies, allowing the resolution or the future prevention of issues that can cause millions of dollars in losses. Common existing approaches relying on data correlation or full domain expert knowledge are inaccurate or infeasible in most industrial cases, since correlation does not imply causation, and domain experts may not have full knowledge of complex and real-time systems. In this work, we define a novel causal domain knowledge model representing causal relations about the underlying system components to allow domain experts to contribute partial domain knowledge for root cause analysis. We then introduce RADICE, an algorithm that through the causal graph discovery, enhancement, refinement, and subtraction processes is able to output a root cause causal sub-graph showing the causal relations between the system components affected by the anomaly. We evaluated RADICE with simulated data and reported a real data use case, sharing the lessons we learned. The experiments show that RADICE provides better results than other baseline methods, including causal discovery algorithms and correlation based approaches for root cause analysis.
- Abstract(参考訳): ルート原因分析は、システムの性能診断に関して、ソフトウェア信頼性において最も重要な操作の1つである。
システムパフォーマンス異常の根本原因を特定することを目的としており、何百万ドルもの損失を引き起こす可能性のある問題の解決や今後の防止を可能にしている。
データ相関や完全なドメインエキスパートの知識に依存する一般的なアプローチは、ほとんどの産業の場合、相関が因果関係を示唆しないため、不正確または不可能であり、ドメインエキスパートは複雑でリアルタイムなシステムについて完全な知識を持っていないかもしれない。
本研究では,根本原因分析のためにドメインエキスパートが部分的ドメイン知識を貢献できるように,基礎となるシステムコンポーネントに関する因果関係を表す新たな因果ドメイン知識モデルを定義する。
次に, 因果グラフ発見, 強化, 改良, 減算処理を通じて, 異常に影響を受けるシステムコンポーネント間の因果関係を示す根本原因因果部分グラフを出力するアルゴリズムRADICEを紹介する。
我々は、RADICEをシミュレーションデータで評価し、実際のデータユースケースを報告し、学んだ教訓を共有した。
実験の結果,RADICEは根本原因分析のための因果探索アルゴリズムや相関に基づくアプローチなど,他の基準手法よりも優れた結果を提供することがわかった。
関連論文リスト
- Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - Root Cause Analysis for Microservice System based on Causal Inference: How Far Are We? [11.627235799040388]
マイクロサービスシステムに対する因果推論に基づく根本原因分析手法の包括的な評価を行う。
それぞれの手法は有効性、効率性に欠ける傾向にあり、特定のパラメータに対する感度を示す傾向にある。
論文 参考訳(メタデータ) (2024-08-25T05:53:42Z) - PORCA: Root Cause Analysis with Partially Observed Data [15.007249208547885]
ルート原因分析(RCA)は、複雑なシステムから因果構造を発見し解析することによって、システム障害の原因を特定することを目的としている。
以前の研究では、部分的な観察の効果を無視するシステムの全観察を暗黙的に仮定していた。
PORCAは、保存されていない共同創設者と保存されていない異質性の両方の下で、信頼性の高い根本原因を探索できる新しいRCAフレームワークである。
論文 参考訳(メタデータ) (2024-07-08T12:31:12Z) - On the Fly Detection of Root Causes from Observed Data with Application to IT Systems [3.3321350585823826]
本稿では,しきい値に基づくITシステムを表現するための構造因果モデルを提案する。
このようなシステムにおける異常の根本原因を迅速に検出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-09T16:10:19Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - PyRCA: A Library for Metric-based Root Cause Analysis [66.72542200701807]
PyRCAは、AIOps(AIOps)のためのRoot Cause Analysis(RCA)のオープンソースの機械学習ライブラリである。
複雑なメトリクス因果依存性を明らかにし、インシデントの根本原因を自動的に特定する、包括的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-06-20T09:55:10Z) - Disentangled Causal Graph Learning for Online Unsupervised Root Cause
Analysis [49.910053255238566]
ルート原因分析(RCA)は、システム監視データを分析することにより、システム障害/障害の根本原因を特定することができる。
従来の研究は主にオフラインのRCAアルゴリズムの開発に重点を置いており、しばしば手動でRCAプロセスを開始する必要がある。
我々は、RCAプロセスを自動的に起動し、RCAモデルを漸進的に更新できる新しいオンラインRCAフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2023-05-18T01:27:48Z) - DOMINO: Visual Causal Reasoning with Time-Dependent Phenomena [59.291745595756346]
本研究では,時間遅延のウィンドウに関連する因果関係の発見に人間が参加できる視覚分析手法を提案する。
具体的には、論理に基づく因果関係の確立した手法を活用し、分析者が潜在的な原因の重要性を検証できるようにする。
効果は他の効果の原因となりうるので,本手法で検出した時間的要因と効果の関係を視覚フロー図にまとめることができる。
論文 参考訳(メタデータ) (2023-03-12T03:40:21Z) - Hierarchical Graph Neural Networks for Causal Discovery and Root Cause
Localization [52.72490784720227]
REASONはTopological Causal DiscoveryとPersonal Causal Discoveryで構成されている。
Topological Causal Discoveryコンポーネントは、根本原因を辿るために断層伝播をモデル化することを目的としている。
個々の因果発見コンポーネントは、単一のシステムエンティティの突然の変化パターンのキャプチャに重点を置いている。
論文 参考訳(メタデータ) (2023-02-03T20:17:45Z) - Causal Inference-Based Root Cause Analysis for Online Service Systems
with Intervention Recognition [11.067832313491449]
本稿では,介入認識という新たな因果推論タスクとして根本原因分析問題を定式化する。
我々は、因果推論に基づく新しい教師なし因果推論手法、Causal Inference-based Root Cause Analysis (CIRCA)を提案する。
実世界のデータセットのパフォーマンスは、CIRCAが最高のベースラインメソッドよりも、トップ1レコメンデーションのリコールを25%改善できることを示している。
論文 参考訳(メタデータ) (2022-06-13T01:45:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。