論文の概要: KGroot: Enhancing Root Cause Analysis through Knowledge Graphs and Graph
Convolutional Neural Networks
- arxiv url: http://arxiv.org/abs/2402.13264v1
- Date: Sun, 11 Feb 2024 10:30:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-25 16:53:36.913626
- Title: KGroot: Enhancing Root Cause Analysis through Knowledge Graphs and Graph
Convolutional Neural Networks
- Title(参考訳): KGroot:知識グラフとグラフ畳み込みニューラルネットワークによる根本原因分析の強化
- Authors: Tingting Wang, Guilin Qi, Tianxing Wu
- Abstract要約: KGrootはイベント知識とイベント間の相関を使って根本原因推論を行う。
実験では、KGrootは第2レベルにおいて93.5%の確率で根本原因を特定できることを示した。
- 参考スコア(独自算出の注目度): 14.336830860792707
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fault localization is challenging in online micro-service due to the wide
variety of monitoring data volume, types, events and complex interdependencies
in service and components. Faults events in services are propagative and can
trigger a cascade of alerts in a short period of time. In the industry, fault
localization is typically conducted manually by experienced personnel. This
reliance on experience is unreliable and lacks automation. Different modules
present information barriers during manual localization, making it difficult to
quickly align during urgent faults. This inefficiency lags stability assurance
to minimize fault detection and repair time. Though actionable methods aimed to
automatic the process, the accuracy and efficiency are less than satisfactory.
The precision of fault localization results is of paramount importance as it
underpins engineers trust in the diagnostic conclusions, which are derived from
multiple perspectives and offer comprehensive insights. Therefore, a more
reliable method is required to automatically identify the associative
relationships among fault events and propagation path. To achieve this, KGroot
uses event knowledge and the correlation between events to perform root cause
reasoning by integrating knowledge graphs and GCNs for RCA. FEKG is built based
on historical data, an online graph is constructed in real-time when a failure
event occurs, and the similarity between each knowledge graph and online graph
is compared using GCNs to pinpoint the fault type through a ranking strategy.
Comprehensive experiments demonstrate KGroot can locate the root cause with
accuracy of 93.5% top 3 potential causes in second-level. This performance
matches the level of real-time fault diagnosis in the industrial environment
and significantly surpasses state-of-the-art baselines in RCA in terms of
effectiveness and efficiency.
- Abstract(参考訳): フォールトローカライゼーションは、さまざまなモニタリングデータボリューム、タイプ、イベント、サービスとコンポーネントの複雑な相互依存性のため、オンラインマイクロサービスでは難しい。
サービスの障害イベントは伝播的であり、短時間で一連のアラートをトリガーすることができる。
業界では、障害の特定は通常経験豊富な職員によって手動で行われる。
この経験への依存は信頼できず、自動化が欠けている。
異なるモジュールは手動のローカライゼーション中に情報バリアを示し、緊急障害時に迅速に整列するのは難しい。
この非効率性は安定性の保証を遅延させ、故障検出と修理時間を最小化する。
プロセスの自動化を目的とした実行可能な手法は存在するが、精度と効率は十分ではない。
フォールトローカライズの結果の正確さは、複数の視点から導き出された診断結論をエンジニアが信頼し、包括的な洞察を提供する上で極めて重要である。
そのため,障害イベントと伝搬経路の連想関係を自動同定するために,より信頼性の高い手法が必要となる。
これを実現するため、KGrootはイベント知識とイベント間の相関を利用して、知識グラフとGCNを統合して根本原因推論を行う。
FEKGは過去のデータに基づいて構築され、障害発生時にオンライングラフをリアルタイムに構築し、各知識グラフとオンライングラフの類似性をGCNを用いて比較し、ランク付け戦略により障害タイプを特定する。
総合的な実験では、KGrootは第2レベルにおいて93.5%の確率で根本原因を見つけることができる。
この性能は, 産業環境におけるリアルタイム故障診断のレベルと一致し, 有効性および効率性の観点からRCAの最先端基準を著しく上回っている。
関連論文リスト
- Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Causal Disentanglement Hidden Markov Model for Fault Diagnosis [55.90917958154425]
本研究では, 軸受破壊機構の因果性を学ぶために, 因果解離隠れマルコフモデル (CDHM) を提案する。
具体的には、時系列データをフル活用し、振動信号を断層関連要因と断層関連要因に段階的に分解する。
アプリケーションの範囲を広げるために、学習された非絡み合った表現を他の作業環境に転送するために、教師なしのドメイン適応を採用する。
論文 参考訳(メタデータ) (2023-08-06T05:58:45Z) - Disentangled Causal Graph Learning for Online Unsupervised Root Cause
Analysis [49.910053255238566]
ルート原因分析(RCA)は、システム監視データを分析することにより、システム障害/障害の根本原因を特定することができる。
従来の研究は主にオフラインのRCAアルゴリズムの開発に重点を置いており、しばしば手動でRCAプロセスを開始する必要がある。
我々は、RCAプロセスを自動的に起動し、RCAモデルを漸進的に更新できる新しいオンラインRCAフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2023-05-18T01:27:48Z) - DOMINO: Visual Causal Reasoning with Time-Dependent Phenomena [59.291745595756346]
本研究では,時間遅延のウィンドウに関連する因果関係の発見に人間が参加できる視覚分析手法を提案する。
具体的には、論理に基づく因果関係の確立した手法を活用し、分析者が潜在的な原因の重要性を検証できるようにする。
効果は他の効果の原因となりうるので,本手法で検出した時間的要因と効果の関係を視覚フロー図にまとめることができる。
論文 参考訳(メタデータ) (2023-03-12T03:40:21Z) - Energy-based Out-of-Distribution Detection for Graph Neural Networks [76.0242218180483]
我々は,GNNSafeと呼ばれるグラフ上での学習のための,シンプルで強力で効率的なOOD検出モデルを提案する。
GNNSafeは、最先端技術に対するAUROCの改善を最大17.0%で達成しており、そのような未開発領域では単純だが強力なベースラインとして機能する可能性がある。
論文 参考訳(メタデータ) (2023-02-06T16:38:43Z) - BALANCE: Bayesian Linear Attribution for Root Cause Localization [19.30952654225615]
ルート原因分析(RCA)は分散データシステムの保守と運用において必須の役割を果たす。
本稿では、最近開発された説明可能なAI(XAI)のフレームワークをRCAのために活用する可能性を明らかにする。
本稿では,XAI における帰属レンズを通して RCA の問題を定式化する BALANCE を提案する。
論文 参考訳(メタデータ) (2023-01-31T11:49:26Z) - Ranking-Based Physics-Informed Line Failure Detection in Power Grids [66.0797334582536]
ライン障害のリアルタイムかつ正確な検出は、極端な気象の影響を緩和し、緊急制御を活性化する最初のステップである。
電力収支方程式は、非線形性、極端な事象における発生の不確実性の増加、グリッドオブザーバビリティの欠如は、従来のデータ駆動障害検出手法の効率を損なう。
本稿では,グリッドトポロジ情報を利用した物理インフォームドライン故障検出器(FIELD)を提案する。
論文 参考訳(メタデータ) (2022-08-31T18:19:25Z) - Causal Inference-Based Root Cause Analysis for Online Service Systems
with Intervention Recognition [11.067832313491449]
本稿では,介入認識という新たな因果推論タスクとして根本原因分析問題を定式化する。
我々は、因果推論に基づく新しい教師なし因果推論手法、Causal Inference-based Root Cause Analysis (CIRCA)を提案する。
実世界のデータセットのパフォーマンスは、CIRCAが最高のベースラインメソッドよりも、トップ1レコメンデーションのリコールを25%改善できることを示している。
論文 参考訳(メタデータ) (2022-06-13T01:45:13Z) - An Influence-based Approach for Root Cause Alarm Discovery in Telecom
Networks [7.438302177990416]
実際には、正確で自己調整可能なアラームの根本原因分析は、ネットワークの複雑さと大量のアラームのために大きな課題である。
因果推論とネットワーク埋め込み技術を組み合わせたルート原因警報定位のためのデータ駆動型フレームワークを提案する。
人工データと現実世界の通信データについて評価し,最適なベースラインに対して有意な改善を示した。
論文 参考訳(メタデータ) (2021-05-07T07:41:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。