論文の概要: Causal Inference-Based Root Cause Analysis for Online Service Systems
with Intervention Recognition
- arxiv url: http://arxiv.org/abs/2206.05871v1
- Date: Mon, 13 Jun 2022 01:45:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-14 17:07:09.288126
- Title: Causal Inference-Based Root Cause Analysis for Online Service Systems
with Intervention Recognition
- Title(参考訳): 干渉認識を伴うオンラインサービスシステムにおける因果推論に基づくルート原因解析
- Authors: Mingjie Li, Zeyan Li, Kanglin Yin, Xiaohui Nie, Wenchi Zhang, Kaixin
Sui, Dan Pei
- Abstract要約: 本稿では,介入認識という新たな因果推論タスクとして根本原因分析問題を定式化する。
我々は、因果推論に基づく新しい教師なし因果推論手法、Causal Inference-based Root Cause Analysis (CIRCA)を提案する。
実世界のデータセットのパフォーマンスは、CIRCAが最高のベースラインメソッドよりも、トップ1レコメンデーションのリコールを25%改善できることを示している。
- 参考スコア(独自算出の注目度): 11.067832313491449
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Fault diagnosis is critical in many domains, as faults may lead to safety
threats or economic losses. In the field of online service systems, operators
rely on enormous monitoring data to detect and mitigate failures. Quickly
recognizing a small set of root cause indicators for the underlying fault can
save much time for failure mitigation. In this paper, we formulate the root
cause analysis problem as a new causal inference task named intervention
recognition. We proposed a novel unsupervised causal inference-based method
named Causal Inference-based Root Cause Analysis (CIRCA). The core idea is a
sufficient condition for a monitoring variable to be a root cause indicator,
i.e., the change of probability distribution conditioned on the parents in the
Causal Bayesian Network (CBN). Towards the application in online service
systems, CIRCA constructs a graph among monitoring metrics based on the
knowledge of system architecture and a set of causal assumptions. The
simulation study illustrates the theoretical reliability of CIRCA. The
performance on a real-world dataset further shows that CIRCA can improve the
recall of the top-1 recommendation by 25% over the best baseline method.
- Abstract(参考訳): 断層診断は多くの領域で重要であり、断層は安全上の脅威や経済的な損失につながる可能性がある。
オンラインサービスシステムの分野では、オペレータは障害の検出と軽減のために巨大な監視データに依存している。
根本原因指標の小さなセットを迅速に認識することで、障害の軽減に多くの時間を費やすことができる。
本稿では,介入認識という新たな因果推論タスクとして根本原因分析問題を定式化する。
そこで我々はCausal Inference-based Root Cause Analysis (CIRCA)という,教師なし因果推論に基づく新しい手法を提案した。
核となる考え方は、監視変数が根本原因指標となるのに十分な条件、すなわち因果ベイズネットワーク(cbn)の親に条件づけられた確率分布の変化である。
オンラインサービスシステムのアプリケーションに向けて、circaはシステムアーキテクチャの知識と因果的仮定に基づいてメトリクスを監視するグラフを構築します。
シミュレーション研究は、CIRCAの理論的信頼性を示す。
実世界のデータセットのパフォーマンスは、circaが最高のベースラインメソッドよりも、トップ1レコメンデーションのリコールを25%改善できることを示している。
関連論文リスト
- Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - PORCA: Root Cause Analysis with Partially Observed Data [15.007249208547885]
ルート原因分析(RCA)は、複雑なシステムから因果構造を発見し解析することによって、システム障害の原因を特定することを目的としている。
以前の研究では、部分的な観察の効果を無視するシステムの全観察を暗黙的に仮定していた。
PORCAは、保存されていない共同創設者と保存されていない異質性の両方の下で、信頼性の高い根本原因を探索できる新しいRCAフレームワークである。
論文 参考訳(メタデータ) (2024-07-08T12:31:12Z) - KGroot: Enhancing Root Cause Analysis through Knowledge Graphs and Graph
Convolutional Neural Networks [14.336830860792707]
KGrootはイベント知識とイベント間の相関を使って根本原因推論を行う。
実験では、KGrootは第2レベルにおいて93.5%の確率で根本原因を特定できることを示した。
論文 参考訳(メタデータ) (2024-02-11T10:30:38Z) - On the Fly Detection of Root Causes from Observed Data with Application to IT Systems [3.3321350585823826]
本稿では,しきい値に基づくITシステムを表現するための構造因果モデルを提案する。
このようなシステムにおける異常の根本原因を迅速に検出するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-09T16:10:19Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Causal Disentanglement Hidden Markov Model for Fault Diagnosis [55.90917958154425]
本研究では, 軸受破壊機構の因果性を学ぶために, 因果解離隠れマルコフモデル (CDHM) を提案する。
具体的には、時系列データをフル活用し、振動信号を断層関連要因と断層関連要因に段階的に分解する。
アプリケーションの範囲を広げるために、学習された非絡み合った表現を他の作業環境に転送するために、教師なしのドメイン適応を採用する。
論文 参考訳(メタデータ) (2023-08-06T05:58:45Z) - Disentangled Causal Graph Learning for Online Unsupervised Root Cause
Analysis [49.910053255238566]
ルート原因分析(RCA)は、システム監視データを分析することにより、システム障害/障害の根本原因を特定することができる。
従来の研究は主にオフラインのRCAアルゴリズムの開発に重点を置いており、しばしば手動でRCAプロセスを開始する必要がある。
我々は、RCAプロセスを自動的に起動し、RCAモデルを漸進的に更新できる新しいオンラインRCAフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2023-05-18T01:27:48Z) - An Influence-based Approach for Root Cause Alarm Discovery in Telecom
Networks [7.438302177990416]
実際には、正確で自己調整可能なアラームの根本原因分析は、ネットワークの複雑さと大量のアラームのために大きな課題である。
因果推論とネットワーク埋め込み技術を組み合わせたルート原因警報定位のためのデータ駆動型フレームワークを提案する。
人工データと現実世界の通信データについて評価し,最適なベースラインに対して有意な改善を示した。
論文 参考訳(メタデータ) (2021-05-07T07:41:46Z) - Causal Inference Q-Network: Toward Resilient Reinforcement Learning [57.96312207429202]
観測干渉を有する弾力性のあるDRLフレームワークを検討する。
本稿では、因果推論Q-network (CIQ) と呼ばれる因果推論に基づくDRLアルゴリズムを提案する。
実験の結果,提案手法は観測干渉に対して高い性能と高反発性を実現することができた。
論文 参考訳(メタデータ) (2021-02-18T23:50:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。