論文の概要: Root Cause Analysis for Microservice Systems via Cascaded Conditional Learning with Hypergraphs
- arxiv url: http://arxiv.org/abs/2511.17566v1
- Date: Fri, 14 Nov 2025 03:20:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-07 19:06:32.284472
- Title: Root Cause Analysis for Microservice Systems via Cascaded Conditional Learning with Hypergraphs
- Title(参考訳): ハイパーグラフを用いたカスケード条件学習によるマイクロサービスシステムの根本原因解析
- Authors: Shuaiyu Xie, Hanbin He, Jian Wang, Bing Li,
- Abstract要約: マイクロサービスシステムにおけるルート原因分析では、ルート原因ローカライゼーション(RCL)と障害タイプ識別(FTI)という、2つのコアタスクが一般的である。
これらの手法は主に、共有情報を利用してトレーニング時間を短縮するために、RCLとFTIのジョイントラーニングパラダイムを採用する。
CCLHは,ケースド・コンディショナル・ラーニングに基づく診断タスクを編成する新しい根本原因分析フレームワークである。
- 参考スコア(独自算出の注目度): 6.06702225930801
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Root cause analysis in microservice systems typically involves two core tasks: root cause localization (RCL) and failure type identification (FTI). Despite substantial research efforts, conventional diagnostic approaches still face two key challenges. First, these methods predominantly adopt a joint learning paradigm for RCL and FTI to exploit shared information and reduce training time. However, this simplistic integration neglects the causal dependencies between tasks, thereby impeding inter-task collaboration and information transfer. Second, these existing methods primarily focus on point-to-point relationships between instances, overlooking the group nature of inter-instance influences induced by deployment configurations and load balancing. To overcome these limitations, we propose CCLH, a novel root cause analysis framework that orchestrates diagnostic tasks based on cascaded conditional learning. CCLH provides a three-level taxonomy for group influences between instances and incorporates a heterogeneous hypergraph to model these relationships, facilitating the simulation of failure propagation. Extensive experiments conducted on datasets from three microservice benchmarks demonstrate that CCLH outperforms state-of-the-art methods in both RCL and FTI.
- Abstract(参考訳): マイクロサービスシステムにおけるルート原因分析には、ルート原因ローカライゼーション(RCL)と障害タイプ識別(FTI)という、2つのコアタスクが関係している。
大きな研究努力にもかかわらず、従来の診断アプローチは依然として2つの重要な課題に直面している。
第一に、これらの手法は、共有情報を利用してトレーニング時間を短縮するために、RCLとFTIのジョイントラーニングパラダイムを主に採用する。
しかし、この単純な統合はタスク間の因果依存性を無視し、タスク間のコラボレーションや情報伝達を妨げる。
第二に、これらの既存手法は、主にインスタンス間のポイント・ツー・ポイントの関係に焦点を合わせ、デプロイメント構成やロードバランシングによって引き起こされるインスタンス間影響の群の性質を見渡す。
これらの制約を克服するために,ケースド条件付き学習に基づく診断タスクを編成する新しい根本原因分析フレームワークであるCCLHを提案する。
CCLHは、インスタンス間のグループ影響に対する3段階の分類を提供し、これらの関係をモデル化するための異種ハイパーグラフを組み込んで、障害伝播のシミュレーションを容易にする。
3つのマイクロサービスベンチマークのデータセットで実施された大規模な実験は、CCLHがRCLとFTIの両方で最先端のメソッドを上回っていることを示している。
関連論文リスト
- Group Interventions on Deep Networks for Causal Discovery in Subsystems [9.239779358333182]
因果発見は、変数間の複雑な関係、予測の強化、意思決定、現実世界のシステムに対する洞察を明らかにする。
我々は、訓練されたディープニューラルネットワークに対するグループレベルの介入を利用する、新しいマルチグループ因果探索法であるgCDMIを紹介する。
提案手法をシミュレーションデータセット上で評価し,既存手法と比較して優れた性能を示す。
論文 参考訳(メタデータ) (2025-10-27T22:26:20Z) - Understanding Catastrophic Interference: On the Identifibility of Latent Representations [67.05452287233122]
破滅的な干渉、あるいは破滅的な忘れ(Caastrophic forgetting)は、機械学習の根本的な課題である。
本稿では,破滅的干渉を識別問題として定式化する新しい理論枠組みを提案する。
我々のアプローチは、合成データセットとベンチマークデータセットの両方で理論的保証と実用的なパフォーマンスの改善を提供する。
論文 参考訳(メタデータ) (2025-09-27T00:53:32Z) - Adaptive Root Cause Localization for Microservice Systems with Multi-Agent Recursion-of-Thought [11.307072056343662]
本稿では,マイクロサービスシステムに対する適応的根本原因ローカライゼーション手法であるRCLAgentを紹介する。
RCLAgentは,1つの要求出力状態のみを用いて根本原因を局所化し,優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2025-08-28T02:34:19Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Fairness-Driven LLM-based Causal Discovery with Active Learning and Dynamic Scoring [1.5498930424110338]
因果発見(英: Causal discovery, CD)は、様々な分野において観測される現象の根底にある因果関係を明らかにすることで、多くの科学分野において重要な役割を担っている。
CDアルゴリズムの大幅な進歩にもかかわらず、その応用は大規模データの高い計算要求と複雑さのために困難に直面している。
本稿では,CDにLarge Language Models(LLM)を活用するフレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-21T22:58:26Z) - Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。