論文の概要: GALA: Can Graph-Augmented Large Language Model Agentic Workflows Elevate Root Cause Analysis?
- arxiv url: http://arxiv.org/abs/2508.12472v1
- Date: Sun, 17 Aug 2025 19:12:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.787824
- Title: GALA: Can Graph-Augmented Large Language Model Agentic Workflows Elevate Root Cause Analysis?
- Title(参考訳): GALA: グラフ強化された大規模言語モデルエージェントワークフローは根本原因分析を高めるか?
- Authors: Yifang Tian, Yaming Liu, Zichun Chong, Zihang Huang, Hans-Arno Jacobsen,
- Abstract要約: 本稿では,マイクロサービスシステムにおける根本原因分析の新しいフレームワークであるGALAを紹介する。
GALAはオープンソースのベンチマークで評価され、最先端のメソッドよりも大幅に改善されている。
GALAは自動故障診断と実用的なインシデント解決のギャップを埋めることを示す。
- 参考スコア(独自算出の注目度): 9.394057684388027
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Root cause analysis (RCA) in microservice systems is challenging, requiring on-call engineers to rapidly diagnose failures across heterogeneous telemetry such as metrics, logs, and traces. Traditional RCA methods often focus on single modalities or merely rank suspect services, falling short of providing actionable diagnostic insights with remediation guidance. This paper introduces GALA, a novel multi-modal framework that combines statistical causal inference with LLM-driven iterative reasoning for enhanced RCA. Evaluated on an open-source benchmark, GALA achieves substantial improvements over state-of-the-art methods of up to 42.22% accuracy. Our novel human-guided LLM evaluation score shows GALA generates significantly more causally sound and actionable diagnostic outputs than existing methods. Through comprehensive experiments and a case study, we show that GALA bridges the gap between automated failure diagnosis and practical incident resolution by providing both accurate root cause identification and human-interpretable remediation guidance.
- Abstract(参考訳): マイクロサービスシステムにおけるルート原因分析(RCA)は困難であり、オンコールエンジニアはメトリクスやログ、トレースといった異種テレメトリの障害を迅速に診断する必要がある。
従来のRCAの手法は、単一のモダリティに焦点をあてたり、単に容疑者のサービスをランク付けするだけであり、治療指導を伴う実用的な診断の洞察を提供するには足りていない。
本稿では,統計因果推論とLLM駆動反復推論を組み合わせ,拡張RCAのための新しいマルチモーダルフレームワークであるGALAを紹介する。
GALAはオープンソースのベンチマークで評価され、最先端の手法よりも42.22%の精度で大幅に改善されている。
GALAは従来の方法に比べて,より因果的かつ動作可能な診断出力を生成する。
GALAは、総合的な実験と事例研究を通じて、正確な根本原因同定と人為的解釈可能な修復指導を提供することにより、自動故障診断と実用的なインシデント解決のギャップを埋めることを示した。
関連論文リスト
- Can Large Language Models Help Experimental Design for Causal Discovery? [94.66802142727883]
Large Language Model Guided Intervention Targeting (LeGIT) は、LLMを効果的に組み込んだ堅牢なフレームワークであり、因果発見のための介入のための既存の数値的アプローチを強化する。
LeGITは、既存の方法よりも大幅な改善と堅牢性を示し、人間を超越している。
論文 参考訳(メタデータ) (2025-03-03T03:43:05Z) - Flow-of-Action: SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis [19.357332854860665]
大規模言語モデル(LLM)をルート原因分析(RCA)の自動化エージェントとして活用する現代的傾向
本稿では,SOP拡張マルチエージェントシステムであるFlow-of-Actionを提案する。
ReAct法を35.50%精度で比較すると,実システムにおけるRCAの精度要件を満たしたフロー・オブ・アクション法は64.01%となる。
論文 参考訳(メタデータ) (2025-02-12T09:07:25Z) - PORCA: Root Cause Analysis with Partially Observed Data [15.007249208547885]
ルート原因分析(RCA)は、複雑なシステムから因果構造を発見し解析することによって、システム障害の原因を特定することを目的としている。
以前の研究では、部分的な観察の効果を無視するシステムの全観察を暗黙的に仮定していた。
PORCAは、保存されていない共同創設者と保存されていない異質性の両方の下で、信頼性の高い根本原因を探索できる新しいRCAフレームワークである。
論文 参考訳(メタデータ) (2024-07-08T12:31:12Z) - BARO: Robust Root Cause Analysis for Microservices via Multivariate Bayesian Online Change Point Detection [11.627235799040388]
本稿では,異常検出と根本原因分析を統合したエンドツーエンドアプローチを提案する。
BarOは、異常検出と根本原因分析の両方において、最先端のアプローチを一貫して上回る。
論文 参考訳(メタデータ) (2024-05-15T13:32:59Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Causal Disentanglement Hidden Markov Model for Fault Diagnosis [55.90917958154425]
本研究では, 軸受破壊機構の因果性を学ぶために, 因果解離隠れマルコフモデル (CDHM) を提案する。
具体的には、時系列データをフル活用し、振動信号を断層関連要因と断層関連要因に段階的に分解する。
アプリケーションの範囲を広げるために、学習された非絡み合った表現を他の作業環境に転送するために、教師なしのドメイン適応を採用する。
論文 参考訳(メタデータ) (2023-08-06T05:58:45Z) - Disentangled Causal Graph Learning for Online Unsupervised Root Cause
Analysis [49.910053255238566]
ルート原因分析(RCA)は、システム監視データを分析することにより、システム障害/障害の根本原因を特定することができる。
従来の研究は主にオフラインのRCAアルゴリズムの開発に重点を置いており、しばしば手動でRCAプロセスを開始する必要がある。
我々は、RCAプロセスを自動的に起動し、RCAモデルを漸進的に更新できる新しいオンラインRCAフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2023-05-18T01:27:48Z) - Causal Inference-Based Root Cause Analysis for Online Service Systems
with Intervention Recognition [11.067832313491449]
本稿では,介入認識という新たな因果推論タスクとして根本原因分析問題を定式化する。
我々は、因果推論に基づく新しい教師なし因果推論手法、Causal Inference-based Root Cause Analysis (CIRCA)を提案する。
実世界のデータセットのパフォーマンスは、CIRCAが最高のベースラインメソッドよりも、トップ1レコメンデーションのリコールを25%改善できることを示している。
論文 参考訳(メタデータ) (2022-06-13T01:45:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。