論文の概要: Agentic Structured Graph Traversal for Root Cause Analysis of Code-related Incidents in Cloud Applications
- arxiv url: http://arxiv.org/abs/2512.22113v1
- Date: Fri, 26 Dec 2025 18:56:18 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:55:11.407241
- Title: Agentic Structured Graph Traversal for Root Cause Analysis of Code-related Incidents in Cloud Applications
- Title(参考訳): クラウドアプリケーションにおけるコード関連インシデントの解析のためのエージェント構造化グラフトラバーサル
- Authors: Shengkun Cui, Rahul Krishna, Saurabh Jha, Ravishankar K. Iyer,
- Abstract要約: PRAXISは、コードやコンフィギュレーションに起因するクラウドインシデントを診断するためのエージェントワークフローを管理し、デプロイする。
最先端のReActベースラインと比較して、PRAXISはRCAの精度を最大3.1倍改善し、トークン消費を3.8倍削減する。
- 参考スコア(独自算出の注目度): 2.929285462633427
- License:
- Abstract: Cloud incidents pose major operational challenges in production, with unresolved production cloud incidents cost on average over $2M per hour. Prior research identifies code- and configuration-related issues as the predominant category of root causes in cloud incidents. This paper introduces PRAXIS, an orchestrator that manages and deploys an agentic workflow for diagnosing code- and configuration-caused cloud incidents. PRAXIS employs an LLM-driven structured traversal over two types of graph: (1) a service dependency graph (SDG) that captures microservice-level dependencies; and (2) a hammock-block program dependence graph (PDG) that captures code-level dependencies for each microservice. Together, these graphs encode microservice- and code-level dependencies and the LLM acts as a traversal policy over these graphs, moving between services and code dependencies to localize and explain failures. Compared to state-of-the-art ReAct baselines, PRAXIS improves RCA accuracy by up to 3.1x while reducing token consumption by 3.8x. PRAXIS is demonstrated on a set of 30 comprehensive real-world incidents that is being compiled into an RCA benchmark.
- Abstract(参考訳): クラウドインシデントは運用上の大きな課題であり、未解決のクラウドインシデントは1時間あたり平均で200万ドル以上かかる。
以前の研究では、コードと構成に関する問題が、クラウドインシデントにおける根本原因の主要なカテゴリとして特定されていた。
本稿では、コードや設定によるクラウドインシデントを診断するためのエージェントワークフローを管理し、デプロイするオーケストレータであるPRAXISを紹介する。
1)マイクロサービスレベルの依存関係をキャプチャするサービス依存グラフ(SDG)、(2)各マイクロサービスのコードレベルの依存関係をキャプチャするハンモックブロックプログラム依存グラフ(PDG)である。
これらのグラフはマイクロサービスとコードレベルの依存関係をエンコードし、LLMはこれらのグラフのトラバースポリシとして機能し、サービスとコードの依存関係をローカライズし、障害を説明する。
最先端のReActベースラインと比較して、PRAXISはRCAの精度を最大3.1倍改善し、トークン消費を3.8倍削減する。
PRAXISは、RCAベンチマークにコンパイルされている30の総合的な現実世界のインシデントで実証されている。
関連論文リスト
- AutoGraph-R1: End-to-End Reinforcement Learning for Knowledge Graph Construction [60.51319139563509]
強化学習(RL)を用いたタスクパフォーマンスのKG構築を直接最適化する最初のフレームワークであるAutoGraph-R1を紹介する。
我々は2つの新しいタスク対応報酬関数を設計し、1つは知識担体としてのグラフと、もう1つは知識指標としてのグラフを設計する。
私たちの研究は、構築とアプリケーションの間のループを閉じることが可能であることを示している。
論文 参考訳(メタデータ) (2025-10-17T06:03:36Z) - Learning Efficient and Generalizable Graph Retriever for Knowledge-Graph Question Answering [75.12322966980003]
大規模言語モデル(LLM)は、様々な領域にわたって強い帰納的推論能力を示している。
既存のRAGパイプラインのほとんどは非構造化テキストに依存しており、解釈可能性と構造化推論を制限する。
近年,知識グラフ解答のための知識グラフとLLMの統合について検討している。
KGQAにおける効率的なグラフ検索のための新しいフレームワークであるRAPLを提案する。
論文 参考訳(メタデータ) (2025-06-11T12:03:52Z) - Simplifying Root Cause Analysis in Kubernetes with StateGraph and LLM [13.293736787442414]
我々は根本原因分析のための革新的なツールであるSynergyRCAを紹介する。
SynergyRCAは、空間的および時間的関係をキャプチャするStateGraphを構築する。
約2分間の平均で根本原因を特定でき、約0.90の精度を達成できる。
論文 参考訳(メタデータ) (2025-06-03T06:09:13Z) - Follow the Flow: Fine-grained Flowchart Attribution with Neurosymbolic Agents [106.04963073116468]
フローチャートは意思決定プロセスを視覚化するための重要なツールです。
視覚言語モデルは、これらの図を分析する際に、存在しない接続や決定経路を幻覚させる。
LLM応答を参照してフローチャートを接地する特定の成分をトレースするフローチャートについて紹介する。
本稿では, グラフベースの推論により微細なホック帰属を行うニューロシンボリック・エージェントであるFlowPathAgentを提案する。
論文 参考訳(メタデータ) (2025-06-02T06:02:41Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [79.75818239774952]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - CHASE: A Causal Hypergraph based Framework for Root Cause Analysis in Multimodal Microservice Systems [29.424326542377386]
マルチモーダルデータを持つマイクロサービスシステムにおける根本原因解析,すなわちCHASEのための因数不均一なgraAph baSed framEworkを提案する。
CHASEは、因果関係の流れを表すハイパーエッジを持つ構築されたハイパーグラフから学習し、根本原因の局在を実行する。
論文 参考訳(メタデータ) (2024-06-28T07:46:51Z) - Identifying Performance Issues in Cloud Service Systems Based on Relational-Temporal Features [11.83269525626691]
クラウドシステムはパフォーマンスの問題の影響を受けやすいため、サービスレベルの合意違反や財政的損失を引き起こす可能性がある。
本稿では,メトリクスの相対的特徴と時間的特徴を併用した学習に基づく手法を提案する。
論文 参考訳(メタデータ) (2023-07-20T13:41:26Z) - Graph-based Incident Aggregation for Large-Scale Online Service Systems [33.70557954446136]
本稿では,クラウド障害のカスケードグラフ上でのグラフ表現学習に基づくインシデント集約フレームワークGRLIAを提案する。
表現ベクトルは、一意のインシデントに対して、教師なしかつ統一された方法で学習され、トポロジ的および時間的相関を同時に符号化することができる。
提案フレームワークは,Huawei Cloudの大規模オンラインサービスシステムから収集した実世界のインシデントデータを用いて評価する。
論文 参考訳(メタデータ) (2021-08-27T08:48:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。