論文の概要: Auditable Graph-Guided Root Cause Analysis for Kubernetes Incidents
- arxiv url: http://arxiv.org/abs/2606.08590v1
- Date: Sun, 07 Jun 2026 12:05:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.283293
- Title: Auditable Graph-Guided Root Cause Analysis for Kubernetes Incidents
- Title(参考訳): Kubernetesインシデントに対する監査可能なグラフガイド根本原因解析
- Authors: Anastasiia Kuvshinova, Seungmin Jin,
- Abstract要約: LLM推論と特殊なツールを組み合わせたグラフ誘導RCAエージェントであるグラフトラバースエージェントを提案する。
我々は、読み取り専用エビデンス収集、伝搬認識診断、有界実行、独立に検証された検証を含む運用上の制約をマップする。
ある固定されたqwenオーバージャッジによってスコアされたITBenchスナップショットでは、監査されたシステムは、同じシステムの初期のイテレーションに対してルート因果F1を上昇させる。
- 参考スコア(独自算出の注目度): 1.116726665785374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Kubernetes incidents are diagnosed reliably only when a root-cause system's reported gains come from incident evidence rather than scenario-specific shortcuts. We present Graph Traversal Agent, a graph-guided RCA agent that combines LLM reasoning with specialized tools. The model reasons over a typed evidence graph, while deterministic graph and tool operations collect evidence, bound the search, and check proposed verdicts. We map operational constraints, including read-only evidence collection, propagation-aware diagnosis, bounded execution, and independently validated verdicts, to a typed incident graph, a LangGraph traversal state machine, and a separate validation stage. On ITBench snapshots scored by one fixed qwen-plus judge, the audited system raises root-cause-entity F1 over an earlier iteration of the same system from 0.6087 to 0.9130 on a 23-scenario common subset. A prompt-level ablation separates prompt-tuned gains from gains that survive once scenario-specific hints are removed: the stripped-prompt configuration retains 0.6958 F1 on a 19-scenario subset. The surviving gain concentrates on ChaosMesh scenarios whose ground-truth root cause is the injected fault object already present in the evidence graph, so we report it as benchmark-coupled rather than broad cross-cluster RCA evidence. Lightweight checks, including same-judge comparison, prompt-level ablation, cascade-source checking, and a telemetry no-leak test, mark claims as supported, pending, or out of scope. We scope the work to ITBench OpenTelemetry-demo snapshots. Live-cluster trials served as an engineering stress test, but alert state and trace availability did not stay stable enough for controlled scoring, so we make no production-readiness or mean-time-to-repair claim.
- Abstract(参考訳): Kubernetesインシデントは、シナリオ固有のショートカットではなく、インシデントエビデンスから根本原因のシステムが取得した場合にのみ、確実に診断される。
LLM推論と特殊なツールを組み合わせたグラフ誘導RCAエージェントであるグラフトラバースエージェントを提案する。
型付きエビデンスグラフに対するモデルは、決定論的グラフとツール操作がエビデンスを収集し、検索をバウンドし、提案された判定をチェックする。
我々は,読み取り専用エビデンス収集,伝搬認識診断,有界実行,独立に検証された検証などの運用上の制約を,型付きインシデントグラフ,LangGraphトラバース状態マシン,別段の検証ステージにマップする。
ある固定されたqwen-plusの裁判官が取得したITBenchスナップショットでは、監査されたシステムは、23-scenarioの共通部分集合上の0.6087から0.9130まで、同じシステムの初期のイテレーションに対してルート因果F1を上昇させる。
プロンプトレベルのアブレーションは、シナリオ固有のヒントが取り除かれると生き残るゲインからプロンプトチューニングされたゲインを分離する。
生き残ったゲインは、エビデンスグラフにすでに存在するインジェクトされた障害オブジェクトが根本原因であるChaosMeshのシナリオに集中している。
同ジャッジ比較、プロンプトレベルのアブレーション、カスケードソースチェック、テレメトリのノーリークテスト、サポートされた、保留された、スコープ外としてのマーククレームを含む軽量チェック。
作業範囲はITBench OpenTelemetry-demoスナップショットです。
ライブクラスタの試験は、エンジニアリングのストレステストとして機能したが、警告状態とトレースの可用性は、制御されたスコア付けに十分な安定性を持っていなかったため、プロダクションの可読性や平均タイム・ツー・レペアのクレームはありませんでした。
関連論文リスト
- AuthTrace: Diagnosing Evidence Construction in Thematically Dense Single-Author Corpora [6.956097396264084]
AuthTraceは,主題的に密集した単一著者コーパスに基づいて構築された診断ベンチマークである。
AuthTraceは明示的な引用されたエビデンス、正確なファンインアノテーション、エビデンスリコール、エビデンス精度、答えの正当性を測定する統一パックレベルのプロトコルを提供する。
論文 参考訳(メタデータ) (2026-05-25T03:10:52Z) - ArbGraph: Conflict-Aware Evidence Arbitration for Reliable Long-Form Retrieval-Augmented Generation [47.25596369834373]
ArbGraphは、長期RAGにおける前世代のエビデンス仲裁のためのフレームワークである。
ArbGraphは取得した文書をアトミックなクレームに分解し、それらをコンフリクト対応エビデンスグラフに整理する。
ArbGraphは、幻覚を低減し、検索ノイズに対する感度を低下させながら、ファクトリコールと情報密度を一貫して改善することを示す。
論文 参考訳(メタデータ) (2026-04-20T14:51:43Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - AEGIS: From Clues to Verdicts -- Graph-Guided Deep Vulnerability Reasoning via Dialectics and Meta-Auditing [9.271196825503417]
大きな言語モデル(LLM)は、脆弱性検出にますます採用されているが、その推論は基本的には正しくない。
AEGISは、未解決の投機から、クローズドな事実ベース上の法医学的検証へ、検出をシフトする新しいマルチエージェントフレームワークである。
これは、主要なベースラインと比較して偽陽性率を最大54.40%削減し、1サンプルあたりの平均コストはタスク固有のトレーニングなしで0.09ドルである。
論文 参考訳(メタデータ) (2026-03-21T04:12:04Z) - Agentproof: Static Verification of Agent Workflow Graphs [0.0]
エージェントフレームワークは、ツール使用の振る舞いを明示的なワークフローグラフとしてエンコードする傾向にある。
本稿では,4つの主要なエージェントフレームワークから統合抽象グラフモデルを自動的に抽出するAgentproofを提案する。
汎用的なモデルチェッカーとは異なり、Agentproofは手動モデリングを必要としない。
論文 参考訳(メタデータ) (2026-03-20T13:56:20Z) - Easy over Hard: A Simple Baseline for Test Failures Causes Prediction [13.759493107661834]
NCCheckerは、失敗したテストログの障害原因を自動的に識別するツールである。
当社のアプローチには,ログの抽象化,ルックアップテーブルの構築,障害発生予測という,3つの主要なステージがあります。
我々は,10K以上のテストログを持つ実世界の産業データセット上で,プロトタイプを開発し,ツールの評価を行った。
論文 参考訳(メタデータ) (2024-05-05T12:59:37Z) - Disentangled Causal Graph Learning for Online Unsupervised Root Cause
Analysis [49.910053255238566]
ルート原因分析(RCA)は、システム監視データを分析することにより、システム障害/障害の根本原因を特定することができる。
従来の研究は主にオフラインのRCAアルゴリズムの開発に重点を置いており、しばしば手動でRCAプロセスを開始する必要がある。
我々は、RCAプロセスを自動的に起動し、RCAモデルを漸進的に更新できる新しいオンラインRCAフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2023-05-18T01:27:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。