論文の概要: Agentic Memory Enhanced Recursive Reasoning for Root Cause Localization in Microservices
- arxiv url: http://arxiv.org/abs/2601.02732v1
- Date: Tue, 06 Jan 2026 05:50:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.816676
- Title: Agentic Memory Enhanced Recursive Reasoning for Root Cause Localization in Microservices
- Title(参考訳): エージェントメモリによる再帰的推論の強化によるマイクロサービスにおける根本原因のローカライゼーション
- Authors: Lingzhe Zhang, Tong Jia, Yunpeng Zhai, Leyi Pan, Chiming Duan, Minghua He, Mengxi Jia, Ying Li,
- Abstract要約: Site Reliability Engineers (SRE) 障害の根本原因をローカライズする。
従来のグラフベースのディープラーニングアプローチは、事前に定義されたスキーマに大きく依存することが多い。
本稿では,ルート原因ローカライゼーションのためのエージェントメモリ拡張フレームワークAMER-RCLを紹介する。
- 参考スコア(独自算出の注目度): 19.187189391947815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As contemporary microservice systems become increasingly popular and complex-often comprising hundreds or even thousands of fine-grained, interdependent subsystems-they are experiencing more frequent failures. Ensuring system reliability thus demands accurate root cause localization. While many traditional graph-based and deep learning approaches have been explored for this task, they often rely heavily on pre-defined schemas that struggle to adapt to evolving operational contexts. Consequently, a number of LLM-based methods have recently been proposed. However, these methods still face two major limitations: shallow, symptom-centric reasoning that undermines accuracy, and a lack of cross-alert reuse that leads to redundant reasoning and high latency. In this paper, we conduct a comprehensive study of how Site Reliability Engineers (SREs) localize the root causes of failures, drawing insights from professionals across multiple organizations. Our investigation reveals that expert root cause analysis exhibits three key characteristics: recursiveness, multi-dimensional expansion, and cross-modal reasoning. Motivated by these findings, we introduce AMER-RCL, an agentic memory enhanced recursive reasoning framework for root cause localization in microservices. AMER-RCL employs the Recursive Reasoning RCL engine, a multi-agent framework that performs recursive reasoning on each alert to progressively refine candidate causes, while Agentic Memory incrementally accumulates and reuses reasoning from prior alerts within a time window to reduce redundant exploration and lower inference latency. Experimental results demonstrate that AMER-RCL consistently outperforms state-of-the-art methods in both localization accuracy and inference efficiency.
- Abstract(参考訳): 現代のマイクロサービスシステムは、何百、あるいは何千ものきめ細かい、相互依存的なサブシステムによって、ますます人気を増し、複雑化する。
システムの信頼性を確保するために、正確な根本原因のローカライゼーションが要求される。
多くの従来のグラフベースおよびディープラーニングアプローチがこのタスクのために検討されているが、しばしば、進化する運用コンテキストに適応するのに苦労する事前定義されたスキーマに大きく依存している。
その結果,LLMに基づく手法が提案されている。
しかし、これらの手法は、精度を損なう浅く症状中心の推論と、冗長な推論と高いレイテンシをもたらすクロスアラートの再利用の欠如という2つの大きな制限に直面している。
本稿では、SRE(Site Reliability Engineers)が障害の原因をローカライズし、複数の組織にまたがる専門家の洞察を引き出す方法について、包括的な研究を行う。
本研究により, 専門的根本原因分析は再帰性, 多次元展開, クロスモーダル推論の3つの重要な特徴を示すことが明らかとなった。
これらの知見に触発されたAMER-RCLは,マイクロサービスにおける根本原因ローカライゼーションのためのエージェントメモリ拡張再帰的推論フレームワークである。
AMER-RCLにはRecursive Reasoning RCLエンジンがある。これは、各アラートに対して再帰的推論を実行し、候補原因を段階的に洗練するマルチエージェントフレームワークである。
実験の結果,AMER-RCLは局所化精度と推論効率の両方で最先端の手法より一貫して優れていた。
関連論文リスト
- Hypothesize-Then-Verify: Speculative Root Cause Analysis for Microservices with Pathwise Parallelism [19.31110304702373]
SpecRCAは、thithypothesize-then-verifyパラダイムを採用した投機的根本原因分析フレームワークである。
AIOps 2022に関する予備的な実験では、既存のアプローチよりも精度と効率が優れていることが示されている。
論文 参考訳(メタデータ) (2026-01-06T05:58:25Z) - VAR: Visual Attention Reasoning via Structured Search and Backtracking [49.427842994857635]
構造化された検索としてグラウンドド推論をリキャストするフレームワークであるVisual Attention Reasoningを紹介する。
VARは、推論プロセスを2つの重要な段階に分解する。
我々は、我々の7BモデルであるVAR-7Bが、幻覚と安全性のベンチマークの包括的なスイートに新しい最先端を設定していることを示します。
論文 参考訳(メタデータ) (2025-10-21T13:18:44Z) - R-Horizon: How Far Can Your Large Reasoning Model Really Go in Breadth and Depth? [63.51955244144878]
R-HoriZONは、Large Reasoning Models(LRMs)における長い水平推論挙動を刺激するために設計された方法である
R-HoriZONに基づいて、長い推論地平線にまたがる相互依存問題を伴う複雑な多段階推論タスクを含む、長期水平推論ベンチマークを構築する。
分析の結果, LRMは有効推論長が限られており, 複数の問題に対する思考予算の配分に苦慮していることが明らかとなった。
論文 参考訳(メタデータ) (2025-10-09T13:16:22Z) - Adaptive Root Cause Localization for Microservice Systems with Multi-Agent Recursion-of-Thought [11.307072056343662]
本稿では,マイクロサービスシステムに対する適応的根本原因ローカライゼーション手法であるRCLAgentを紹介する。
RCLAgentは,1つの要求出力状態のみを用いて根本原因を局所化し,優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2025-08-28T02:34:19Z) - The Multi-Agent Fault Localization System Based on Monte Carlo Tree Search Approach [2.4898626838193647]
大規模言語モデル(LLM)は、インシデントを素早く見つけてリカバリするための新しいパスを提供する。
本手法は根本原因の局在精度を49.29%から128.35%向上させる。
論文 参考訳(メタデータ) (2025-07-30T16:03:21Z) - DeepSieve: Information Sieving via LLM-as-a-Knowledge-Router [57.28685457991806]
DeepSieveはエージェントRAGフレームワークで、LLM-as-a-knowledge-routerを介して情報を収集する。
我々の設計はモジュール性、透明性、適応性を重視しており、エージェントシステム設計の最近の進歩を活用している。
論文 参考訳(メタデータ) (2025-07-29T17:55:23Z) - Towards Agentic RAG with Deep Reasoning: A Survey of RAG-Reasoning Systems in LLMs [69.10441885629787]
Retrieval-Augmented Generation (RAG) は、外部知識を注入することによって、Large Language Models (LLM) の事実性を高める。
逆に、純粋に推論指向のアプローチは、しばしば幻覚的あるいは誤った事実を必要とする。
この調査は両鎖を統一的推論-検索の観点から合成する。
論文 参考訳(メタデータ) (2025-07-13T03:29:41Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。