論文の概要: MicroRCA-Agent: Microservice Root Cause Analysis Method Based on Large Language Model Agents
- arxiv url: http://arxiv.org/abs/2509.15635v1
- Date: Fri, 19 Sep 2025 05:57:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.018122
- Title: MicroRCA-Agent: Microservice Root Cause Analysis Method Based on Large Language Model Agents
- Title(参考訳): MicroRCA-Agent:大規模言語モデルエージェントを用いたマイクロサービスルート原因分析手法
- Authors: Pan Tang, Shixiang Tang, Huanqi Pu, Zhiqing Miao, Zhixing Wang,
- Abstract要約: MicroRCA-Agentは、大規模な言語モデルエージェントに基づいたマイクロサービスの根本原因分析のための革新的なソリューションである。
提案したソリューションは、複雑なマイクロサービス障害シナリオにおいて優れたパフォーマンスを示し、最終的なスコアは50.71である。
- 参考スコア(独自算出の注目度): 12.160412894251406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents MicroRCA-Agent, an innovative solution for microservice root cause analysis based on large language model agents, which constructs an intelligent fault root cause localization system with multimodal data fusion. The technical innovations are embodied in three key aspects: First, we combine the pre-trained Drain log parsing algorithm with multi-level data filtering mechanism to efficiently compress massive logs into high-quality fault features. Second, we employ a dual anomaly detection approach that integrates Isolation Forest unsupervised learning algorithms with status code validation to achieve comprehensive trace anomaly identification. Third, we design a statistical symmetry ratio filtering mechanism coupled with a two-stage LLM analysis strategy to enable full-stack phenomenon summarization across node-service-pod hierarchies. The multimodal root cause analysis module leverages carefully designed cross-modal prompts to deeply integrate multimodal anomaly information, fully exploiting the cross-modal understanding and logical reasoning capabilities of large language models to generate structured analysis results encompassing fault components, root cause descriptions, and reasoning trace. Comprehensive ablation studies validate the complementary value of each modal data and the effectiveness of the system architecture. The proposed solution demonstrates superior performance in complex microservice fault scenarios, achieving a final score of 50.71. The code has been released at: https://github.com/tangpan360/MicroRCA-Agent.
- Abstract(参考訳): 本稿では,大規模言語モデルエージェントに基づくマイクロサービス根本原因解析の革新的なソリューションであるMicroRCA-Agentについて述べる。
まず、トレーニング済みのDrainログ解析アルゴリズムとマルチレベルデータフィルタリング機構を組み合わせて、大量のログを高品質なフォールト特徴に効率的に圧縮します。
第2に,隠蔽森林の非教師付き学習アルゴリズムとステータスコード検証を統合し,総合的トレース異常同定を実現する2つの異常検出手法を用いる。
第3に,ノードサービスポッド階層間のフルスタック現象の要約を可能にするために,2段階のLCM解析戦略と組み合わせた統計的対称性比フィルタリング機構を設計する。
マルチモーダル根本原因解析モジュールは、慎重に設計されたクロスモーダルプロンプトを利用して、多モーダル異常情報を深く統合し、大言語モデルのクロスモーダル理解と論理的推論能力をフル活用して、障害成分、根本原因記述、推論トレースを含む構造化解析結果を生成する。
総合的アブレーション研究は、各モーダルデータの相補的値とシステムアーキテクチャの有効性を検証する。
提案したソリューションは、複雑なマイクロサービス障害シナリオにおいて優れたパフォーマンスを示し、最終的なスコアは50.71である。
コードはhttps://github.com/tangpan360/MicroRCA-Agent.comでリリースされた。
関連論文リスト
- A layered architecture for log analysis in complex IT systems [0.21756081703276]
この論文では、DevOpsの障害解決をサポートする3層アーキテクチャが紹介されている。
最初のレイヤであるLog Investigationは、自律的なログラベリングと異常分類を実行する。
第2のレイヤであるAnomaly Detectionは、標準から逸脱した振る舞いを検出する。
第3のレイヤであるRoot Cause Analysisは、障害、その起源、イベントシーケンスを記述する最小限のログセットを識別する。
論文 参考訳(メタデータ) (2025-08-29T11:28:21Z) - MCP-Orchestrated Multi-Agent System for Automated Disinformation Detection [84.75972919995398]
本稿では,関係抽出を用いてニュース記事の偽情報を検出するマルチエージェントシステムを提案する。
提案したエージェントAIシステムは、(i)機械学習エージェント(ロジスティック回帰)、(ii)Wikipedia知識チェックエージェント、(iv)Webスクラッドデータアナライザの4つのエージェントを組み合わせる。
その結果、マルチエージェントアンサンブルはF1スコア0.964で95.3%の精度を達成し、個々のエージェントや従来のアプローチよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-08-13T19:14:48Z) - Understanding the Information Propagation Effects of Communication Topologies in LLM-based Multi-Agent Systems [58.95962217043371]
提案手法は, エージェントの出力の正確さ, 誤動作の有無を, 異なる範囲の位相の下で伝達する因果関係を解析するための枠組みである。
実験により,有益な情報拡散を保ちながらエラーの伝播を効果的に抑制する,適度に疎らなトポロジが,通常最適なタスク性能を達成できることが判明した。
本稿では,高密度グラフとスパースグラフの両方から接続パターンを融合させることにより,エラー抑制と有益な情報伝達のバランスをとる新しいトポロジ設計手法 EIB-leanrner を提案する。
論文 参考訳(メタデータ) (2025-05-29T11:21:48Z) - Boost, Disentangle, and Customize: A Robust System2-to-System1 Pipeline for Code Generation [58.799397354312596]
大規模言語モデル(LLM)は、様々な領域、特にシステム1タスクにおいて顕著な機能を示した。
System2-to-System1法に関する最近の研究が急増し、推論時間計算によるシステム2の推論知識が探索された。
本稿では,システム2タスクの代表的タスクであるコード生成に注目し,主な課題を2つ挙げる。
論文 参考訳(メタデータ) (2025-02-18T03:20:50Z) - Online Multi-modal Root Cause Analysis [61.94987309148539]
ルート原因分析(RCA)は、マイクロサービスシステムにおける障害の根本原因の特定に不可欠である。
既存のオンラインRCAメソッドは、マルチモーダルシステムにおける複雑な相互作用を見渡す単一モーダルデータのみを処理する。
OCEANは、根本原因の局在化のための新しいオンラインマルチモーダル因果構造学習手法である。
論文 参考訳(メタデータ) (2024-10-13T21:47:36Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Leveraging Log Instructions in Log-based Anomaly Detection [0.5949779668853554]
本稿では,システムログからの信頼性と実用的な異常検出手法を提案する。
1000以上のGitHubプロジェクトのソースコードからログインストラクションを備えた異常検出モデルを構築することで、関連する作業の一般的な欠点を克服する。
提案手法はADLILogと呼ばれ,興味あるシステム(ターゲットシステム)からのログ命令とデータを組み合わせて,深層ニューラルネットワークモデルを学習する。
論文 参考訳(メタデータ) (2022-07-07T10:22:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。