論文の概要: Flow-of-Action: SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis
- arxiv url: http://arxiv.org/abs/2502.08224v1
- Date: Wed, 12 Feb 2025 09:07:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-13 13:49:34.791605
- Title: Flow-of-Action: SOP Enhanced LLM-Based Multi-Agent System for Root Cause Analysis
- Title(参考訳): フロー・オブ・アクション:SOP強化LPMに基づく根本原因解析用マルチエージェントシステム
- Authors: Changhua Pei, Zexin Wang, Fengrui Liu, Zeyan Li, Yang Liu, Xiao He, Rong Kang, Tieying Zhang, Jianjun Chen, Jianhui Li, Gaogang Xie, Dan Pei,
- Abstract要約: 大規模言語モデル(LLM)をルート原因分析(RCA)の自動化エージェントとして活用する現代的傾向
本稿では,SOP拡張マルチエージェントシステムであるFlow-of-Actionを提案する。
ReAct法を35.50%精度で比較すると,実システムにおけるRCAの精度要件を満たしたフロー・オブ・アクション法は64.01%となる。
- 参考スコア(独自算出の注目度): 19.357332854860665
- License:
- Abstract: In the realm of microservices architecture, the occurrence of frequent incidents necessitates the employment of Root Cause Analysis (RCA) for swift issue resolution. It is common that a serious incident can take several domain experts hours to identify the root cause. Consequently, a contemporary trend involves harnessing Large Language Models (LLMs) as automated agents for RCA. Though the recent ReAct framework aligns well with the Site Reliability Engineers (SREs) for its thought-action-observation paradigm, its hallucinations often lead to irrelevant actions and directly affect subsequent results. Additionally, the complex and variable clues of the incident can overwhelm the model one step further. To confront these challenges, we propose Flow-of-Action, a pioneering Standard Operation Procedure (SOP) enhanced LLM-based multi-agent system. By explicitly summarizing the diagnosis steps of SREs, SOP imposes constraints on LLMs at crucial junctures, guiding the RCA process towards the correct trajectory. To facilitate the rational and effective utilization of SOPs, we design an SOP-centric framework called SOP flow. SOP flow contains a series of tools, including one for finding relevant SOPs for incidents, another for automatically generating SOPs for incidents without relevant ones, and a tool for converting SOPs into code. This significantly alleviates the hallucination issues of ReAct in RCA tasks. We also design multiple auxiliary agents to assist the main agent by removing useless noise, narrowing the search space, and informing the main agent whether the RCA procedure can stop. Compared to the ReAct method's 35.50% accuracy, our Flow-of-Action method achieves 64.01%, meeting the accuracy requirements for RCA in real-world systems.
- Abstract(参考訳): マイクロサービスアーキテクチャの領域では、頻繁なインシデントの発生は、迅速なイシュー解決のためにルート原因分析(RCA)の使用を必要とする。
深刻なインシデントが、根本原因を特定するのに、いくつかのドメインの専門家に何時間もかかることはよくあることです。
結果として、現代のトレンドは、RCAの自動化エージェントとしてLarge Language Models (LLM)を利用する。
最近のReActフレームワークは、その思考・行動・観測パラダイムにおいてSRE(Site Reliability Engineers)とよく一致しているが、その幻覚はしばしば無関係な行動を引き起こし、その後の結果に直接影響する。
さらに、インシデントに関する複雑で可変的なヒントは、モデルをさらに一歩上回る可能性がある。
これらの課題に対処するために、我々は、SOP(Standard Operation Procedure)拡張LLMベースのマルチエージェントシステムであるFlow-of-Actionを提案する。
SREの診断ステップを明示的に要約することにより、SOPはLLMに重要な点において制約を課し、RCAプロセスを正しい軌道へと導く。
SOPの合理的かつ効果的な利用を促進するため、SOPフローと呼ばれるSOP中心のフレームワークを設計する。
SOPフローには、インシデントに関連するSOPを見つけるツール、インシデントに関するSOPを自動的に生成するツール、SOPをコードに変換するツールなど、一連のツールが含まれている。
これはRCAタスクにおけるReActの幻覚問題を著しく軽減する。
また、複数の補助エージェントを設計して、不要なノイズを除去し、検索スペースを狭め、RCAの手順が止まるかどうかをメインエージェントに通知することで、メインエージェントを支援する。
ReAct法を35.50%精度で比較すると,実システムにおけるRCAの精度要件を満たしたフロー・オブ・アクション法は64.01%となる。
関連論文リスト
- Causal Mean Field Multi-Agent Reinforcement Learning [10.767740092703777]
平均場強化学習(MFRL)と呼ばれるフレームワークは、平均場理論を用いることでスケーラビリティの問題を軽減することができる。
このフレームワークには、非定常環境下での本質的な相互作用を識別する能力がない。
拡張性問題に対処するために,因果平均Q-ラーニング (CMFQ) と呼ばれるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-20T02:15:58Z) - Self-Regulation and Requesting Interventions [63.5863047447313]
介入要求のための"helper"ポリシーをトレーニングするオフラインフレームワークを提案する。
PRMによる最適介入タイミングを判定し,これらのラベル付き軌道上でヘルパーモデルを訓練する。
このオフラインアプローチは、トレーニング中のコストのかかる介入コールを大幅に削減する。
論文 参考訳(メタデータ) (2025-02-07T00:06:17Z) - Textualized Agent-Style Reasoning for Complex Tasks by Multiple Round LLM Generation [49.27250832754313]
我々は、llmベースの自律エージェントフレームワークであるAgentCOTを紹介する。
それぞれのステップで、AgentCOTはアクションを選択し、それを実行して、証拠を裏付ける中間結果を得る。
エージェントCOTの性能を高めるための2つの新しい戦略を導入する。
論文 参考訳(メタデータ) (2024-09-19T02:20:06Z) - Model Surgery: Modulating LLM's Behavior Via Simple Parameter Editing [63.20133320524577]
パラメータの小さなサブセットを編集することで、大きな言語モデル(LLM)の特定の振る舞いを効果的に調節できることを示す。
我々の手法は、RealToxicityPromptsデータセットで最大90.0%の毒性を減少させ、ToxiGenで49.2%を達成する。
論文 参考訳(メタデータ) (2024-07-11T17:52:03Z) - Exploring LLM-based Agents for Root Cause Analysis [17.053079105858497]
ルート原因分析(RCA)はインシデント管理プロセスの重要な部分である。
大規模言語モデル(LLM)はRCAの実行に使用されているが、追加の診断情報を収集することはできない。
検索ツールを備えたReActエージェントを,マイクロソフトが収集した生産事故のアウト・オブ・ディストリビューション・データセット上で評価する。
論文 参考訳(メタデータ) (2024-03-07T00:44:01Z) - Multi-modal Causal Structure Learning and Root Cause Analysis [67.67578590390907]
根本原因局所化のためのマルチモーダル因果構造学習手法であるMulanを提案する。
ログ選択言語モデルを利用してログ表現学習を行い、ログシーケンスを時系列データに変換する。
また、モダリティの信頼性を評価し、最終因果グラフを共同学習するための新しいキーパフォーマンスインジケータ対応アテンション機構も導入する。
論文 参考訳(メタデータ) (2024-02-04T05:50:38Z) - RCAgent: Cloud Root Cause Analysis by Autonomous Agents with Tool-Augmented Large Language Models [46.476439550746136]
近年,クラウド根本原因分析(RCA)における言語モデル (LLM) の適用が活発に検討されている。
RCAgentは、実用的でプライバシに配慮した産業RCA利用のためのツール強化LDM自律エージェントフレームワークである。
RCAgentはGPTファミリではなく、内部的にデプロイされたモデル上で動作し、フリーフォームのデータ収集とツールによる包括的な分析を行うことができる。
論文 参考訳(メタデータ) (2023-10-25T03:53:31Z) - Deep Reinforcement Learning for Uplink Scheduling in NOMA-URLLC Networks [7.182684187774442]
本稿では,無線ネットワークにおけるURLLC(Ultra Reliable Low Communications)の問題に対処する。
本稿では,厳密な期限を含む非直交多重アクセス(NOMA)アップリンクURLLCスケジューリング問題を解くために,DRL(Deep Reinforcement Learning)スケジューリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-08-28T12:18:02Z) - Disentangled Causal Graph Learning for Online Unsupervised Root Cause
Analysis [49.910053255238566]
ルート原因分析(RCA)は、システム監視データを分析することにより、システム障害/障害の根本原因を特定することができる。
従来の研究は主にオフラインのRCAアルゴリズムの開発に重点を置いており、しばしば手動でRCAプロセスを開始する必要がある。
我々は、RCAプロセスを自動的に起動し、RCAモデルを漸進的に更新できる新しいオンラインRCAフレームワークであるCORALを提案する。
論文 参考訳(メタデータ) (2023-05-18T01:27:48Z) - Fast Decomposition of Temporal Logic Specifications for Heterogeneous
Teams [1.856334276134661]
我々は,大規模なマルチエージェントパス計画問題を,独立して解決・実行可能なより小さなサブプロブレムに分解することに注力する。
エージェントのミッションは、信号時間論理の断片であるCaTL(Capability Temporal Logic)公式として与えられる。
私たちが取っているアプローチは、時間論理仕様とエージェントのチームの両方を分解することです。
論文 参考訳(メタデータ) (2020-09-30T18:04:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。