論文の概要: Who is Introducing the Failure? Automatically Attributing Failures of Multi-Agent Systems via Spectrum Analysis
- arxiv url: http://arxiv.org/abs/2509.13782v1
- Date: Wed, 17 Sep 2025 07:50:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-18 18:41:50.769069
- Title: Who is Introducing the Failure? Automatically Attributing Failures of Multi-Agent Systems via Spectrum Analysis
- Title(参考訳): 誰が失敗を導入したのか?スペクトル分析によるマルチエージェントシステムの障害の自動帰属
- Authors: Yu Ge, Linna Xie, Zhong Li, Yu Pei, Tian Zhang,
- Abstract要約: 我々は、MASに対する最初のスペクトルベースの障害帰属手法であるFAMASを提案する。
FAMASの中核となる考え方は、繰り返しMASの実行のバリエーションから、各エージェントアクションが障害の原因となる可能性を見積もることである。
特に、エージェント行動群とアクション行動群という2つの重要な因子群を統合するMASに合わせた新しい不審性公式を提案する。
- 参考スコア(独自算出の注目度): 10.235089248238108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Model Powered Multi-Agent Systems (MASs) are increasingly employed to automate complex real-world problems, such as programming and scientific discovery. Despite their promising, MASs are not without their flaws. However, failure attribution in MASs - pinpointing the specific agent actions responsible for failures - remains underexplored and labor-intensive, posing significant challenges for debugging and system improvement. To bridge this gap, we propose FAMAS, the first spectrum-based failure attribution approach for MASs, which operates through systematic trajectory replay and abstraction, followed by spectrum analysis.The core idea of FAMAS is to estimate, from variations across repeated MAS executions, the likelihood that each agent action is responsible for the failure. In particular, we propose a novel suspiciousness formula tailored to MASs, which integrates two key factor groups, namely the agent behavior group and the action behavior group, to account for the agent activation patterns and the action activation patterns within the execution trajectories of MASs. Through expensive evaluations against 12 baselines on the Who and When benchmark, FAMAS demonstrates superior performance by outperforming all the methods in comparison.
- Abstract(参考訳): 大規模言語モデルパワードマルチエージェントシステム(MAS)は、プログラミングや科学的発見といった複雑な現実世界の問題を自動化するために、ますます採用されている。
将来性はあるものの、MASには欠陥がない。
しかしながら、MASの障害帰属 – 障害の原因となる特定のエージェントアクションを指示する – は、まだ調査が過小評価されており、労働集約的であり、デバッグやシステム改善に重大な課題を提起している。
このギャップを埋めるため,MASに対する最初のスペクトルベースの障害帰属アプローチであるFAMASを提案し,続いてスペクトル解析を行い,各エージェントアクションが障害の原因となる可能性を推定する。
特に, エージェント行動群とアクション行動群という2つの重要な因子群を統合し, エージェント活性化パターンと行動活性化パターンをMASの実行軌跡内で考慮する,MASに合わせた新しい不審性公式を提案する。
Who and Whenベンチマークにおける12のベースラインに対する高価な評価を通じて、FAMASは、比較対象のすべてのメソッドよりも優れたパフォーマンスを示す。
関連論文リスト
- An Empirical Study on Failures in Automated Issue Solving [12.571536148821144]
我々は,SWE-Bench-Verifiedの自動問題解決タスクにおいて,パイプラインベースとエージェントアーキテクチャの両方にまたがる3つのSOTAツールの性能と効率を分析する。
ハイレベルなパフォーマンス指標から根本原因分析に移行するために,150件の障害事例の体系的手動分析を行った。
その結果、2つのアーキテクチャパラダイムの間には明確な失敗の指紋が明らかとなり、ほとんどのエージェント的失敗は、欠陥のある推論と認知的デッドロックに起因する。
論文 参考訳(メタデータ) (2025-09-17T13:07:52Z) - Automatic Failure Attribution and Critical Step Prediction Method for Multi-Agent Systems Based on Causal Inference [8.823529310904162]
マルチエージェントシステム(MAS)は複雑なタスクの自動化に不可欠であるが、その実践的展開は障害帰属の課題によって妨げられている。
マルチグラニュラリティ因果推論に基づくMASのための最初の失敗帰属フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-10T15:22:00Z) - LumiMAS: A Comprehensive Framework for Real-Time Monitoring and Enhanced Observability in Multi-Agent Systems [20.35152929165441]
提案するフレームワークは,監視層とロギング層,異常検出層,異常説明層という3つの重要なコンポーネントで構成されている。
LumiMASは7種類のMASアプリケーションで評価され、2つの人気のあるMASプラットフォームを使って実装された。
論文 参考訳(メタデータ) (2025-08-17T15:55:02Z) - MAS-ZERO: Designing Multi-Agent Systems with Zero Supervision [76.42361936804313]
自動MAS設計のための自己進化型推論時間フレームワークMAS-ZEROを紹介する。
MAS-ZEROはメタレベルの設計を採用し、各問題インスタンスに適したMAS構成を反復的に生成し、評価し、洗練する。
論文 参考訳(メタデータ) (2025-05-21T00:56:09Z) - Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.29939179830491]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文 参考訳(メタデータ) (2025-04-30T23:09:44Z) - Why Do Multi-Agent LLM Systems Fail? [91.39266556855513]
MAST(Multi-Agent System Failure taxonomy, MAST)は,MASの故障を理解するために考案された分類法である。
我々は、200以上のタスクにまたがる7つの人気のあるMASフレームワークを分析し、6つの専門家のアノテータを含む。
14のユニークな障害モードを特定し、(i)仕様問題、(ii)エージェント間ミスアライメント、(iii)タスク検証の3つに分類した。
論文 参考訳(メタデータ) (2025-03-17T19:04:38Z) - A Cooperative Multi-Agent Framework for Zero-Shot Named Entity Recognition [71.61103962200666]
ゼロショット名付きエンティティ認識(NER)は、注釈のないテキストコーパスからエンティティ認識システムを開発することを目的としている。
最近の研究は、特別なプロンプトテンプレートを作成することで、ゼロショットNERに大規模な言語モデル(LLM)を適用している。
ゼロショットNERのための新しいフレームワークである協調型マルチエージェントシステム(CMAS)を紹介する。
論文 参考訳(メタデータ) (2025-02-25T23:30:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。