論文の概要: Detecting Silent Failures in Multi-Agentic AI Trajectories
- arxiv url: http://arxiv.org/abs/2511.04032v1
- Date: Thu, 06 Nov 2025 04:00:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-07 20:17:53.295854
- Title: Detecting Silent Failures in Multi-Agentic AI Trajectories
- Title(参考訳): マルチエージェントAI軌道における無声障害の検出
- Authors: Divya Pathak, Harshit Kumar, Anuska Roy, Felix George, Mudit Verma, Pratibha Moogi,
- Abstract要約: マルチエージェントAIシステムは、ドリフトやサイクル、アウトプットにおける詳細の欠如など、サイレントな障害を起こしやすい。
エージェント軌道における異常検出のタスクを導入し、これらの障害を識別し、データセットキュレーションパイプラインを示す。
この研究は、マルチエージェントAIシステムにおける異常検出に関する最初の体系的な研究を提供し、将来の研究を導くためのデータセット、ベンチマーク、洞察を提供する。
- 参考スコア(独自算出の注目度): 7.001329254828447
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-Agentic AI systems, powered by large language models (LLMs), are inherently non-deterministic and prone to silent failures such as drift, cycles, and missing details in outputs, which are difficult to detect. We introduce the task of anomaly detection in agentic trajectories to identify these failures and present a dataset curation pipeline that captures user behavior, agent non-determinism, and LLM variation. Using this pipeline, we curate and label two benchmark datasets comprising \textbf{4,275 and 894} trajectories from Multi-Agentic AI systems. Benchmarking anomaly detection methods on these datasets, we show that supervised (XGBoost) and semi-supervised (SVDD) approaches perform comparably, achieving accuracies up to 98% and 96%, respectively. This work provides the first systematic study of anomaly detection in Multi-Agentic AI systems, offering datasets, benchmarks, and insights to guide future research.
- Abstract(参考訳): 大規模言語モデル(LLM)を駆使したマルチエージェントAIシステムは本質的に非決定論的であり、ドリフトやサイクル、出力の詳細の欠如といったサイレントな障害を引き起こす傾向があり、検出が困難である。
エージェントトラジェクトリにおける異常検出のタスクを導入し、これらの障害を識別し、ユーザ行動、エージェント非決定性、LLM変動をキャプチャするデータセットキュレーションパイプラインを提案する。
このパイプラインを使用して、マルチエージェントAIシステムからのtextbf{4,275,894}トラジェクトリからなる2つのベンチマークデータセットをキュレートし、ラベル付けする。
これらのデータセット上で異常検出手法のベンチマークを行い、教師付き(XGBoost)と半教師付き(SVDD)のアプローチが相容れないことを示し、それぞれ98%と96%の精度を達成した。
この研究は、マルチエージェントAIシステムにおける異常検出に関する最初の体系的な研究を提供し、将来の研究を導くためのデータセット、ベンチマーク、洞察を提供する。
関連論文リスト
- Reasoning-based Anomaly Detection Framework: A Real-time, Scalable, and Automated Approach to Anomaly Detection Across Domains [3.804483269194178]
Reasoning based Anomaly Detection Framework (RADF) は、非常に大きなデータセットでリアルタイムな異常検出を行うように設計されている。
RADFは9つの公開ベンチマークデータセットのうち5つで、AUCのパフォーマンスにおける最先端の異常検出モデルを上回っている。
論文 参考訳(メタデータ) (2025-10-03T20:06:31Z) - PATH: A Discrete-sequence Dataset for Evaluating Online Unsupervised Anomaly Detection Approaches for Multivariate Time Series [0.01874930567916036]
多変量時系列に対する異常検出手法のベンチマークは、高品質なデータセットが不足しているため、難しい課題である。
我々は、最先端のシミュレーションツールによって生成される多種多様な、広範囲で、非自明なデータセットという解決策を提案する。
我々のデータセットは離散列問題を表しており、文献でこれまで提案されていた解には未適応のままである。
論文 参考訳(メタデータ) (2024-11-21T09:03:12Z) - Anomaly Detection of Tabular Data Using LLMs [54.470648484612866]
我々は,事前訓練された大規模言語モデル (LLM) がゼロショットバッチレベルの異常検出器であることを示す。
本稿では,実異常検出におけるLCMの潜在性を明らかにするために,エンドツーエンドの微調整手法を提案する。
論文 参考訳(メタデータ) (2024-06-24T04:17:03Z) - Self-supervised Feature Adaptation for 3D Industrial Anomaly Detection [59.41026558455904]
具体的には,大規模ビジュアルデータセット上で事前学習されたモデルを利用した初期のマルチモーダルアプローチについて検討する。
本研究では,アダプタを微調整し,異常検出に向けたタスク指向の表現を学習するためのLSFA法を提案する。
論文 参考訳(メタデータ) (2024-01-06T07:30:41Z) - Progressing from Anomaly Detection to Automated Log Labeling and
Pioneering Root Cause Analysis [53.24804865821692]
本研究では、ログ異常の分類を導入し、ラベル付けの課題を軽減するために、自動ラベリングについて検討する。
この研究は、根本原因分析が異常検出に続く未来を予見し、異常の根本原因を解明する。
論文 参考訳(メタデータ) (2023-12-22T15:04:20Z) - Robust Multimodal Failure Detection for Microservice Systems [32.25907616511765]
AnoFusionは、マイクロサービスシステムに対する教師なしの障害検出アプローチである。
異種マルチモーダルデータの相関を学習し、グラフ注意ネットワーク(GAT)とGRU(Gated Recurrent Unit)を統合する。
これはそれぞれ0.857と0.922のF1スコアを達成し、最先端の故障検出手法より優れている。
論文 参考訳(メタデータ) (2023-05-30T12:39:42Z) - Deep Anomaly Detection and Search via Reinforcement Learning [22.005663849044772]
本研究では,エクスプロイトと探索のバランスをとるために,DADS(Deep Anomaly Detection and Search)を提案する。
トレーニングプロセス中、DADSは階層的なデータセットを持つ可能性のある異常を検索する。
その結果,DADSはラベルのないデータから異常を効率よく正確に検索し,そこから学習できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T13:03:33Z) - DAE : Discriminatory Auto-Encoder for multivariate time-series anomaly
detection in air transportation [68.8204255655161]
識別オートエンコーダ(DAE)と呼ばれる新しい異常検出モデルを提案する。
通常のLSTMベースのオートエンコーダのベースラインを使用するが、いくつかのデコーダがあり、それぞれ特定の飛行フェーズのデータを取得する。
その結果,DAEは精度と検出速度の両方で良好な結果が得られることがわかった。
論文 参考訳(メタデータ) (2021-09-08T14:07:55Z) - Contextual-Bandit Anomaly Detection for IoT Data in Distributed
Hierarchical Edge Computing [65.78881372074983]
IoTデバイスは複雑なディープニューラルネットワーク(DNN)モデルにはほとんど余裕がなく、異常検出タスクをクラウドにオフロードすることは長い遅延を引き起こす。
本稿では,分散階層エッジコンピューティング(HEC)システムを対象とした適応型異常検出手法のデモと構築を行う。
提案手法は,検出タスクをクラウドにオフロードした場合と比較して,精度を犠牲にすることなく検出遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2020-04-15T06:13:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。