論文の概要: FAME: Failure-Aware Mixture-of-Experts for Message-Level Log Anomaly Detection
- arxiv url: http://arxiv.org/abs/2605.22779v1
- Date: Thu, 21 May 2026 17:34:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.382698
- Title: FAME: Failure-Aware Mixture-of-Experts for Message-Level Log Anomaly Detection
- Title(参考訳): FAME:メッセージレベルログ異常検出のためのフェール・アウェア・ミックス・オブ・エクササイズ
- Authors: Huanchi Wang, Zihang Huang, Yifang Tian, Kristina Dzeparoska, Hans-Arno Jacobsen, Alberto Leon-Garcia,
- Abstract要約: FAME(Failure-Aware Mixture-of-Experts)は,ラベル効率の高いメッセージレベルのミックス・オブ・エキスパートフレームワークである。
FAMEは軽量ルータと、オンプレミスで実行し、異常予測を出力するドメインエキスパートを訓練する。
BGLでは、F1 = 98.16をK = 100で達成し、76倍のアノテーションの労力を削減し、目に見えないEventIDから86.3%の異常を検出する。
- 参考スコア(独自算出の注目度): 6.975728318257755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Production systems generate millions of log lines daily, yet most anomaly detectors operate at the session or window-level, flagging groups of lines rather than identifying the specific message responsible. This coarse granularity forces operators to inspect many routine lines per alert. Message-level detection offers finer granularity, but remains challenging. A single event template may correspond to both normal and anomalous messages, failures arise from heterogeneous subsystems, and line-level labeling at scale is impractical. Although large language models (LLMs) can reason over log semantics, applying them to every line is too costly for continuous monitoring. We present FAME (Failure-Aware Mixture-of-Experts), a label-efficient message-level mixture-of-experts framework that uses an LLM only once offline. We annotate at most K labeled lines per template to derive binary normal/anomaly indicators and representative examples. The LLM proposes a partition of templates into failure domains, and a certification step validates the proposal before training. FAME trains a lightweight router and domain experts that run on-premise and output anomaly predictions and failure-domain labels. On BGL, FAME achieves F1 = 98.16 at K = 100 reducing annotation effort by 76x and detects 86.3% of anomalies from unseen EventIDs. On Thunderbird, FAME reaches F1 = 99.95 with perfect recall.
- Abstract(参考訳): プロダクションシステムは毎日数百万のログ行を生成するが、ほとんどの異常検知器はセッションやウィンドウレベルで動作し、特定のメッセージを特定するのではなく、ラインのグループにフラグを付ける。
この粗い粒度は、オペレーターに警告ごとに多くのルーチンを検査させる。
メッセージレベルの検出は、より細かい粒度を提供するが、依然として困難である。
単一のイベントテンプレートは、通常のメッセージと異常なメッセージの両方に対応し、不均一なサブシステムからエラーが発生し、スケールでのラインレベルのラベリングは実用的ではない。
大規模言語モデル(LLM)はログのセマンティクスを解析できるが、連続的な監視にはコストがかかりすぎる。
FAME(Failure-Aware Mixture-of-Experts)はラベル効率のよいメッセージレベルのMix-of-Expertsフレームワークである。
テンプレートあたりのほとんどのKラベル付き行にアノテートして、バイナリ正規/アノマリーインジケータと代表例を導出する。
LLMは、テンプレートを障害ドメインに分割することを提案し、認定ステップは、トレーニング前に提案を検証する。
FAMEは軽量ルータとドメインエキスパートをトレーニングし、オンプレミスで動作し、異常予測と障害ドメインラベルを出力する。
BGLでは、F1 = 98.16をK = 100で達成し、76倍のアノテーションの労力を削減し、目に見えないEventIDから86.3%の異常を検出する。
Thunderbirdでは、FAMEは完全リコールでF1 = 99.95に達する。
関連論文リスト
- VerifyMAS: Hypothesis Verification for Failure Attribution in LLM Multi-Agent Systems [79.51005192758262]
大規模言語モデル駆動型マルチエージェントシステムは複雑なタスクで優れている。
しかし、信頼性の低いエージェントは、システムレベルの信頼性にとって重要なボトルネックである。
本稿では,エージェント故障の帰属に関する仮説検証フレームワークを提案する。
論文 参考訳(メタデータ) (2026-05-17T14:09:35Z) - Arbiter: Detecting Interference in LLM Agent System Prompts [0.0]
Arbiterは、システムプロンプト内の干渉パターンを検出するために、形式的評価ルールとマルチモデルLCMスカーリングを組み合わせたフレームワークである。
Claude Code (Anthropic), Codex CLI (OpenAI), Gemini CLI (Google)の3つの主要なコーディングエージェントシステムに適用される。
論文 参考訳(メタデータ) (2026-03-09T22:29:47Z) - DoVer: Intervention-Driven Auto Debugging for LLM Multi-Agent Systems [48.971606069204825]
DoVerは、大規模言語モデル(LLM)ベースのマルチエージェントシステムのための介入駆動デバッグフレームワークである。
ターゲットの介入を通じて、アクティブな検証によって仮説生成を増強する。
DoVerは失敗試験の18~28%を成功させ、最大16%のマイルストーンを達成し、失敗仮説の30~60%を検証または否定する。
論文 参考訳(メタデータ) (2025-12-07T09:23:48Z) - Causal Intervention Sequence Analysis for Fault Tracking in Radio Access Networks [18.99444800453706]
1)根本原因の可能性のある指標を見つけ出し、(2)これらのイベントが展開する正確な順序を明らかにする。
私たちのモデルは、正常な振る舞いを障害に変える因果連鎖を学習します。
モンテカルロのテストでは、正しいトリガーシーケンスを高精度でピンポイントし、速度を失うことなく数百万のデータポイントにスケールする。
論文 参考訳(メタデータ) (2025-10-02T14:34:59Z) - Efficient Detection of Intermittent Job Failures Using Few-Shot Learning [2.8402080392117757]
数ショット学習を用いた断続的ジョブ故障検出のための新しい手法を提案する。
提案手法は70~88%のF1スコアを達成し,全プロジェクトで12ショットしか達成できず,SOTA(State-of-the-art)アプローチよりも優れていた。
論文 参考訳(メタデータ) (2025-07-05T22:04:01Z) - Lemur: Log Parsing with Entropy Sampling and Chain-of-Thought Merging [18.823038918091207]
我々は、textbfEntropy サンプリングとチェーン・オブ・シンクトの textbfMerging (model) を用いた最先端の textbfLog 解析フレームワークを導入する。
退屈な手作業のルールを捨てるために,情報エントロピーにインスパイアされた新しいサンプリング手法を提案し,典型的なログを効率的にクラスタリングする。
大規模な公開データセットの実験を行った。
論文 参考訳(メタデータ) (2024-02-28T09:51:55Z) - Hard-normal Example-aware Template Mutual Matching for Industrial Anomaly Detection [78.734927709231]
異常検出器は、クエリー画像の未知の欠陥を検出し、ローカライズするために工業製造で広く使われている。
これらの検出器は異常のないサンプルで訓練され、ほとんどの通常のサンプルと区別された異常を成功させた。
しかし、ハードノーマルな例は、ほとんどの通常のサンプルから遠く離れており、しばしば既存の方法によって異常と誤認される。
論文 参考訳(メタデータ) (2023-03-28T17:54:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。