論文の概要: End-to-End Automated Logging via Multi-Agent Framework
- arxiv url: http://arxiv.org/abs/2511.18528v1
- Date: Sun, 23 Nov 2025 16:45:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.882128
- Title: End-to-End Automated Logging via Multi-Agent Framework
- Title(参考訳): マルチエージェントフレームワークによるエンドツーエンド自動ロギング
- Authors: Renyi Zhong, Yintong Huo, Wenwei Gu, Yichen Li, Michael R. Lyu,
- Abstract要約: 既存の自動ロギングツールは、多くの場合、ログ間の基本的な判断を無視する。
我々は、完全なエンドツーエンドロギングパイプラインに対処する新しいハイブリッドフレームワークであるAutologgerを提案する。
エンドツーエンド設定では、Autologgerは生成したロギングステートメントの全体的な品質を最強のベースラインに対して16.13%改善する。
- 参考スコア(独自算出の注目度): 35.280199418859034
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software logging is critical for system observability, yet developers face a dual crisis of costly overlogging and risky underlogging. Existing automated logging tools often overlook the fundamental whether-to-log decision and struggle with the composite nature of logging. In this paper, we propose Autologger, a novel hybrid framework that addresses the complete the end-to-end logging pipeline. Autologger first employs a fine-tuned classifier, the Judger, to accurately determine if a method requires new logging statements. If logging is needed, a multi-agent system is activated. The system includes specialized agents: a Locator dedicated to determining where to log, and a Generator focused on what to log. These agents work together, utilizing our designed program analysis and retrieval tools. We evaluate Autologger on a large corpus from three mature open-source projects against state-of-the-art baselines. Our results show that Autologger achieves 96.63\% F1-score on the crucial whether-to-log decision. In an end-to-end setting, Autologger improves the overall quality of generated logging statements by 16.13\% over the strongest baseline, as measured by an LLM-as-a-judge score. We also demonstrate that our framework is generalizable, consistently boosting the performance of various backbone LLMs.
- Abstract(参考訳): ソフトウェアロギングはシステムの可観測性にとって重要であるが、開発者はコストのかかるオーバーログとリスクのあるアンダーログという2つの危機に直面している。
既存の自動ロギングツールは、多くの場合、ログの複合的な性質に苦しむ、ログからログへの決定の基本的な部分を見落としている。
本稿では,エンドツーエンドロギングパイプラインの完全性に対処する新しいハイブリッドフレームワークであるAutologgerを提案する。
Autologger はまず、メソッドが新しいロギングステートメントを必要とするかどうかを正確に判断するために、微調整された分類器である judger を使用する。
ロギングが必要な場合、マルチエージェントシステムが起動される。
システムには、ログの場所を決定するためのLocatorと、ログの場所に焦点を当てたGeneratorという特殊なエージェントが含まれている。
これらのエージェントは、設計したプログラム分析と検索ツールを利用して連携する。
我々は,3つの成熟したオープンソースプロジェクトから,大規模コーパス上でAutologgerを評価した。
以上の結果から,Autologger は F1スコア 96.63 % を達成した。
エンドツーエンド設定では、LDM-as-a-judgeスコアによって測定されるように、Autologgerは最強のベースライン上で生成されたロギングステートメントの全体的な品質を16.13\%向上する。
また、我々のフレームワークが一般化可能であることを示し、様々なバックボーンLLMの性能を継続的に向上させる。
関連論文リスト
- LogLLM: Log-based Anomaly Detection Using Large Language Models [7.7704116297749675]
大規模言語モデル(LLM)を活用するログベースの異常検出フレームワークであるLogLLMを提案する。
LogLLMはBERTを使用してログメッセージからセマンティックベクターを抽出し、変換器デコーダベースのモデルであるLlamaを使ってログシーケンスを分類する。
我々のフレームワークは、性能と適応性を高めるために設計された新しい3段階の手順によって訓練されている。
論文 参考訳(メタデータ) (2024-11-13T12:18:00Z) - HELP: Hierarchical Embeddings-based Log Parsing [0.25112747242081457]
ログは、ソフトウェアのメンテナンスと障害診断のための、第一級の情報ソースである。
ログ解析は、異常検出、トラブルシューティング、根本原因分析などの自動ログ解析タスクの前提条件である。
既存のオンライン解析アルゴリズムは、ログドリフトの影響を受けやすい。
論文 参考訳(メタデータ) (2024-08-15T17:54:31Z) - A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。
我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文 参考訳(メタデータ) (2023-08-21T16:24:15Z) - AutoLog: A Log Sequence Synthesis Framework for Anomaly Detection [34.91789047641838]
AutoLogは、異常検出のための最初の自動ログ生成手法である。
実際にシステムを実行することなく、実行時のログシーケンスを生成する。
人間の知識に基づいて、取得した各実行パスに異常ラベルを伝搬する。
論文 参考訳(メタデータ) (2023-08-18T05:56:18Z) - Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文 参考訳(メタデータ) (2023-08-17T14:19:22Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak
Supervision [63.08516384181491]
専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。
本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。
我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
論文 参考訳(メタデータ) (2021-11-02T15:16:08Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。