論文の概要: PDLogger: Automated Logging Framework for Practical Software Development
- arxiv url: http://arxiv.org/abs/2507.19951v1
- Date: Sat, 26 Jul 2025 13:35:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.480776
- Title: PDLogger: Automated Logging Framework for Practical Software Development
- Title(参考訳): PDLogger: 実用的なソフトウェア開発のための自動ロギングフレームワーク
- Authors: Shengcheng Duan, Yihua Xu, Sheng Zhang, Shen Wang, Yue Duan,
- Abstract要約: 既存の自動ロギング技術は、分離されたサブタスクに焦点を当てている。
PDLoggerは、実用的なマルチログシナリオ向けに設計された最初のエンドツーエンドのログ生成技術である。
F1は69.2%、レベル精度は82.3%、変数精度は131.8%、メッセージ品質(BERTScore)は65.7%である。
- 参考スコア(独自算出の注目度): 7.860311994179783
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Logging is indispensable for maintaining the reliability and diagnosability of modern software, yet developers still struggle to decide where and how to log effectively. Existing automated logging techniques focus on isolated sub-tasks - predicting a single log position, level, or message - and therefore cannot produce complete, high-quality log statements that reflect real-world practice in which multiple logs often appear inside one method. They also neglect deeper semantic dependencies among methods and consider only a narrow set of candidate variables, leading to superficial or incomplete logs. In this paper, we present PDLogger, the first end-to-end log generation technique expressly designed for practical, multi-log scenarios. PDLogger operates in three phases. (1) Log position prediction: block-type-aware structured prompts guide a large language model (LLM) to suggest candidate positions across all control-flow blocks of a method. (2) Log generation: backward program slicing supplies precise inter-procedural control and data-dependency context, while an expanded variable extractor captures both member and external function expressions; the enriched prompt enables the LLM to emit a full log statement (position, level, message, variables). (3) Log refinement: level correction and context-sensitive deduplication prune false positives and redundant logs. We evaluate PDLogger on 3,113 log statements drawn from two widely used Java projects. Compared with the strongest prior systems, PDLogger improves log-position precision by 139.0 percent, F1 by 69.2 percent, level accuracy by 82.3 percent, variable precision by 131.8 percent, and message quality (BERTScore) by 65.7 percent. The framework consistently performs well with different mainstream LLMs, demonstrating robustness and generality. PDLogger's implementation is available as open source to foster future research and adoption.
- Abstract(参考訳): 現代のソフトウェアの信頼性と診断可能性を維持するにはロギングは不可欠だが、開発者は依然として、どこで、どのようにログを効果的に記録するかを決めるのに苦労している。
既存の自動ロギング技術では,独立したサブタスク – 単一のログ位置,レベル,あるいはメッセージ – に重点を置いているため,複数のログがひとつのメソッド内に現れるような現実的なプラクティスを反映した,完全な高品質なログステートメントを生成することはできない。
また、メソッド間の深いセマンティック依存関係を無視し、候補変数の狭いセットのみを考慮し、表面的あるいは不完全なログにつながる。
本稿では,実用的マルチログシナリオ向けに設計された最初のエンドツーエンドログ生成技術であるPDLoggerを提案する。
PDLoggerは3つのフェーズで動作する。
1)ログ位置予測:ブロック型認識型構造化プロンプトは,大規模言語モデル (LLM) を誘導し,メソッドのすべての制御フローブロックにまたがる候補位置を提案する。
2)ログ生成:後方プログラムスライシングは、厳密なプロセス間制御とデータ依存性コンテキストを提供する一方、拡張変数抽出器は、メンバと外部関数の両方をキャプチャする。
(3)ログリファインメント:レベル補正と文脈に敏感な重複の偽陽性と冗長なログ。
広く使われている2つのJavaプロジェクトから引き出された3,113のログステートメントに対してPDLoggerを評価した。
PDLoggerは最強のシステムと比較して、ログポジション精度を139.0パーセント、F1を69.2%、レベル精度を82.3%、変数精度を131.8パーセント、メッセージ品質(BERTScore)を65.7%改善している。
このフレームワークは、さまざまなメインストリーム LLM で一貫して機能し、堅牢性と汎用性を実証している。
PDLoggerの実装は、将来の研究と採用を促進するためにオープンソースとして利用可能である。
関連論文リスト
- EquiBench: Benchmarking Large Language Models' Understanding of Program Semantics via Equivalence Checking [55.81461218284736]
EquiBenchは、大規模言語モデル(LLM)を評価するための新しいベンチマークである。
2つのプログラムが全ての可能な入力に対して同一の出力を生成するかどうかを決定する。
19の最先端LCMを評価し、最高の精度は63.8%と76.2%であり、これは50%のランダムベースラインよりわずかに高い。
論文 参考訳(メタデータ) (2025-02-18T02:54:25Z) - AL-Bench: A Benchmark for Automatic Logging [3.8293110324859505]
自動ロギングツールに特化して設計されたベンチマークであるAL-Benchを紹介する。
AL-Benchには、広く認識されている10のプロジェクトから収集された、大規模で高品質で多様なデータセットが含まれている。
ソースコードレベルでの従来の静的評価に加えて、ロギング品質のランタイム視点を提供する。
論文 参考訳(メタデータ) (2025-02-05T13:32:39Z) - LogLLM: Log-based Anomaly Detection Using Large Language Models [7.7704116297749675]
大規模言語モデル(LLM)を活用するログベースの異常検出フレームワークであるLogLLMを提案する。
LogLLMはBERTを使用してログメッセージからセマンティックベクターを抽出し、変換器デコーダベースのモデルであるLlamaを使ってログシーケンスを分類する。
我々のフレームワークは、性能と適応性を高めるために設計された新しい3段階の手順によって訓練されている。
論文 参考訳(メタデータ) (2024-11-13T12:18:00Z) - Studying and Benchmarking Large Language Models For Log Level Suggestion [49.176736212364496]
大規模言語モデル(LLM)は、様々な領域で研究の焦点となっている。
本稿では,12個のオープンソースLCMのログレベル提案における性能に及ぼす特性と学習パラダイムの影響について検討する。
論文 参考訳(メタデータ) (2024-10-11T03:52:17Z) - LogParser-LLM: Advancing Efficient Log Parsing with Large Language Models [19.657278472819588]
LLM機能と統合された新しいログであるLog-LLMを紹介する。
粒度を解析する複雑な課題に対処し、ユーザが特定のニーズに合わせて粒度を調整できるようにするための新しい指標を提案する。
提案手法の有効性は,Loghub-2kと大規模LogPubベンチマークを用いて実験的に検証した。
論文 参考訳(メタデータ) (2024-08-25T05:34:24Z) - Log Probabilities Are a Reliable Estimate of Semantic Plausibility in Base and Instruction-Tuned Language Models [50.15455336684986]
意味的妥当性を評価するため,LogProbsの有効性と基本的なプロンプトを評価した。
LogProbsは、直接ゼロショットプロンプトよりも、より信頼性の高いセマンティックな妥当性を提供する。
我々は,プロンプトベースの評価の時代においても,LogProbsは意味的妥当性の有用な指標である,と結論付けた。
論文 参考訳(メタデータ) (2024-03-21T22:08:44Z) - Go Static: Contextualized Logging Statement Generation [38.15795803230719]
SCLoggerは、メソッド間の静的コンテキストを持つコンテキスト化されたロギングステートメント生成アプローチである。
SCLoggerは最先端のアプローチを8.7%のロギング精度、32.1%のレベル精度、19.6%の変数精度、138.4%のテキストBLEU-4スコアで上回っている。
論文 参考訳(メタデータ) (2024-02-20T12:22:59Z) - LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection [73.69399219776315]
本稿では,ログ異常検出(LogFormer)のためのTransformerベースの統合フレームワークを提案する。
具体的には、ログデータの共有セマンティック知識を得るために、まず、ソースドメイン上で事前学習を行う。
そして、そのような知識を共有パラメータを介して対象領域に転送する。
論文 参考訳(メタデータ) (2024-01-09T12:55:21Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log
Statement Automation [0.0]
ログステートメントの位置を予測するために,更新および改良されたログ対応コードクローン検出手法を提案する。
我々は,自然言語処理(NLP)と深層学習手法を組み込んで,ログステートメントの記述予測を自動化する。
解析の結果、我々のハイブリッドNLPとコードクローン検出手法(NLP CC'd)は、ログステートメントの場所を見つける際に従来のクローン検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-12-02T14:03:49Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。