論文の概要: Generate Complete Logging Statements with an Efficient End-to-End
Approach
- arxiv url: http://arxiv.org/abs/2311.02862v1
- Date: Mon, 6 Nov 2023 04:26:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 15:24:45.059337
- Title: Generate Complete Logging Statements with an Efficient End-to-End
Approach
- Title(参考訳): 効率的なエンドツーエンドアプローチによる完全ロギングステートメントの生成
- Authors: Xiaoyuan Xie, Zhipeng Cai, Songqiang Chen, Jifeng Xuan
- Abstract要約: 本稿では,ロギングステートメントの自動生成を支援する新しい手法を提案する。
エンドツーエンドの手法は,まずトークン分類を利用してログステートメントを挿入する場所を特定し,次にSeq2Seqモデルを用いてログレベルとログメッセージの完全なログステートメントを生成する。
- 参考スコア(独自算出の注目度): 6.341570733705265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Logs are significant in modern software systems, aiding in various
maintenance tasks. To make better use of these logs, many methods have been
proposed to help developers draft suitable logging statements. However, these
methods only help developers either locate logging positions or write partial
content of logging statements, or cannot efficiently help in generating and
inserting complete logging statements. To address their limitations, we
introduce a new method to better support the automated end-to-end generation of
logging statements. Our end-to-end method consists of two steps, first
utilizing token classification to locate where to insert a logging statement,
and then employing a Seq2Seq model to generate a complete logging statement
with a log level and a log message for that position. We evaluate our proposed
method on the previously used benchmark and a self-constructed new benchmark.
The experimental results show that our method outperforms the state-of-the-art
approach a lot regarding both generation speed and quality.
- Abstract(参考訳): ログは現代のソフトウェアシステムにおいて重要であり、様々なメンテナンスタスクを支援する。
これらのログをよりよく利用するために、開発者が適切なロギングステートメントをドラフトするのに役立つ多くのメソッドが提案されている。
しかし、これらのメソッドは、ロギングの位置を見つけるか、ロギングステートメントの部分的なコンテンツを書くか、完全なロギングステートメントの生成と挿入を効率的に助けることができない。
これらの制限に対処するために,ログステートメントの自動生成をよりよくサポートする新しい手法を提案する。
エンドツーエンドの手法は,まずトークン分類を利用してログステートメントを挿入する場所を特定し,次にSeq2Seqモデルを用いてログレベルとログメッセージの完全なログステートメントを生成する。
提案手法を,以前に使用したベンチマークと自己構築型ベンチマークで評価した。
実験の結果,本手法は,生成速度と品質の両面において最先端のアプローチをかなり上回っていることがわかった。
関連論文リスト
- Studying and Benchmarking Large Language Models For Log Level Suggestion [49.176736212364496]
大規模言語モデル(LLM)は、様々な領域で研究の焦点となっている。
本稿では,12個のオープンソースLCMのログレベル提案における性能に及ぼす特性と学習パラダイムの影響について検討する。
論文 参考訳(メタデータ) (2024-10-11T03:52:17Z) - Log Statements Generation via Deep Learning: Widening the Support
Provided to Developers [16.079459379684554]
LANCEはディープラーニング(DL)に根ざしたアプローチで、Javaメソッドにログステートメントを正しく注入する能力を示している。
本稿では,ログステートメントを含まないメソッドを識別するDLベースの手法であるLEONIDを提案する。
論文 参考訳(メタデータ) (2023-11-08T10:31:18Z) - A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。
我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文 参考訳(メタデータ) (2023-08-21T16:24:15Z) - Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文 参考訳(メタデータ) (2023-08-17T14:19:22Z) - Are They All Good? Studying Practitioners' Expectations on the
Readability of Log Messages [18.823475517909884]
ログメッセージの重要性にもかかわらず、ログメッセージの可読性を構成する標準がまだ不足している。
我々は,ログメッセージの可読性に対する期待を調査するため,産業従事者17人と一連のインタビューを行った。
ディープラーニングモデルと機械学習モデルの両方が、平均80.0%以上のバランスの取れた精度でログメッセージの読みやすさを効果的に分類できることがわかった。
論文 参考訳(メタデータ) (2023-08-17T07:53:24Z) - LongCoder: A Long-Range Pre-trained Language Model for Code Completion [56.813974784131624]
LongCoderは自己アテンションにスライディングウィンドウ機構を採用し、グローバルアクセス可能なトークンを2種類導入している。
ブリッジトークンは入力シーケンス全体を通して挿入され、ローカル情報を集約し、グローバルな相互作用を促進する。
メモリトークンは、後で呼び出され、記憶する必要がある重要なステートメントをハイライトするために含まれます。
論文 参考訳(メタデータ) (2023-06-26T17:59:24Z) - Unified Pretraining Framework for Document Understanding [52.224359498792836]
文書理解のための統合事前学習フレームワークであるUDocを紹介する。
UDocは、ほとんどのドキュメント理解タスクをサポートするように設計されており、Transformerを拡張してマルチモーダル埋め込みを入力とする。
UDocの重要な特徴は、3つの自己管理的損失を利用して汎用的な表現を学ぶことである。
論文 参考訳(メタデータ) (2022-04-22T21:47:04Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log
Statement Automation [0.0]
ログステートメントの位置を予測するために,更新および改良されたログ対応コードクローン検出手法を提案する。
我々は,自然言語処理(NLP)と深層学習手法を組み込んで,ログステートメントの記述予測を自動化する。
解析の結果、我々のハイブリッドNLPとコードクローン検出手法(NLP CC'd)は、ログステートメントの場所を見つける際に従来のクローン検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-12-02T14:03:49Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。