Fugu-MT 論文翻訳(概要): Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log Statement Automation

論文の概要: Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log Statement Automation

arxiv url: http://arxiv.org/abs/2112.01259v1
Date: Thu, 2 Dec 2021 14:03:49 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-03 17:34:44.451412
Title: Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log Statement Automation
Title（参考訳）: 類似コードからの借用: ログステートメント自動化のためのディープラーニングNLPベースのアプローチ
Authors: Sina Gholamian and Paul A. S. Ward
Abstract要約: ログステートメントの位置を予測するために,更新および改良されたログ対応コードクローン検出手法を提案する。我々は,自然言語処理(NLP)と深層学習手法を組み込んで,ログステートメントの記述予測を自動化する。解析の結果、我々のハイブリッドNLPとコードクローン検出手法(NLP CC'd)は、ログステートメントの場所を見つける際に従来のクローン検出器よりも優れていることがわかった。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Software developers embed logging statements inside the source code as an imperative duty in modern software development as log files are necessary for tracking down runtime system issues and troubleshooting system management tasks. However, the current logging process is mostly manual, and thus, proper placement and content of logging statements remain as challenges. To overcome these challenges, methods that aim to automate log placement and predict its content, i.e., 'where and what to log', are of high interest. Thus, we focus on predicting the location (i.e., where) and description (i.e., what) for log statements by utilizing source code clones and natural language processing (NLP), as these approaches provide additional context and advantage for log prediction. Specifically, we guide our research with three research questions (RQs): (RQ1) how similar code snippets, i.e., code clones, can be leveraged for log statements prediction? (RQ2) how the approach can be extended to automate log statements' descriptions? and (RQ3) how effective the proposed methods are for log location and description prediction? To pursue our RQs, we perform an experimental study on seven open-source Java projects. We introduce an updated and improved log-aware code-clone detection method to predict the location of logging statements (RQ1). Then, we incorporate natural language processing (NLP) and deep learning methods to automate the log statements' description prediction (RQ2). Our analysis shows that our hybrid NLP and code-clone detection approach (NLP CC'd) outperforms conventional clone detectors in finding log statement locations on average by 15.60% and achieves 40.86% higher performance on BLEU and ROUGE scores for predicting the description of logging statements when compared to prior research (RQ3).
Abstract（参考訳）: ソフトウェア開発者は、実行時のシステムの問題を追跡し、システム管理タスクをトラブルシューティングするためにログファイルが必要となるため、現代のソフトウェア開発において必須任務として、ソースコード内にロギングステートメントを埋め込む。しかし、現在のロギングプロセスはほとんど手動で行われており、ログステートメントの適切な配置と内容が課題として残っている。これらの課題を克服するために、ログ配置を自動化し、その内容、すなわち「ログする場所と場所」を予測する手法が注目されている。そこで我々は,これらの手法がログ予測に新たな文脈と利点をもたらすため,ソースコードクローンと自然言語処理(nlp)を利用して,ログ文の位置(すなわち場所)と記述(すなわち何)の予測に重点を置いている。具体的には、3つの調査質問(rqs): (rq1) 同じようなコードスニペット、すなわちコードクローンがログステートメントの予測にどのように活用できるか? (RQ2) ログステートメントの記述を自動化するためにどのようにアプローチを拡張することができるのか? そして(RQ3) 提案手法はログの位置と記述予測にどの程度有効か? rqsを追求するために、7つのオープンソースjavaプロジェクトに関する実験研究を行いました。ロギングステートメント(RQ1)の位置を予測するために,更新および改良されたログ対応コードクローン検出手法を提案する。次に,自然言語処理(NLP)と深層学習を取り入れ,ログステートメントの記述予測(RQ2)を自動化する。我々のハイブリッドNLPおよびコードクローン検出手法(NLP CC'd)は,ログステートメント位置を平均15.60%,BLEUおよびROUGEスコアで40.86%向上し,ログステートメントの記述を先行研究(RQ3)と比較して予測する。

関連論文リスト

PDLogger: Automated Logging Framework for Practical Software Development [7.860311994179783]
既存の自動ロギング技術は、分離されたサブタスクに焦点を当てている。 PDLoggerは、実用的なマルチログシナリオ向けに設計された最初のエンドツーエンドのログ生成技術である。 F1は69.2%、レベル精度は82.3%、変数精度は131.8%、メッセージ品質(BERTScore)は65.7%である。
論文参考訳（メタデータ） (2025-07-26T13:35:57Z)
QiMeng-CodeV-R1: Reasoning-Enhanced Verilog Generation [51.393569044134445]
大きな言語モデル(LLM)は、強化学習と検証可能な報酬(RLVR)によって訓練され、明示的で自動化可能な検証を伴うタスクにおいてブレークスルーを達成した。しかし、自然言語(NL)仕様からVerilogのようなハードウェア記述言語(HDL)を自動的に生成するRLVRの拡張には、3つの大きな課題がある。本稿では,Verilog 生成 LLM をトレーニングするための RLVR フレームワークである CodeV-R1 を紹介する。
論文参考訳（メタデータ） (2025-05-30T03:51:06Z)
Log-Augmented Generation: Scaling Test-Time Reasoning with Reusable Computation [80.69067017594709]
大規模言語モデル(LLM)とそのエージェントモデルは、以前のタスクからの推論を維持するのに苦労する。本稿では,従来の計算を直接再利用し,テスト時に過去のログから推論する新しいフレームワークであるLAGを提案する。本手法は,ログを使用しない標準的なエージェントシステムよりも優れている。
論文参考訳（メタデータ） (2025-05-20T14:14:38Z)
AL-Bench: A Benchmark for Automatic Logging [3.8293110324859505]
自動ロギングツールに特化して設計されたベンチマークであるAL-Benchを紹介する。 AL-Benchには、広く認識されている10のプロジェクトから収集された、大規模で高品質で多様なデータセットが含まれている。ソースコードレベルでの従来の静的評価に加えて、ロギング品質のランタイム視点を提供する。
論文参考訳（メタデータ） (2025-02-05T13:32:39Z)
LogLLM: Log-based Anomaly Detection Using Large Language Models [8.03646578793411]
大規模言語モデル(LLM)を活用するログベースの異常検出フレームワークであるLogLLMを提案する。 LogLLMはBERTを使用してログメッセージからセマンティックベクターを抽出し、変換器デコーダベースのモデルであるLlamaを使ってログシーケンスを分類する。我々のフレームワークは、性能と適応性を高めるために設計された新しい3段階の手順によって訓練されている。
論文参考訳（メタデータ） (2024-11-13T12:18:00Z)
Studying and Benchmarking Large Language Models For Log Level Suggestion [49.176736212364496]
大規模言語モデル(LLM)は、様々な領域で研究の焦点となっている。本稿では,12個のオープンソースLCMのログレベル提案における性能に及ぼす特性と学習パラダイムの影響について検討する。
論文参考訳（メタデータ） (2024-10-11T03:52:17Z)
LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection [73.69399219776315]
本稿では,ログ異常検出(LogFormer)のためのTransformerベースの統合フレームワークを提案する。具体的には、ログデータの共有セマンティック知識を得るために、まず、ソースドメイン上で事前学習を行う。そして、そのような知識を共有パラメータを介して対象領域に転送する。
論文参考訳（メタデータ） (2024-01-09T12:55:21Z)
Log Statements Generation via Deep Learning: Widening the Support Provided to Developers [16.079459379684554]
LANCEはディープラーニング(DL)に根ざしたアプローチで、Javaメソッドにログステートメントを正しく注入する能力を示している。本稿では,ログステートメントを含まないメソッドを識別するDLベースの手法であるLEONIDを提案する。
論文参考訳（メタデータ） (2023-11-08T10:31:18Z)
A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文参考訳（メタデータ） (2023-08-21T16:24:15Z)
Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文参考訳（メタデータ） (2023-08-17T14:19:22Z)
Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。 1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文参考訳（メタデータ） (2022-04-06T07:02:23Z)
LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak Supervision [63.08516384181491]
専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
論文参考訳（メタデータ） (2021-11-02T15:16:08Z)
Leveraging Code Clones and Natural Language Processing for Log Statement Prediction [0.0]
本研究の目的は、ソースコードクローンと自然言語処理(NLP)を利用してログステートメントを予測することである。本研究は,ログの自動位置検出と記述予測におけるログ認識型クローン検出の有効性を示す。
論文参考訳（メタデータ） (2021-09-08T18:17:45Z)
Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。既存のアプローチは、ログ特化や手動ルール抽出に依存している。本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文参考訳（メタデータ） (2020-03-17T19:25:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。