論文の概要: Leveraging Code Clones and Natural Language Processing for Log Statement
Prediction
- arxiv url: http://arxiv.org/abs/2109.03859v1
- Date: Wed, 8 Sep 2021 18:17:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-10 14:02:55.440342
- Title: Leveraging Code Clones and Natural Language Processing for Log Statement
Prediction
- Title(参考訳): ログステートメント予測のためのコードクローンの活用と自然言語処理
- Authors: Sina Gholamian
- Abstract要約: 本研究の目的は、ソースコードクローンと自然言語処理(NLP)を利用してログステートメントを予測することである。
本研究は,ログの自動位置検出と記述予測におけるログ認識型クローン検出の有効性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Software developers embed logging statements inside the source code as an
imperative duty in modern software development as log files are necessary for
tracking down runtime system issues and troubleshooting system management
tasks. Prior research has emphasized the importance of logging statements in
the operation and debugging of software systems. However, the current logging
process is mostly manual and ad hoc, and thus, proper placement and content of
logging statements remain as challenges. To overcome these challenges, methods
that aim to automate log placement and log content, i.e., 'where, what, and how
to log', are of high interest. Thus, we propose to accomplish the goal of this
research, that is "to predict the log statements by utilizing source code
clones and natural language processing (NLP)", as these approaches provide
additional context and advantage for log prediction. We pursue the following
four research objectives: (RO1) investigate whether source code clones can be
leveraged for log statement location prediction, (RO2) propose a clone-based
approach for log statement prediction, (RO3) predict log statement's
description with code-clone and NLP models, and (RO4) examine approaches to
automatically predict additional details of the log statement, such as its
verbosity level and variables. For this purpose, we perform an experimental
analysis on seven open-source java projects, extract their method-level code
clones, investigate their attributes, and utilize them for log location and
description prediction. Our work demonstrates the effectiveness of log-aware
clone detection for automated log location and description prediction and
outperforms the prior work.
- Abstract(参考訳): ソフトウェア開発者は、実行時のシステムの問題を追跡し、システム管理タスクをトラブルシューティングするためにログファイルが必要となるため、現代のソフトウェア開発において必須任務として、ソースコード内にロギングステートメントを埋め込む。
以前の研究は、ソフトウェアシステムの運用とデバッグにおいてロギングステートメントの重要性を強調した。
しかし、現在のロギングプロセスはほとんど手動とアドホックなので、ロギングステートメントの適切な配置と内容が課題として残っています。
これらの課題を克服するために、ログ配置とログコンテンツ("where, what, and how to log"など)の自動化を目的とした手法が注目されている。
そこで本研究では,「ソースコードクローンと自然言語処理(NLP)を活用してログステートメントを予測する」という研究の目標を達成することを提案する。
RO1) は、ログステートメントの位置予測にソースコードクローンを活用できるか、(RO2) はログステートメント予測のためのクローンベースのアプローチを提案し、(RO3) はコードクローンとNLPモデルを用いてログステートメントの説明を予測し、(RO4) は冗長度レベルや変数などのログステートメントのさらなる詳細を自動的に予測するためのアプローチを検討する。
この目的のために,7つのオープンソースjavaプロジェクトの実験的解析を行い,メソッドレベルのコードクローンを抽出し,属性を調査し,ログの位置と記述予測に利用する。
本研究は,ログの自動位置推定と記述予測におけるログ認識型クローン検出の有効性を実証し,先行作業より優れていることを示す。
関連論文リスト
- LogFormer: A Pre-train and Tuning Pipeline for Log Anomaly Detection [73.69399219776315]
本稿では,ログ異常検出(LogFormer)のためのTransformerベースの統合フレームワークを提案する。
具体的には、ログデータの共有セマンティック知識を得るために、まず、ソースドメイン上で事前学習を行う。
そして、そのような知識を共有パラメータを介して対象領域に転送する。
論文 参考訳(メタデータ) (2024-01-09T12:55:21Z) - Log Statements Generation via Deep Learning: Widening the Support
Provided to Developers [16.079459379684554]
LANCEはディープラーニング(DL)に根ざしたアプローチで、Javaメソッドにログステートメントを正しく注入する能力を示している。
本稿では,ログステートメントを含まないメソッドを識別するDLベースの手法であるLEONIDを提案する。
論文 参考訳(メタデータ) (2023-11-08T10:31:18Z) - Generate Complete Logging Statements with an Efficient End-to-End
Approach [6.341570733705265]
本稿では,ロギングステートメントの自動生成を支援する新しい手法を提案する。
エンドツーエンドの手法は,まずトークン分類を利用してログステートメントを挿入する場所を特定し,次にSeq2Seqモデルを用いてログレベルとログメッセージの完全なログステートメントを生成する。
論文 参考訳(メタデータ) (2023-11-06T04:26:20Z) - Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文 参考訳(メタデータ) (2023-08-17T14:19:22Z) - On the Effectiveness of Log Representation for Log-based Anomaly
Detection [14.58848716249407]
本研究は,従来のログ解析研究から広く採用されているログ表現技術について検討し,比較する。
6つのログ表現手法を選択し、7つのMLモデルと4つの公開ログデータセットで評価する。
また、ログ表現技術を採用する際に、ログ解析プロセスと異なる特徴集約アプローチの影響についても検討する。
論文 参考訳(メタデータ) (2023-08-17T02:18:59Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log
Statement Automation [0.0]
ログステートメントの位置を予測するために,更新および改良されたログ対応コードクローン検出手法を提案する。
我々は,自然言語処理(NLP)と深層学習手法を組み込んで,ログステートメントの記述予測を自動化する。
解析の結果、我々のハイブリッドNLPとコードクローン検出手法(NLP CC'd)は、ログステートメントの場所を見つける際に従来のクローン検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-12-02T14:03:49Z) - LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak
Supervision [63.08516384181491]
専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。
本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。
我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
論文 参考訳(メタデータ) (2021-11-02T15:16:08Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。