論文の概要: Are They All Good? Studying Practitioners' Expectations on the
Readability of Log Messages
- arxiv url: http://arxiv.org/abs/2308.08836v1
- Date: Thu, 17 Aug 2023 07:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 13:49:37.392986
- Title: Are They All Good? Studying Practitioners' Expectations on the
Readability of Log Messages
- Title(参考訳): それらはすべて良いですか?
ログメッセージの可読性に関する実践者の期待
- Authors: Zhenhao Li, An Ran Chen, Xing Hu, Xin Xia, Tse-Hsun Chen, Weiyi Shang
- Abstract要約: ログメッセージの重要性にもかかわらず、ログメッセージの可読性を構成する標準がまだ不足している。
我々は,ログメッセージの可読性に対する期待を調査するため,産業従事者17人と一連のインタビューを行った。
ディープラーニングモデルと機械学習モデルの両方が、平均80.0%以上のバランスの取れた精度でログメッセージの読みやすさを効果的に分類できることがわかった。
- 参考スコア(独自算出の注目度): 18.823475517909884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developers write logging statements to generate logs that provide run-time
information for various tasks. The readability of log messages in the logging
statements (i.e., the descriptive text) is rather crucial to the value of the
generated logs. Immature log messages may slow down or even obstruct the
process of log analysis. Despite the importance of log messages, there is still
a lack of standards on what constitutes good readability in log messages and
how to write them. In this paper, we conduct a series of interviews with 17
industrial practitioners to investigate their expectations on the readability
of log messages. Through the interviews, we derive three aspects related to the
readability of log messages, including Structure, Information, and Wording,
along with several specific practices to improve each aspect. We validate our
findings through a series of online questionnaire surveys and receive positive
feedback from the participants. We then manually investigate the readability of
log messages in large-scale open source systems and find that a large portion
(38.1%) of the log messages have inadequate readability. Motivated by such
observation, we further explore the potential of automatically classifying the
readability of log messages using deep learning and machine learning models. We
find that both deep learning and machine learning models can effectively
classify the readability of log messages with a balanced accuracy above 80.0%
on average. Our study provides comprehensive guidelines for composing log
messages to further improve practitioners' logging practices.
- Abstract(参考訳): 開発者はログステートメントを書き、さまざまなタスクの実行時情報を提供するログを生成する。
ログステートメント(すなわち記述テキスト)におけるログメッセージの可読性は、生成されたログの価値に対してかなり重要である。
未熟なログメッセージは、ログ分析のプロセスを遅くしたり、妨げたりします。
ログメッセージの重要性にも拘わらず、ログメッセージの読みやすさと書き方に関する標準が依然として欠如している。
本稿では,17人の産業従事者とのインタビューを行い,ログメッセージの可読性に対する期待について検討する。
インタビューを通じて,ログメッセージの可読性に関する3つの側面(構造,情報,文言など)と,それぞれの側面を改善するためのいくつかの具体的なプラクティスを導出する。
アンケートの結果をオンライン調査で検証し, 参加者から肯定的なフィードバックを得た。
次に,大規模オープンソースシステムにおけるログメッセージの可読性について手作業で調査し,ログメッセージの大部分が可読性に乏しいことが分かった。
このような観察により、深層学習と機械学習モデルを用いてログメッセージの可読性を自動的に分類する可能性をさらに探求する。
その結果,ディープラーニングモデルと機械学習モデルの両方が,平均80.0%以上の精度で,ログメッセージの可読性を効果的に分類できることがわかった。
本研究は,実践者のロギング実践を改善するため,ログメッセージ作成のための包括的なガイドラインを提供する。
関連論文リスト
- Log Statements Generation via Deep Learning: Widening the Support
Provided to Developers [16.079459379684554]
LANCEはディープラーニング(DL)に根ざしたアプローチで、Javaメソッドにログステートメントを正しく注入する能力を示している。
本稿では,ログステートメントを含まないメソッドを識別するDLベースの手法であるLEONIDを提案する。
論文 参考訳(メタデータ) (2023-11-08T10:31:18Z) - A Large-scale Benchmark for Log Parsing [44.16309634200891]
さまざまなログデータセットが存在しており、これらのツールをベンチマークして機能やパフォーマンスを理解することが不可欠である。
ログ解析のための既存のデータセットは、スケールと代表性の点で制限されている。
我々は,実世界のソフトウェアシステムで観測されるログデータをより正確に反映した,LogPubという,大規模アノテートログデータセットのコレクションを導入する。
論文 参考訳(メタデータ) (2023-08-21T16:24:15Z) - Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文 参考訳(メタデータ) (2023-08-17T14:19:22Z) - On the Effectiveness of Log Representation for Log-based Anomaly
Detection [14.58848716249407]
本研究は,従来のログ解析研究から広く採用されているログ表現技術について検討し,比較する。
6つのログ表現手法を選択し、7つのMLモデルと4つの公開ログデータセットで評価する。
また、ログ表現技術を採用する際に、ログ解析プロセスと異なる特徴集約アプローチの影響についても検討する。
論文 参考訳(メタデータ) (2023-08-17T02:18:59Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log
Statement Automation [0.0]
ログステートメントの位置を予測するために,更新および改良されたログ対応コードクローン検出手法を提案する。
我々は,自然言語処理(NLP)と深層学習手法を組み込んで,ログステートメントの記述予測を自動化する。
解析の結果、我々のハイブリッドNLPとコードクローン検出手法(NLP CC'd)は、ログステートメントの場所を見つける際に従来のクローン検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-12-02T14:03:49Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Self-Attentive Classification-Based Anomaly Detection in Unstructured
Logs [59.04636530383049]
ログ表現を学習するための分類法であるLogsyを提案する。
従来の方法と比較して,F1スコアの平均0.25の改善を示す。
論文 参考訳(メタデータ) (2020-08-21T07:26:55Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。