論文の概要: Are They All Good? Studying Practitioners' Expectations on the
Readability of Log Messages
- arxiv url: http://arxiv.org/abs/2308.08836v1
- Date: Thu, 17 Aug 2023 07:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 13:49:37.392986
- Title: Are They All Good? Studying Practitioners' Expectations on the
Readability of Log Messages
- Title(参考訳): それらはすべて良いですか?
ログメッセージの可読性に関する実践者の期待
- Authors: Zhenhao Li, An Ran Chen, Xing Hu, Xin Xia, Tse-Hsun Chen, Weiyi Shang
- Abstract要約: ログメッセージの重要性にもかかわらず、ログメッセージの可読性を構成する標準がまだ不足している。
我々は,ログメッセージの可読性に対する期待を調査するため,産業従事者17人と一連のインタビューを行った。
ディープラーニングモデルと機械学習モデルの両方が、平均80.0%以上のバランスの取れた精度でログメッセージの読みやすさを効果的に分類できることがわかった。
- 参考スコア(独自算出の注目度): 18.823475517909884
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developers write logging statements to generate logs that provide run-time
information for various tasks. The readability of log messages in the logging
statements (i.e., the descriptive text) is rather crucial to the value of the
generated logs. Immature log messages may slow down or even obstruct the
process of log analysis. Despite the importance of log messages, there is still
a lack of standards on what constitutes good readability in log messages and
how to write them. In this paper, we conduct a series of interviews with 17
industrial practitioners to investigate their expectations on the readability
of log messages. Through the interviews, we derive three aspects related to the
readability of log messages, including Structure, Information, and Wording,
along with several specific practices to improve each aspect. We validate our
findings through a series of online questionnaire surveys and receive positive
feedback from the participants. We then manually investigate the readability of
log messages in large-scale open source systems and find that a large portion
(38.1%) of the log messages have inadequate readability. Motivated by such
observation, we further explore the potential of automatically classifying the
readability of log messages using deep learning and machine learning models. We
find that both deep learning and machine learning models can effectively
classify the readability of log messages with a balanced accuracy above 80.0%
on average. Our study provides comprehensive guidelines for composing log
messages to further improve practitioners' logging practices.
- Abstract(参考訳): 開発者はログステートメントを書き、さまざまなタスクの実行時情報を提供するログを生成する。
ログステートメント(すなわち記述テキスト)におけるログメッセージの可読性は、生成されたログの価値に対してかなり重要である。
未熟なログメッセージは、ログ分析のプロセスを遅くしたり、妨げたりします。
ログメッセージの重要性にも拘わらず、ログメッセージの読みやすさと書き方に関する標準が依然として欠如している。
本稿では,17人の産業従事者とのインタビューを行い,ログメッセージの可読性に対する期待について検討する。
インタビューを通じて,ログメッセージの可読性に関する3つの側面(構造,情報,文言など)と,それぞれの側面を改善するためのいくつかの具体的なプラクティスを導出する。
アンケートの結果をオンライン調査で検証し, 参加者から肯定的なフィードバックを得た。
次に,大規模オープンソースシステムにおけるログメッセージの可読性について手作業で調査し,ログメッセージの大部分が可読性に乏しいことが分かった。
このような観察により、深層学習と機械学習モデルを用いてログメッセージの可読性を自動的に分類する可能性をさらに探求する。
その結果,ディープラーニングモデルと機械学習モデルの両方が,平均80.0%以上の精度で,ログメッセージの可読性を効果的に分類できることがわかった。
本研究は,実践者のロギング実践を改善するため,ログメッセージ作成のための包括的なガイドラインを提供する。
関連論文リスト
- LogLLM: Log-based Anomaly Detection Using Large Language Models [8.03646578793411]
大規模言語モデル(LLM)を活用するログベースの異常検出フレームワークであるLogLLMを提案する。
LogLLMはBERTを使用してログメッセージからセマンティックベクターを抽出し、変換器デコーダベースのモデルであるLlamaを使ってログシーケンスを分類する。
我々のフレームワークは、性能と適応性を高めるために設計された新しい3段階の手順によって訓練されている。
論文 参考訳(メタデータ) (2024-11-13T12:18:00Z) - Studying and Benchmarking Large Language Models For Log Level Suggestion [49.176736212364496]
大規模言語モデル(LLM)は、様々な領域で研究の焦点となっている。
本稿では,12個のオープンソースLCMのログレベル提案における性能に及ぼす特性と学習パラダイムの影響について検討する。
論文 参考訳(メタデータ) (2024-10-11T03:52:17Z) - FastLog: An End-to-End Method to Efficiently Generate and Insert Logging Statements [5.80502312468937]
我々は、完全なロギングステートメントの生成と挿入アクティビティをサポートするFastLogを提案する。
FastLogは最初、最も優れたトークンレベルの挿入位置を予測し、次に挿入する完全なロギングステートメントを生成する。
総合的な実証分析により,本手法は効率と出力品質の両方において最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-11-06T04:26:20Z) - A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。
我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文 参考訳(メタデータ) (2023-08-21T16:24:15Z) - Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文 参考訳(メタデータ) (2023-08-17T14:19:22Z) - On the Effectiveness of Log Representation for Log-based Anomaly Detection [12.980238412281471]
本研究は,従来のログ解析研究から広く採用されているログ表現技術について検討し,比較する。
6つのログ表現手法を選択し、7つのMLモデルと4つの公開ログデータセットで評価する。
また、ログ表現技術を採用する際に、ログ解析プロセスと異なる特徴集約アプローチの影響についても検討する。
論文 参考訳(メタデータ) (2023-08-17T02:18:59Z) - Data-Driven Approach for Log Instruction Quality Assessment [59.04636530383049]
優れた品質特性を持つログ命令の記述方法に関するガイドラインは,広く採用されていない。
1)ログレベルの正確さを評価するための正しいログレベルの割り当てと,2)イベント記述の冗長化に必要な静的テキストの最小富度を評価する十分な言語構造である。
本手法は,F1スコア0.99の十分な言語構造を用いて,ログレベルの割当を精度0.88で正確に評価する。
論文 参考訳(メタデータ) (2022-04-06T07:02:23Z) - Borrowing from Similar Code: A Deep Learning NLP-Based Approach for Log
Statement Automation [0.0]
ログステートメントの位置を予測するために,更新および改良されたログ対応コードクローン検出手法を提案する。
我々は,自然言語処理(NLP)と深層学習手法を組み込んで,ログステートメントの記述予測を自動化する。
解析の結果、我々のハイブリッドNLPとコードクローン検出手法(NLP CC'd)は、ログステートメントの場所を見つける際に従来のクローン検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-12-02T14:03:49Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。