論文の概要: Empirical Characterization of Logging Smells in Machine Learning Code
- arxiv url: http://arxiv.org/abs/2603.23769v1
- Date: Tue, 24 Mar 2026 23:01:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.048692
- Title: Empirical Characterization of Logging Smells in Machine Learning Code
- Title(参考訳): 機械学習コードにおけるロギングスメルの実証評価
- Authors: Patrick Loic Foalem, Leuson Da Silva, Foutse Khomh, Heng Li, Ettore Merlo,
- Abstract要約: 機械学習(ML)プロジェクトにおけるログの臭いに関する実証的研究について述べる。
セキュリティ,メトリクス管理,構成,冗長性,コンテキストに関連する12種類のログの臭いを識別する。
以上の結果から,ログの臭いはMLシステムに広まっており,プロジェクトの頻度や出現頻度が多様であることがわかった。
- 参考スコア(独自算出の注目度): 7.520925824033758
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Logging plays a central role in ensuring reproducibility, observability, and reliability in machine learning (ML) systems. While logging is generally considered a good engineering practice, poorly designed logging can negatively affect experiment tracking, security, debugging, and system performance. In this paper, we present an empirical study of logging smells in ML projects and propose a taxonomy of ML-specific logging smell types. We conducted a large-scale analysis of 444 ML repositories and manually labeled 2,448 instances of logging smells. Based on this analysis, we identified 12 categories of logging smells spanning security, metric management, configuration, verbosity, and context-related issues. Our results show that logging smells are widespread in ML systems and vary in frequency and manifestation across projects. To assess practical relevance, we conducted a survey with 27 ML practitioners. Most respondents agreed with the identified smells and reported that several types, including Logging Sensitive Data, Metric Overwrite, Missing Hyperparameter Logging, and Log Without Context, have a strong impact on reproducibility, maintainability, and trustworthiness. Other smells, such as Heavy Data Logging and Print-based Logging, were perceived as more context-dependent. We publicly release our labeled dataset to support future research. Our findings highlight logging quality as a critical and underexplored aspect of ML system engineering and open opportunities for automated detection and repair of logging issues.
- Abstract(参考訳): ロギングは、機械学習(ML)システムにおける再現性、可観測性、信頼性を保証する上で、中心的な役割を果たす。
ロギングは一般的に優れたエンジニアリングプラクティスと考えられているが、設計の悪いロギングは、実験追跡、セキュリティ、デバッグ、システムパフォーマンスに悪影響を及ぼす可能性がある。
本稿では,MLプロジェクトのログ臭に関する実証的研究を行い,ML固有のログ臭の分類法を提案する。
444個のMLレポジトリを大規模に分析し,手動で2,448個のログの臭いをラベル付けした。
この分析から,セキュリティ,メトリクス管理,構成,冗長性,コンテキスト関連問題にまたがるログの臭いを12種類同定した。
以上の結果から,ログの臭いはMLシステムに広まっており,プロジェクトの頻度や出現頻度が多様であることがわかった。
実践的妥当性を評価するため,27名のML実践者を対象に調査を行った。
ほとんどの回答者は、識別された臭いに同意し、Logging Sensitive Data、Metric Overwrite、Missing Hyperparameter Logging、Log Without Contextなどいくつかのタイプが再現性、保守性、信頼性に強い影響を与えていると報告した。
他の臭い、例えばヘビーデータロギングやプリントベースのロギングは、よりコンテキストに依存していると見なされた。
将来の研究をサポートするためにラベル付きデータセットを公開しています。
我々の研究は、ロギングの品質をMLシステムエンジニアリングの重要かつ過小評価された側面と、ロギング問題の自動検出と修復の機会として強調した。
関連論文リスト
- Empirical Characterization of Logging Smells in Machine Learning Code [7.520925824033758]
本研究の目的は,機械学習システムにおけるログの臭いを経験的に識別し,特徴付けることである。
我々は、GitHubにホストされているオープンソースのMLリポジトリを大規模にマイニングして、繰り返し発生するログの臭いをカタログ化することを提案する。
論文 参考訳(メタデータ) (2026-01-09T05:48:42Z) - Automated File-Level Logging Generation for Machine Learning Applications using LLMs: A Case Study using GPT-4o Mini [3.076436880934678]
我々は、GPT-4o miniのファイルレベルでの機械学習プロジェクトのためのログステートメントを生成する能力を評価した。
LLMは63.91%のケースで人間と同じ場所にログを導入しているが、高いオーバーログ率は82.66%である。
論文 参考訳(メタデータ) (2025-08-06T18:57:51Z) - Taxonomy of Software Log Smells [5.810137118676013]
この研究の目的は、開発者がより良いロギングコードを書くのに役立つログの臭いの分類を作ることだ。
我々は,学術文献の調査を行い,ロギング問題とツールを特定した。
本論文では,10個のログの匂いの分類について述べる。
論文 参考訳(メタデータ) (2024-12-12T13:54:17Z) - Studying and Benchmarking Large Language Models For Log Level Suggestion [49.176736212364496]
大規模言語モデル(LLM)は、様々な領域で研究の焦点となっている。
本稿では,12個のオープンソースLCMのログレベル提案における性能に及ぼす特性と学習パラダイムの影響について検討する。
論文 参考訳(メタデータ) (2024-10-11T03:52:17Z) - A Large-Scale Evaluation for Log Parsing Techniques: How Far Are We? [42.56249610409624]
実世界のソフトウェアシステムにおけるログデータの特徴をよりよく反映できる,アノテーション付きログデータセットの新たなコレクションであるLoghub-2.0を提供する。
我々は、より厳密で実践的な設定で15の最先端ログを徹底的に再評価し、特に、既存のメトリクスの非バランスなデータ分布に対する感度を緩和する新しい評価基準を導入する。
論文 参考訳(メタデータ) (2023-08-21T16:24:15Z) - Log Parsing Evaluation in the Era of Modern Software Systems [47.370291246632114]
自動ログ分析、ログ解析は、ログから洞察を導き出すための前提条件である。
本研究は,ログ解析分野の問題点,特に異種実世界のログ処理における非効率性を明らかにする。
本稿では,企業コンテキストにおけるログ解析性能を推定するツールであるLogchimeraを提案する。
論文 参考訳(メタデータ) (2023-08-17T14:19:22Z) - LogLAB: Attention-Based Labeling of Log Data Anomalies via Weak
Supervision [63.08516384181491]
専門家の手作業を必要とせず,ログメッセージの自動ラベル付けのための新しいモデリング手法であるLogLABを提案する。
本手法は,監視システムが提供する推定故障時間ウィンドウを用いて,正確なラベル付きデータセットを振り返りに生成する。
我々の評価によると、LogLABは3つの異なるデータセットで9つのベンチマークアプローチを一貫して上回り、大規模な障害時ウィンドウでも0.98以上のF1スコアを維持している。
論文 参考訳(メタデータ) (2021-11-02T15:16:08Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z) - Self-Supervised Log Parsing [59.04636530383049]
大規模ソフトウェアシステムは、大量の半構造化ログレコードを生成する。
既存のアプローチは、ログ特化や手動ルール抽出に依存している。
本稿では,自己教師付き学習モデルを用いて解析タスクをマスク言語モデリングとして定式化するNuLogを提案する。
論文 参考訳(メタデータ) (2020-03-17T19:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。