論文の概要: Unsafe and Unused? A History of Utility Code in Mature Open Source Projects
- arxiv url: http://arxiv.org/abs/2604.28146v1
- Date: Thu, 30 Apr 2026 17:32:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.226637
- Title: Unsafe and Unused? A History of Utility Code in Mature Open Source Projects
- Title(参考訳): 安全で使用されていない? 成熟したオープンソースプロジェクトにおけるユーティリティコードの歴史
- Authors: Brandon Keller, Kaitlin Yandik, Angela Ngo, Andy Meneely,
- Abstract要約: ユーティリティファイルは、非ユーティリティファイルの2.75倍の脆弱性に関与している可能性がある。
ユーティリティファイルは、非ユーティリティファイルの2.75倍の脆弱性に関与している可能性がある。
- 参考スコア(独自算出の注目度): 0.35918066453136693
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Filenames are a concise means of conveying information about source code to fellow developers. One such convention is util. Commonly understood to stand for "utility", filenames with the letters util are often an indication that the file contains code that may be broadly useful or reusable. Some projects use this convention heavily, for example, the Apache Tomcat server contains 925 files with util in the path name, which is 17.9% of all source code files in the tree. While the intent of the name may be to prevent duplicate code and reduce workload, what actually happens to util code over time? Do projects move away from util code as they mature? Are util files being used by fellow colleagues, or maintained and used by their author? The goal of our work is to help developers avoid creating unsafe and unused util files when developing their projects. We conducted a longitudinal mining study of the Git repositories of seven open source projects that have a long development history (Linux kernel, Django, FFmpeg, httpd, Struts, systemd, Tomcat). We analyzed how util usage, complexity, developer collaboration, and security are potentially correlated within these projects. Our longitudinal analysis was measured at 30-day intervals throughout the entire history of each project, resulting in 1773 snapshots over 147 project-years of development. We conducted rename tracking at every 30-day snapshot to examine util files over their entire lifetime in a codebase. For example, we found that a util file can be as much as 2.75 times more likely to be involved in a vulnerability than non-util files. While every project can adopt their own naming conventions, the ubiquity and longevity of util files shows a broader developer intent that is useful for understanding the socio-technical nature of software development.
- Abstract(参考訳): ファイル名は、ソースコードに関する情報を仲間の開発者に伝達する簡潔な手段である。
そのような慣例の一つが効用である。
ユーティリティ」の略と理解されることが多いが、ユーティリティーのファイル名は、ファイルが広く有用または再利用可能なコードを含んでいることを示すものであることが多い。
例えば、Apache Tomcatサーバにはパス名にutilがある925のファイルがあり、これはツリー内のすべてのソースコードファイルの17.9%である。
名前の意図は重複するコードを防止し、ワークロードを減らすことだが、実際にコードを使用する場合、時間とともにどうなるのか?
プロジェクトは成熟するにつれてユーティリティコードから離れるのか?
utilファイルは同僚によって使用されているか、作者によってメンテナンスされ、使用されているか?
私たちの仕事の目標は、開発者がプロジェクトを開発する際に、安全でないユーティリティファイルを作成するのを避けることです。
我々は、長い開発履歴を持つ7つのオープンソースプロジェクト(Linuxカーネル、Django、FFmpeg、httpd、Struts、systemd、Tomcat)のGitリポジトリを縦断調査した。
これらのプロジェクトの中で、利用方法、複雑さ、開発者のコラボレーション、セキュリティの関連性について分析しました。
我々の縦断解析は、各プロジェクトの歴史全体を通して30日間の間隔で測定され、1773枚のスナップショットが147回のプロジェクト開発に費やされた。
私たちは30日毎のスナップショットでリネーム追跡を行い、コードベースで一生にわたってユーティリティファイルを調べました。
例えば、ユーティリティファイルは、非ユーティリティファイルよりも脆弱性に関わる可能性が2.75倍も高いことがわかった。
どのプロジェクトも独自の命名規則を採用することができるが、ユーティリティファイルの多様さと長寿は、ソフトウェア開発の社会技術的性質を理解するのに役立つ幅広い開発者の意図を示している。
関連論文リスト
- Trace: Securing Smart Contract Repository Against Access Control Vulnerability [58.02691083789239]
GitHubはソースコード、ドキュメント、設定ファイルを含む多数のスマートコントラクトリポジトリをホストしている。
サードパーティの開発者は、カスタム開発中にこれらのリポジトリからコードを参照、再利用、フォークすることが多い。
スマートコントラクトの脆弱性を検出する既存のツールは、複雑なリポジトリを扱う能力に制限されている。
論文 参考訳(メタデータ) (2025-10-22T05:18:28Z) - An Empirical Study of Dotfiles Repositories Containing User-Specific Configuration Files [1.7556600627464058]
数十万がGitHubにリポジトリを公開している。
GitHubで公開ホストされているdotfilesリポジトリを収集、分析しました。
トップ500のGitHubユーザのうち25.8%が、何らかの形で公開アクセス可能なdotfilesリポジトリを維持していることがわかった。
論文 参考訳(メタデータ) (2025-01-30T18:32:46Z) - Knowledge Islands: Visualizing Developers Knowledge Concentration [0.0]
Knowledge Islandsは、最先端の知識モデルを使用して、ソフトウェアリポジトリ内の知識の集中を可視化するツールである。
GitHubプロジェクトを分析し、知識がどこに集中しているかを判断し、プロジェクトの健全性を維持するための手段を実装することができる。
論文 参考訳(メタデータ) (2024-08-16T13:32:49Z) - DevEval: Evaluating Code Generation in Practical Software Projects [52.16841274646796]
我々はDevEvalという名の新しいベンチマークを提案し、実践プロジェクトにおける開発者の経験と一致している。
DevEvalは、119の実用的なプロジェクトから2,690のサンプルを含む厳格なパイプラインを通じて収集される。
DevEvalの5つの人気のあるLCMを評価し、コード生成における実際の能力を明らかにする。
論文 参考訳(メタデータ) (2024-01-12T06:51:30Z) - How Do Java Developers Reuse StackOverflow Answers in Their GitHub Projects? [5.064338135936606]
StackOverflow (SO)は、ソフトウェア開発者およびコンピュータ科学者のための広く使われているQ&A(Q&A)ウェブサイトである。
GitHubは、ソフトウェアプロジェクトの保存、追跡、コラボレーションに使用されるオンライン開発プラットフォームである。
私たちは、GitHubで利用可能なJavaプロジェクトで再利用されたSOの回答をマイニングして、実証的研究を行いました。
論文 参考訳(メタデータ) (2023-08-18T14:04:59Z) - One-off Events? An Empirical Study of Hackathon Code Creation and Reuse [69.98625403567553]
ハッカソンイベントで使用されたり作成されたりするコードの進化を理解することを目的としています。
DevPostから22,183のハッカソンプロジェクトに関する情報を収集しました。
論文 参考訳(メタデータ) (2022-07-03T11:49:52Z) - Predicting Vulnerability In Large Codebases With Deep Code
Representation [6.357681017646283]
ソフトウェアエンジニアは様々なモジュールのコードを書きます。
過去に(異なるモジュールで)修正された同様の問題やバグも、本番コードで再び導入される傾向にある。
ソースコードから生成した抽象構文木(AST)の深部表現とアクティブフィードバックループを用いた,AIに基づく新しいシステムを開発した。
論文 参考訳(メタデータ) (2020-04-24T13:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。