Fugu-MT 論文翻訳(概要): SQuaD: The Software Quality Dataset

論文の概要: SQuaD: The Software Quality Dataset

arxiv url: http://arxiv.org/abs/2511.11265v1
Date: Fri, 14 Nov 2025 12:57:22 GMT
ステータス: 翻訳完了
システム内更新日: 2025-11-17 22:42:18.611776
Title: SQuaD: The Software Quality Dataset
Title（参考訳）: SQuaD: ソフトウェア品質データセット
Authors: Mikel Robredo, Matteo Esposito, Davide Taibi, Rafael Peñaloza, Valentina Lenarduzzi,
Abstract要約: ソフトウェア品質データセット(Software Quality dataset、SQuaD)は、さまざまなエコシステムにわたる450の成熟したオープンソースプロジェクトから抽出された、ソフトウェア品質メトリクスのタイムアウェアなコレクションである。 9つの最先端の静的解析ツールを統合することで、SQuaDは700以上のユニークなメトリクスをメソッド、クラス、ファイル、プロジェクトレベルで統合する。
参考スコア（独自算出の注目度）: 3.9861000060030993
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Software quality research increasingly relies on large-scale datasets that measure both the product and process aspects of software systems. However, existing resources often focus on limited dimensions, such as code smells, technical debt, or refactoring activity, thereby restricting comprehensive analyses across time and quality dimensions. To address this gap, we present the Software Quality Dataset (SQuaD), a multi-dimensional, time-aware collection of software quality metrics extracted from 450 mature open-source projects across diverse ecosystems, including Apache, Mozilla, FFmpeg, and the Linux kernel. By integrating nine state-of-the-art static analysis tools, i.e., SonarQube, CodeScene, PMD, Understand, CK, JaSoMe, RefactoringMiner, RefactoringMiner++, and PyRef, our dataset unifies over 700 unique metrics at method, class, file, and project levels. Covering a total of 63,586 analyzed project releases, SQuaD also provides version control and issue-tracking histories, software vulnerability data (CVE/CWE), and process metrics proven to enhance Just-In-Time (JIT) defect prediction. The SQuaD enables empirical research on maintainability, technical debt, software evolution, and quality assessment at unprecedented scale. We also outline emerging research directions, including automated dataset updates and cross-project quality modeling to support the continuous evolution of software analytics. The dataset is publicly available on ZENODO (DOI: 10.5281/zenodo.17566690).
Abstract（参考訳）: ソフトウェアの品質調査は、ソフトウェアシステムの製品とプロセスの両方を計測する大規模なデータセットにますます依存している。しかしながら、既存のリソースはコードの臭いや技術的負債、リファクタリングアクティビティといった限られた次元に重点を置いており、それによって時間と品質の側面にわたって包括的な分析を制限します。このギャップに対処するために、ソフトウェア品質データセット(Software Quality Dataset, SQuaD)を紹介します。これは、Apache、Mozilla、FFmpeg、Linuxカーネルなど、さまざまなエコシステムにわたる450の成熟したオープンソースプロジェクトから抽出された、多次元でタイムアウェアなソフトウェア品質メトリクスの収集です。 SonarQube、CodeScene、PMD、Understand、CK、JaSoMe、RefactoringMiner、RefactoringMiner++、PyRefの9つの最先端静的分析ツールを統合することで、私たちのデータセットはメソッド、クラス、ファイル、プロジェクトレベルで700以上のユニークなメトリクスを統一します。 SQuaDは、合計63,586のプロジェクトリリースをカバーし、バージョン管理とイシュートラッキング履歴、ソフトウェア脆弱性データ(CVE/CWE)、Just-In-Time(JIT)欠陥予測を強化することが証明されたプロセスメトリクスも提供する。 SQuaDは、保守性、技術的負債、ソフトウェア進化、そして前例のない規模の品質評価に関する経験的な研究を可能にする。また、ソフトウェア分析の継続的進化をサポートするために、自動データセット更新やプロジェクト間品質モデリングなど、新たな研究方向についても概説しています。データセットはZENODO(DOI: 10.5281/zenodo.17566690)で公開されている。

論文の概要: SQuaD: The Software Quality Dataset

関連論文リスト