論文の概要: Empirical Analysis of Temporal and Spatial Fault Characteristics in Multi-Fault Bug Repositories
- arxiv url: http://arxiv.org/abs/2508.08872v1
- Date: Tue, 12 Aug 2025 11:55:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 21:07:34.413629
- Title: Empirical Analysis of Temporal and Spatial Fault Characteristics in Multi-Fault Bug Repositories
- Title(参考訳): マルチフォールト・バグ・レポジトリにおける時間的・空間的断層特性の実証解析
- Authors: Dylan Callaghan, Alexandra van der Spuy, Bernd Fischer,
- Abstract要約: 16のオープンソースJavaおよびPythonプロジェクトに存在する断層の時間的・空間的特性を実証分析する。
以上の結果から,これらのソフトウェアシステムにおける多くの障害は長寿命であり,ソフトウェアバージョンの大部分に複数の障害が存在することが示唆された。
- 参考スコア(独自算出の注目度): 45.208325853591475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fixing software faults contributes significantly to the cost of software maintenance and evolution. Techniques for reducing these costs require datasets of software faults, as well as an understanding of the faults, for optimal testing and evaluation. In this paper, we present an empirical analysis of the temporal and spatial characteristics of faults existing in 16 open-source Java and Python projects, which form part of the Defects4J and BugsInPy datasets, respectively. Our findings show that many faults in these software systems are long-lived, leading to the majority of software versions having multiple coexisting faults. This is in contrast to the assumptions of the original datasets, where the majority of versions only identify a single fault. In addition, we show that although the faults are found in only a small subset of the systems, these faults are often evenly distributed amongst this subset, leading to relatively few bug hotspots.
- Abstract(参考訳): ソフトウェア欠陥の修正は、ソフトウェアのメンテナンスと進化のコストに大きく貢献します。
これらのコストを削減するには、最適なテストと評価のために、ソフトウェア障害のデータセットと、障害の理解が必要です。
本稿では,Defects4JとBugsInPyデータセットの一部を構成する16のオープンソースプロジェクトとPythonプロジェクトに存在する障害の時間的および空間的特性を実証的に分析する。
以上の結果から,これらのソフトウェアシステムにおける多くの障害は長寿命であり,ソフトウェアバージョンの大部分に複数の障害が存在することが示唆された。
これは、バージョンの大半が単一障害のみを識別する、オリジナルのデータセットの仮定とは対照的である。
さらに、システムの小さなサブセットでしか見つからないが、これらのフォールトはしばしばこのサブセットに均等に分散しており、バグのホットスポットは比較的少ない。
関連論文リスト
- From Bugs to Benchmarks: A Comprehensive Survey of Software Defect Datasets [19.140541190998842]
ソフトウェア欠陥データセットは、ソフトウェアバグとその関連情報の集合である。
長年にわたり、多くのソフトウェア欠陥データセットが開発され、コミュニティに豊富なリソースを提供してきた。
この記事では、132のソフトウェア欠陥データセットを包括的に調査する。
論文 参考訳(メタデータ) (2025-04-24T23:07:04Z) - An Anatomy of 488 Faults from Defects4J Based on the Control- and Data-Flow Graph Representations of Programs [49.38684825106323]
Defects4Jのようなソフトウェア障害データセットは、個々の障害の位置と修復を提供するが、障害の特徴は示さない。
本稿では,プログラムの制御およびデータフローグラフ表現に基づく,新たな直接故障分類手法を提案する。
論文 参考訳(メタデータ) (2025-02-04T13:10:28Z) - Mining Bug Repositories for Multi-Fault Programs [0.25782420501870285]
個々のエントリで複数のバグを識別するデータセットの拡張について説明する。
テストケースの移植とフォールトロケーションの翻訳を,バグの公開と発見に使用しています。
したがって、実際のソフトウェアプロジェクトの中で、真のマルチフォールトバージョンのデータセットを提供します。
論文 参考訳(メタデータ) (2024-03-28T06:35:55Z) - Applying Machine Learning Analysis for Software Quality Test [0.0]
メンテナンスのトリガーと予測されるかどうかを理解することは重要です。
生成したプログラムの複雑さを評価する多くの手法は有用な予測モデルを生成する。
本稿では,機械学習を利用可能なデータに適用し,累積ソフトウェア故障レベルを算出する。
論文 参考訳(メタデータ) (2023-05-16T06:10:54Z) - Shortcomings of Question Answering Based Factuality Frameworks for Error
Localization [51.01957350348377]
質問応答(QA)に基づく事実性指標は、生成した要約の誤り範囲を正しく識別できないことを示す。
このようなローカライゼーションが不十分な理由として,QGモジュールが生成した質問は,非実数的な要約から誤りを継承することが多く,さらに下流モジュールに伝播する。
本実験は,より強力なQAモデルとQGモデルでのみ修正できないQAフレームワークを用いた局所化に関する根本的な問題が存在することを確定的に示す。
論文 参考訳(メタデータ) (2022-10-13T05:23:38Z) - Understanding Factual Errors in Summarization: Errors, Summarizers,
Datasets, Error Detectors [105.12462629663757]
本研究では、既存の9つのデータセットから事実性エラーアノテーションを集約し、基礎となる要約モデルに従ってそれらを階層化する。
本稿では,この階層化ベンチマークにおいて,最近のChatGPTベースの指標を含む最先端の事実性指標の性能を比較し,その性能が様々な種類の要約モデルで大きく異なることを示す。
論文 参考訳(メタデータ) (2022-05-25T15:26:48Z) - A Fault Localization and Debugging Support Framework driven by Bug
Tracking Data [0.11915976684257382]
この論文は、さまざまなソースからのデータを組み合わせることで、フォールトローカリゼーションフレームワークを提供することを目指しています。
これを実現するために,バグ分類スキーマを導入し,ベンチマークを作成し,履歴データに基づく新しいフォールトローカライズ手法を提案する。
論文 参考訳(メタデータ) (2021-03-03T13:23:13Z) - Robust and Transferable Anomaly Detection in Log Data using Pre-Trained
Language Models [59.04636530383049]
クラウドのような大規模コンピュータシステムにおける異常や障害は、多くのユーザに影響を与える。
システム情報の主要なトラブルシューティングソースとして,ログデータの異常検出のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-23T09:17:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。