論文の概要: Bug Severity Prediction in Software Projects Using Supervised Machine Learning Models
- arxiv url: http://arxiv.org/abs/2603.00004v1
- Date: Fri, 09 Jan 2026 05:06:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 01:20:07.953334
- Title: Bug Severity Prediction in Software Projects Using Supervised Machine Learning Models
- Title(参考訳): 教師付き機械学習モデルを用いたソフトウェアプロジェクトのバグ重大度予測
- Authors: Nafisha Tamanna Nice,
- Abstract要約: 本研究では、教師付き機械学習アルゴリズムに基づいて、バグ重大度レベルの予測を行う異なる分類器の比較を行う。
精度,精度,リコール,F1スコア,AUC-ROC,混乱行列で評価した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Bug severity prediction is important in software maintenance, because it helps the development teams to prioritize bugs that have a significant impact on the operation, stability and security of the system. In large software projects bug repositories will grow at very rapid rate making classification of severity manual work labourious and unreliable and prone to human biasness. Many efforts have thus been dedicated on automated ways of severity prediction in the literature of software engineering research.This study compares different classifiers that are based on supervised machine learning algorithms for predicting bug severity levels using historical repository data from Eclipse Bugzilla. Evaluated methods range from linear classifiers, gradient boosting trees, distance method and transformer-based models, and text features, which are obtained from tokenization, TF-IDF, and n-grams and imbalance correction methods. Models were evaluated in terms of accuracy, precision, recall, F1 score, (AUC-ROC) and confusion matrix. Ensemble tree methods and DistilBERT achieved the top overall accuracy, while linear models performed best in recall of critical bugs which indicates some precision-recall tradeoff in imbalanced severity prediction. These findings provide useful actionable insight in choosing algorithms for automated bug triage, which can improve the quality of software through effective scalable prioritization. Keywords: Bug severity prediction, Supervised machine learning, Classification models, Software quality assurance, Historical bug data, Predictive analytics.
- Abstract(参考訳): バグの深刻度予測は、ソフトウェアメンテナンスにおいて重要である。開発チームがシステムの運用、安定性、セキュリティに重大な影響を与えるバグを優先順位付けするのに役立つからだ。
大規模なソフトウェアプロジェクトでは、バグリポジトリは非常に高速に成長し、厳密な手作業の分類が退屈で信頼性が低く、人間の偏りが生じる。
この研究は、Eclipse Bugzillaの履歴リポジトリデータを使用してバグ重大度レベルの予測を行う教師付き機械学習アルゴリズムに基づいて、異なる分類器を比較した。
評価手法は, 線形分類器, 勾配向上木, 距離法, 変圧器モデル, およびトークン化, TF-IDF, およびn-gramsおよび不均衡補正法から得られたテキスト特徴量である。
精度,精度,リコール,F1スコア,AUC-ROC,混乱行列で評価した。
アンサンブルツリー法と DistilBERT は全体的な精度を最大に達成し、線形モデルは不均衡重大度予測における精度-リコールトレードオフを示す重要なバグのリコールにおいて最善を尽くした。
これらの発見は、自動バグトリアージのためのアルゴリズムの選択において有用な洞察を与え、効率的なスケーラブルな優先順位付けによって、ソフトウェアの品質を向上させることができる。
キーワード:バグの深刻度予測、監視された機械学習、分類モデル、ソフトウェア品質保証、履歴バグデータ、予測分析。
関連論文リスト
- BugPilot: Complex Bug Generation for Efficient Learning of SWE Skills [59.003563837981886]
高品質なバグは、次世代の言語モデルベースソフトウェアエンジニアリング(SWE)エージェントをトレーニングする鍵となる。
難易度および多種多様なバグを合成する新しい方法を提案する。
論文 参考訳(メタデータ) (2025-10-22T17:58:56Z) - Bug Destiny Prediction in Large Open-Source Software Repositories through Sentiment Analysis and BERT Topic Modeling [3.481985817302898]
バグが解決する前に利用可能な機能を活用して、予測精度を高めます。
本手法は感情分析を取り入れ,感情性スコアと感情分類の両方を導出する。
結果は、感情分析がバグの最終的な結果の貴重な予測要因であることを示している。
論文 参考訳(メタデータ) (2025-04-22T15:18:14Z) - Focused-DPO: Enhancing Code Generation Through Focused Preference Optimization on Error-Prone Points [51.40935517552926]
Focused-DPOは、優先度最適化を重要なエラー発生箇所に向けることで、コード生成を強化するフレームワークである。
エラーを起こしやすい点に焦点を当てることで、Focused-DPOはモデル生成コードの正確性と機能を向上させる。
論文 参考訳(メタデータ) (2025-02-17T06:16:02Z) - Feature Importance in the Context of Traditional and Just-In-Time Software Defect Prediction Models [5.1868909177638125]
本研究では,Apache Camelプロジェクトの公開データセットから,従来型およびJust-In-Timeアプローチを取り入れた欠陥予測モデルを開発した。
機械学習アルゴリズムと比較して,これらのデータセットに多層深層学習アルゴリズムを適用した。
深層学習アルゴリズムは80%と86%の精度を達成し, 従来型とジャスト・イン・タイムの欠陥予測では, それぞれ66%と78%の受信演算子曲線(AUC)のスコアが得られた。
論文 参考訳(メタデータ) (2024-11-07T22:49:39Z) - Method-Level Bug Severity Prediction using Source Code Metrics and LLMs [0.628122931748758]
本稿では,ソースコードのメトリクス,大言語モデル(LLM)を用いたソースコード表現,およびバグ重大度ラベルの予測におけるそれらの組み合わせについて検討する。
以上の結果から,決定木モデルとランダムフォレストモデルは,いくつかの評価指標に関して,他のモデルよりも優れていたことが示唆された。
CodeBERTの微調整により、いくつかの評価指標の29%-140%の範囲でバグの重大度予測が大幅に改善される。
論文 参考訳(メタデータ) (2023-09-06T14:38:07Z) - Explainable Software Defect Prediction from Cross Company Project
Metrics Using Machine Learning [5.829545587965401]
本研究では,様々な機械学習アルゴリズムを適用した欠陥予測モデルの開発に焦点をあてる。
既存の欠陥予測研究で注目すべき問題は、開発モデルにおける透明性の欠如である。
論文 参考訳(メタデータ) (2023-06-14T17:46:08Z) - Learning Sample Difficulty from Pre-trained Models for Reliable
Prediction [55.77136037458667]
本稿では,大規模事前学習モデルを用いて,サンプル難易度を考慮したエントロピー正規化による下流モデルトレーニングを指導する。
我々は、挑戦的なベンチマークで精度と不確実性の校正を同時に改善する。
論文 参考訳(メタデータ) (2023-04-20T07:29:23Z) - On The Effectiveness of One-Class Support Vector Machine in Different Defect Prediction Scenarios [7.592094566354553]
欠陥予測は、ソフトウェアがエンドユーザに提供される前に障害を引き起こす可能性のあるソフトウェアコンポーネントを特定することを目的としている。
以前の研究では、ワンクラスサポートベクトルマシン(OCSVM)が、プロジェクト内欠陥予測のために2クラス分類器より優れていることが示されている。
一方のクラスからの学習が,他の2つの異なるシナリオにおいて効果的な欠陥予測モデルを生成するのに十分かどうかを検討する。
論文 参考訳(メタデータ) (2022-02-24T12:57:14Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。