論文の概要: Explainable Software Defect Prediction from Cross Company Project
Metrics Using Machine Learning
- arxiv url: http://arxiv.org/abs/2306.08655v1
- Date: Wed, 14 Jun 2023 17:46:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 19:33:40.990328
- Title: Explainable Software Defect Prediction from Cross Company Project
Metrics Using Machine Learning
- Title(参考訳): 機械学習を用いた企業間プロジェクトメトリクスから説明可能なソフトウェア欠陥予測
- Authors: Susmita Haldar, Luiz Fernando Capretz
- Abstract要約: 本研究では,様々な機械学習アルゴリズムを適用した欠陥予測モデルの開発に焦点をあてる。
既存の欠陥予測研究で注目すべき問題は、開発モデルにおける透明性の欠如である。
- 参考スコア(独自算出の注目度): 5.829545587965401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the number of defects in a project is critical for project test
managers to allocate budget, resources, and schedule for testing, support and
maintenance efforts. Software Defect Prediction models predict the number of
defects in given projects after training the model with historical defect
related information. The majority of defect prediction studies focused on
predicting defect-prone modules from methods, and class-level static
information, whereas this study predicts defects from project-level information
based on a cross-company project dataset. This study utilizes software sizing
metrics, effort metrics, and defect density information, and focuses on
developing defect prediction models that apply various machine learning
algorithms. One notable issue in existing defect prediction studies is the lack
of transparency in the developed models. Consequently, the explain-ability of
the developed model has been demonstrated using the state-of-the-art post-hoc
model-agnostic method called Shapley Additive exPlanations (SHAP). Finally,
important features for predicting defects from cross-company project
information were identified.
- Abstract(参考訳): プロジェクトの欠陥の数を予測することは、プロジェクトテストマネージャが、テスト、サポート、メンテナンスの作業のために予算、リソース、スケジュールを割り当てるのに重要です。
ソフトウェア欠陥予測モデルは、過去の欠陥関連情報をトレーニングした後、与えられたプロジェクトの欠陥の数を予測する。
欠陥予測研究の大部分は、手法やクラスレベルの静的情報から欠陥の可能性のあるモジュールを予測することに焦点を当てているが、この研究は、クロス企業プロジェクトデータセットに基づいたプロジェクトレベルの情報から欠陥を予測するものである。
本研究は,様々な機械学習アルゴリズムを応用した欠陥予測モデルの開発に焦点をあて,ソフトウェアサイズメトリクス,労力メトリクス,欠陥密度情報を活用する。
既存の欠陥予測研究で注目すべき問題は、開発モデルにおける透明性の欠如である。
その結果,Shapley Additive exPlanations (SHAP) と呼ばれる最先端のポストホックモデルに依存しない手法を用いて,開発モデルの説明可能性を示した。
最後に、企業間のプロジェクト情報から欠陥を予測する重要な特徴を特定した。
関連論文リスト
- Feature Importance in the Context of Traditional and Just-In-Time Software Defect Prediction Models [5.1868909177638125]
本研究では,Apache Camelプロジェクトの公開データセットから,従来型およびJust-In-Timeアプローチを取り入れた欠陥予測モデルを開発した。
機械学習アルゴリズムと比較して,これらのデータセットに多層深層学習アルゴリズムを適用した。
深層学習アルゴリズムは80%と86%の精度を達成し, 従来型とジャスト・イン・タイムの欠陥予測では, それぞれ66%と78%の受信演算子曲線(AUC)のスコアが得られた。
論文 参考訳(メタデータ) (2024-11-07T22:49:39Z) - A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [48.96686419141881]
大規模言語モデル(LLM)における最初の形式的確率的評価フレームワークを紹介する。
モデルの出力分布に関する高い確率保証を持つ新しい指標を導出する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文 参考訳(メタデータ) (2024-10-04T15:44:23Z) - Defect Category Prediction Based on Multi-Source Domain Adaptation [8.712655828391016]
本稿では,対戦型学習と注意機構を統合したマルチソースドメイン適応フレームワークを提案する。
8つの実世界のオープンソースプロジェクトの実験は、提案されたアプローチが大幅なパフォーマンス改善を実現していることを示している。
論文 参考訳(メタデータ) (2024-05-17T03:30:31Z) - Learning Sample Difficulty from Pre-trained Models for Reliable
Prediction [55.77136037458667]
本稿では,大規模事前学習モデルを用いて,サンプル難易度を考慮したエントロピー正規化による下流モデルトレーニングを指導する。
我々は、挑戦的なベンチマークで精度と不確実性の校正を同時に改善する。
論文 参考訳(メタデータ) (2023-04-20T07:29:23Z) - Measuring Causal Effects of Data Statistics on Language Model's
`Factual' Predictions [59.284907093349425]
大量のトレーニングデータが、最先端のNLPモデルの高性能化の大きな理由の1つである。
トレーニングデータがどのように予測に影響を及ぼすかを記述するための言語を,因果的フレームワークを通じて提供する。
我々のフレームワークは、高価なモデルの再訓練の必要性を回避し、観測データのみに基づいて因果効果を推定することができる。
論文 参考訳(メタデータ) (2022-07-28T17:36:24Z) - Defect Prediction Using Stylistic Metrics [2.286041284499166]
本稿では,プロジェクト内およびプロジェクト内欠陥予測におけるスタイリスティックな指標の影響を分析することを目的とする。
実験は5つの人気のあるオープンソースプロジェクトの14のリリースで実施されている。
論文 参考訳(メタデータ) (2022-06-22T10:11:05Z) - Hessian-based toolbox for reliable and interpretable machine learning in
physics [58.720142291102135]
本稿では,モデルアーキテクチャの解釈可能性と信頼性,外挿を行うためのツールボックスを提案する。
与えられたテストポイントでの予測に対する入力データの影響、モデル予測の不確実性の推定、およびモデル予測の不可知スコアを提供する。
我々の研究は、物理学やより一般的には科学に適用されたMLにおける解釈可能性と信頼性の方法の体系的利用への道を開く。
論文 参考訳(メタデータ) (2021-08-04T16:32:59Z) - Moving from Cross-Project Defect Prediction to Heterogeneous Defect
Prediction: A Partial Replication Study [0.0]
以前の研究では、しばしば機械学習技術を使ってバグ予測モデルを構築し、検証し、改善した。
これらのモデルから得られる知識は、ソースプロジェクトで十分なメトリクスが収集されていない場合、ターゲットプロジェクトと重複することはない。
得られた結果の再現と検証により,系統的に異種欠陥予測(HDP)を統合した。
その結果,hdpアルゴリズムはパラメータ選択に対する感度が高いため,多くのケースで実現不可能であることが判明した。
論文 参考訳(メタデータ) (2021-03-05T06:29:45Z) - Sufficiently Accurate Model Learning for Planning [119.80502738709937]
本稿では,制約付きSufficiently Accurateモデル学習手法を提案する。
これはそのような問題の例を示し、いくつかの近似解がいかに近いかという定理を提示する。
近似解の質は、関数のパラメータ化、損失と制約関数の滑らかさ、モデル学習におけるサンプルの数に依存する。
論文 参考訳(メタデータ) (2021-02-11T16:27:31Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z) - Software Defect Prediction Based On Deep Learning Models: Performance
Study [0.5735035463793008]
Stack Sparse Auto-Encoder(SSAE)とDeep Belief Network(DBN)の2つのディープラーニングモデルがデプロイされ、NASAデータセットを分類する。
実験の結果,十分なサンプルが得られたデータセットの精度が向上した。
論文 参考訳(メタデータ) (2020-04-02T06:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。