論文の概要: Investigating the Use of One-Class Support Vector Machine for Software
Defect Prediction
- arxiv url: http://arxiv.org/abs/2202.12074v1
- Date: Thu, 24 Feb 2022 12:57:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-25 16:37:13.958612
- Title: Investigating the Use of One-Class Support Vector Machine for Software
Defect Prediction
- Title(参考訳): ソフトウェア欠陥予測におけるワンクラス支援ベクトルマシンの利用の検討
- Authors: Rebecca Moussa, Danielle Azar and Federica Sarro
- Abstract要約: 一つのクラスからのみ学習することが、効果的な欠陥予測モデルを生成するのに十分かどうかを検討する。
その結果,OCSVMはプロジェクト内欠陥予測よりもクロスバージョンやクロスプロジェクトに適していることがわかった。
- 参考スコア(独自算出の注目度): 8.066214414156562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Early software defect identification is considered an important step towards
software quality assurance. Software defect prediction aims at identifying
software components that are likely to cause faults before a software is made
available to the end-user. To date, this task has been modeled as a two-class
classification problem, however its nature also allows it to be formulated as a
one-class classification task.
Preliminary results obtained in prior work show that One-Class Support Vector
Machine (OCSVM) can outperform two-class classifiers for defect prediction. If
confirmed, these results would overcome the data imbalance problem researchers
have for long attempted to tackle in this field.
In this paper, we further investigate whether learning from one class only is
sufficient to produce effective defect prediction models by conducting a
thorough large-scale empirical study investigating 15 real-world software
projects, three validation scenarios, eight classifiers, robust evaluation
measures and statistical significance tests. The results reveal that OCSVM is
more suitable for cross-version and cross-project, rather than for
within-project defect prediction, thus suggesting it performs better with
heterogeneous data. While, we cannot conclude that OCSVM is the best classifier
(Random Forest performs best herein), our results show interesting findings
that open up further research avenues for training accurate defect prediction
classifiers when defective instances are scarce or unavailable.
- Abstract(参考訳): 初期のソフトウェア欠陥の識別は、ソフトウェアの品質保証への重要なステップだと考えられている。
ソフトウェア欠陥予測は、ソフトウェアがエンドユーザに提供される前に障害を引き起こす可能性のあるソフトウェアコンポーネントを特定することを目的としている。
現在までに、このタスクは2クラス分類問題としてモデル化されているが、その性質は1クラス分類タスクとして定式化することもできる。
先行研究から得られた予備結果は,1クラスサポートベクトルマシン(OCSVM)が欠陥予測のために2クラス分類器より優れていることを示している。
もし確認できれば、これらの結果は研究者がこの分野で長年取り組んできたデータ不均衡問題を克服するだろう。
本稿では,15の実世界のソフトウェアプロジェクト,3つの検証シナリオ,8つの分類器,頑健な評価尺度,統計的意義試験を徹底的に実施することにより,1つのクラスからの学習が効果的な欠陥予測モデルを生成するのに十分かどうかをさらに検討する。
その結果,OCSVMはプロジェクト内欠陥予測よりもクロスバージョンやクロスプロジェクトに適していることがわかった。
ocsvmが最善の分類器(random forestはここでベスト)であると結論付けることはできないが、欠陥インスタンスの不足や使用不能時に正確な欠陥予測分類器を訓練するための研究の道を開く興味深い結果が得られた。
関連論文リスト
- Estimating Fr\'echet bounds for validating programmatic weak supervision [50.13475056199486]
我々は、ある変数が連続的に評価される(おそらく高次元の)分布クラス上のFr'echeの境界を推定する手法を開発する。
プログラム弱監督(PWS)を訓練した機械学習(ML)モデルの性能を評価することで,アルゴリズムの有用性を実証する。
論文 参考訳(メタデータ) (2023-12-07T07:15:11Z) - Variance of ML-based software fault predictors: are we really improving
fault prediction? [0.3222802562733786]
我々は、最先端の故障予測手法のばらつきを実験的に分析する。
我々は,クラス毎の精度測定値において最大10.10%のばらつきを観測した。
論文 参考訳(メタデータ) (2023-10-26T09:31:32Z) - Explainable Software Defect Prediction from Cross Company Project
Metrics Using Machine Learning [5.829545587965401]
本研究では,様々な機械学習アルゴリズムを適用した欠陥予測モデルの開発に焦点をあてる。
既存の欠陥予測研究で注目すべき問題は、開発モデルにおける透明性の欠如である。
論文 参考訳(メタデータ) (2023-06-14T17:46:08Z) - Bridging Precision and Confidence: A Train-Time Loss for Calibrating
Object Detection [58.789823426981044]
本稿では,境界ボックスのクラス信頼度を予測精度に合わせることを目的とした,新たな補助損失定式化を提案する。
その結果,列車の走行時間損失はキャリブレーション基準を超過し,キャリブレーション誤差を低減させることがわかった。
論文 参考訳(メタデータ) (2023-03-25T08:56:21Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Defect Prediction Using Stylistic Metrics [2.286041284499166]
本稿では,プロジェクト内およびプロジェクト内欠陥予測におけるスタイリスティックな指標の影響を分析することを目的とする。
実験は5つの人気のあるオープンソースプロジェクトの14のリリースで実施されている。
論文 参考訳(メタデータ) (2022-06-22T10:11:05Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Machine Learning Techniques for Software Quality Assurance: A Survey [5.33024001730262]
我々は,障害予測とテストケース優先順位付けの両方における様々なアプローチについて考察する。
近年,障害予測のためのディープラーニングアルゴリズムは,プログラムのセマンティクスと障害予測機能とのギャップを埋めるのに役立つ。
論文 参考訳(メタデータ) (2021-04-29T00:37:27Z) - Distribution-Free, Risk-Controlling Prediction Sets [112.9186453405701]
ユーザ特定レベルにおける将来のテストポイントにおける期待損失を制御するブラックボックス予測器から設定値予測を生成する方法を示す。
提案手法は,予測セットのサイズをキャリブレーションするホールドアウトセットを用いて,任意のデータセットに対して明確な有限サンプル保証を提供する。
論文 参考訳(メタデータ) (2021-01-07T18:59:33Z) - Provable tradeoffs in adversarially robust classification [96.48180210364893]
我々は、ロバストなイソペリメトリに関する確率論の最近のブレークスルーを含む、新しいツールを開発し、活用する。
この結果から,データの不均衡時に増加する標準精度とロバスト精度の基本的なトレードオフが明らかになった。
論文 参考訳(メタデータ) (2020-06-09T09:58:19Z) - Software Defect Prediction Based On Deep Learning Models: Performance
Study [0.5735035463793008]
Stack Sparse Auto-Encoder(SSAE)とDeep Belief Network(DBN)の2つのディープラーニングモデルがデプロイされ、NASAデータセットを分類する。
実験の結果,十分なサンプルが得られたデータセットの精度が向上した。
論文 参考訳(メタデータ) (2020-04-02T06:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。