論文の概要: A Novel Multiple Ensemble Learning Models Based on Different Datasets
for Software Defect Prediction
- arxiv url: http://arxiv.org/abs/2008.13114v1
- Date: Sun, 30 Aug 2020 08:01:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-23 12:09:39.108136
- Title: A Novel Multiple Ensemble Learning Models Based on Different Datasets
for Software Defect Prediction
- Title(参考訳): ソフトウェア欠陥予測のための異なるデータセットに基づく新しい複数アンサンブル学習モデル
- Authors: Ali Nawaz, Attique Ur Rehman, Muhammad Abbas
- Abstract要約: 本稿では,異なるデータセット上で,KNN,決定木,SVM,Na"ive Bayesのアンサンブル学習モデルを提案し,比較分析を行った。
CM1で訓練されたアンサンブルモデルの分類精度は98.56%、KM2で訓練されたアンサンブルモデルの分類精度は98.18%、PC1で訓練されたアンサンブル学習モデルの分類精度は99.27%である。
- 参考スコア(独自算出の注目度): 3.6095388702618414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software testing is one of the important ways to ensure the quality of
software. It is found that testing cost more than 50% of overall project cost.
Effective and efficient software testing utilizes the minimum resources of
software. Therefore, it is important to construct the procedure which is not
only able to perform the efficient testing but also minimizes the utilization
of project resources. The goal of software testing is to find maximum defects
in the software system. More the defects found in the software ensure more
efficiency is the software testing Different techniques have been proposed to
detect the defects in software and to utilize the resources and achieve good
results. As world is continuously moving toward data driven approach for making
important decision. Therefore, in this research paper we performed the machine
learning analysis on the publicly available datasets and tried to achieve the
maximum accuracy. The major focus of the paper is to apply different machine
learning techniques on the datasets and find out which technique produce
efficient result. Particularly, we proposed an ensemble learning models and
perform comparative analysis among KNN, Decision tree, SVM and Na\"ive Bayes on
different datasets and it is demonstrated that performance of Ensemble method
is more than other methods in term of accuracy, precision, recall and F1-score.
The classification accuracy of ensemble model trained on CM1 is 98.56%,
classification accuracy of ensemble model trained on KM2 is 98.18% similarly,
the classification accuracy of ensemble learning model trained on PC1 is
99.27%. This reveals that Ensemble is more efficient method for making the
defect prediction as compared other techniques.
- Abstract(参考訳): ソフトウェアテストは、ソフトウェアの品質を保証する重要な方法の1つです。
テストコストはプロジェクト全体のコストの50%以上であることがわかった。
効率的で効率的なソフトウェアテストは、ソフトウェアの最小限のリソースを利用する。
したがって、効率的なテストを行うだけでなく、プロジェクトリソースの利用を最小限に抑える手順を構築することが重要である。
ソフトウェアテストの目的は、ソフトウェアシステムの最大の欠陥を見つけることです。
ソフトウェアに含まれる欠陥がより効率的であることを保証するのが、ソフトウェアの欠陥を検出し、リソースを活用し、良い結果を得るために異なる手法が提案されていることだ。
世界は、重要な決定を下すためのデータ駆動アプローチに継続的に移行しています。
そこで本研究では,公開データセットの機械学習解析を行い,その精度を最大化しようと試みた。
論文の主な焦点は、データセットに異なる機械学習技術を適用し、どのテクニックが効率的な結果を生み出すかを見つけることである。
特に,アンサンブル学習モデルを提案し,異なるデータセット上でkn,決定木,svm,na\"ive bayesの比較分析を行い,精度,精度,リコール,f1-scoreの点で,アンサンブル法の性能が他の手法よりも優れていることを実証した。
CM1で訓練されたアンサンブルモデルの分類精度は98.56%、KM2で訓練されたアンサンブルモデルの分類精度は98.18%、PC1で訓練されたアンサンブル学習モデルの分類精度は99.27%である。
これは、Ensembleが欠陥予測を他の手法と比較するより効率的な方法であることを示している。
関連論文リスト
- Unlearning as multi-task optimization: A normalized gradient difference approach with an adaptive learning rate [105.86576388991713]
正規化勾配差(NGDiff)アルゴリズムを導入し、目的間のトレードオフをよりよく制御できるようにする。
本研究では,TOFUおよびMUSEデータセットにおける最先端の未学習手法において,NGDiffの優れた性能を実証的に実証し,理論的解析を行った。
論文 参考訳(メタデータ) (2024-10-29T14:41:44Z) - An Empirical Study of the Impact of Test Strategies on Online Optimization for Ensemble-Learning Defect Prediction [2.547631669143471]
我々は,最高精度アンサンブル法を選択するために,オンライン最適化手法であるBanditアルゴリズム(BA)を用いる。
我々は6つの一般的な欠陥予測データセット、バッジのような4つのアンサンブル学習方法、そして、最初に正の予測モジュールをテストする(PF)3つのテスト戦略を使用した。
以上の結果から, BAをPFに適用した場合, 予測精度は平均で向上し, 6つのデータセットのうち最低5つで検出された欠陥数は7%増加した。
論文 参考訳(メタデータ) (2024-09-10T07:06:50Z) - Using Machine Learning To Identify Software Weaknesses From Software
Requirement Specifications [49.1574468325115]
本研究は、要求仕様からソフトウェア弱点を特定するための効率的な機械学習アルゴリズムを見つけることに焦点を当てる。
ProMISE_exp. Naive Bayes、サポートベクターマシン(SVM)、決定木、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)アルゴリズムをテストした。
論文 参考訳(メタデータ) (2023-08-10T13:19:10Z) - Efficient human-in-loop deep learning model training with iterative
refinement and statistical result validation [0.0]
本稿では,超音波イメージング機械学習パイプラインのデータクリーニングに必要なセグメンテーションを作成する方法を紹介する。
本研究では、自動生成したトレーニングデータと人間の視覚的チェックを高速に活用し、時間とコストを低く保ちながら、モデルの精度を向上させる4段階の手法を提案する。
本手法は、静的PHIを含む背景データを除去し、心臓超音波セグメンテーションタスクで実演する。
論文 参考訳(メタデータ) (2023-04-03T13:56:01Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Detecting Errors and Estimating Accuracy on Unlabeled Data with
Self-training Ensembles [38.23896575179384]
本稿では,この2つの課題に同時に対処する,原則的かつ実用的な枠組みを提案する。
1つのインスタンス化は、教師なし精度推定における推定誤差を少なくとも70%削減し、エラー検出のためのF1スコアを少なくとも4.7%改善する。
iWildCamでは、教師なし精度推定における推定誤差を少なくとも70%削減し、エラー検出のためのF1スコアを少なくとも4.7%改善する。
論文 参考訳(メタデータ) (2021-06-29T21:32:51Z) - Can Active Learning Preemptively Mitigate Fairness Issues? [66.84854430781097]
データセットバイアスは、機械学習における不公平な原因の1つです。
不確実性に基づくALで訓練されたモデルが保護クラスの決定において公平であるかどうかを検討する。
また,勾配反転(GRAD)やBALDなどのアルゴリズム的公正性手法の相互作用についても検討する。
論文 参考訳(メタデータ) (2021-04-14T14:20:22Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - SIMPLE: SIngle-network with Mimicking and Point Learning for Bottom-up
Human Pose Estimation [81.03485688525133]
Single-network with Mimicking and Point Learning for Bottom-up Human Pose Estimation (SIMPLE) を提案する。
具体的には、トレーニングプロセスにおいて、SIMPLEが高性能なトップダウンパイプラインからのポーズ知識を模倣できるようにする。
さらに、SIMPLEは人間検出とポーズ推定を統一的なポイントラーニングフレームワークとして定式化し、単一ネットワークで相互に補完する。
論文 参考訳(メタデータ) (2021-04-06T13:12:51Z) - The Integrity of Machine Learning Algorithms against Software Defect
Prediction [0.0]
本報告では,Liangらが開発したオンラインシーケンス・エクストリーム・ラーニング・マシン(OS-ELM)の性能を解析する。
OS-ELMは従来のディープニューラルネットワークよりも高速にトレーニングし、常にグローバルな最適解に収束する。
この分析は、NASAグループが実施する3つのプロジェクトKC1、PC4、PC3で実施される。
論文 参考訳(メタデータ) (2020-09-05T17:26:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。