Fugu-MT 論文翻訳(概要): Investigating the Use of One-Class Support Vector Machine for Software Defect Prediction

論文の概要: Investigating the Use of One-Class Support Vector Machine for Software Defect Prediction

arxiv url: http://arxiv.org/abs/2202.12074v1
Date: Thu, 24 Feb 2022 12:57:14 GMT
ステータス: 翻訳完了
システム内更新日: 2022-02-25 16:37:13.958612
Title: Investigating the Use of One-Class Support Vector Machine for Software Defect Prediction
Title（参考訳）: ソフトウェア欠陥予測におけるワンクラス支援ベクトルマシンの利用の検討
Authors: Rebecca Moussa, Danielle Azar and Federica Sarro
Abstract要約: 一つのクラスからのみ学習することが、効果的な欠陥予測モデルを生成するのに十分かどうかを検討する。その結果,OCSVMはプロジェクト内欠陥予測よりもクロスバージョンやクロスプロジェクトに適していることがわかった。
参考スコア（独自算出の注目度）: 8.066214414156562
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Early software defect identification is considered an important step towards software quality assurance. Software defect prediction aims at identifying software components that are likely to cause faults before a software is made available to the end-user. To date, this task has been modeled as a two-class classification problem, however its nature also allows it to be formulated as a one-class classification task. Preliminary results obtained in prior work show that One-Class Support Vector Machine (OCSVM) can outperform two-class classifiers for defect prediction. If confirmed, these results would overcome the data imbalance problem researchers have for long attempted to tackle in this field. In this paper, we further investigate whether learning from one class only is sufficient to produce effective defect prediction models by conducting a thorough large-scale empirical study investigating 15 real-world software projects, three validation scenarios, eight classifiers, robust evaluation measures and statistical significance tests. The results reveal that OCSVM is more suitable for cross-version and cross-project, rather than for within-project defect prediction, thus suggesting it performs better with heterogeneous data. While, we cannot conclude that OCSVM is the best classifier (Random Forest performs best herein), our results show interesting findings that open up further research avenues for training accurate defect prediction classifiers when defective instances are scarce or unavailable.
Abstract（参考訳）: 初期のソフトウェア欠陥の識別は、ソフトウェアの品質保証への重要なステップだと考えられている。ソフトウェア欠陥予測は、ソフトウェアがエンドユーザに提供される前に障害を引き起こす可能性のあるソフトウェアコンポーネントを特定することを目的としている。現在までに、このタスクは2クラス分類問題としてモデル化されているが、その性質は1クラス分類タスクとして定式化することもできる。先行研究から得られた予備結果は,1クラスサポートベクトルマシン(OCSVM)が欠陥予測のために2クラス分類器より優れていることを示している。もし確認できれば、これらの結果は研究者がこの分野で長年取り組んできたデータ不均衡問題を克服するだろう。本稿では,15の実世界のソフトウェアプロジェクト,3つの検証シナリオ,8つの分類器,頑健な評価尺度,統計的意義試験を徹底的に実施することにより,1つのクラスからの学習が効果的な欠陥予測モデルを生成するのに十分かどうかをさらに検討する。その結果,OCSVMはプロジェクト内欠陥予測よりもクロスバージョンやクロスプロジェクトに適していることがわかった。 ocsvmが最善の分類器(random forestはここでベスト)であると結論付けることはできないが、欠陥インスタンスの不足や使用不能時に正確な欠陥予測分類器を訓練するための研究の道を開く興味深い結果が得られた。

関連論文リスト

Bug Destiny Prediction in Large Open-Source Software Repositories through Sentiment Analysis and BERT Topic Modeling [3.481985817302898]
バグが解決する前に利用可能な機能を活用して、予測精度を高めます。本手法は感情分析を取り入れ,感情性スコアと感情分類の両方を導出する。結果は、感情分析がバグの最終的な結果の貴重な予測要因であることを示している。
論文参考訳（メタデータ） (2025-04-22T15:18:14Z)
Toward Multi-class Anomaly Detection: Exploring Class-aware Unified Model against Inter-class Interference [67.36605226797887]
統一型異常検出(MINT-AD)のためのマルチクラスインプリシトニューラル表現変換器を提案する。マルチクラス分布を学習することにより、モデルが変換器デコーダのクラス対応クエリ埋め込みを生成する。 MINT-ADは、カテゴリと位置情報を特徴埋め込み空間に投影することができ、さらに分類と事前確率損失関数によって監督される。
論文参考訳（メタデータ） (2024-03-21T08:08:31Z)
Characterizing the Optimal 0-1 Loss for Multi-class Classification with a Test-time Attacker [57.49330031751386]
我々は,任意の離散データセット上の複数クラス分類器に対するテスト時間攻撃の存在下での損失に対する情報理論的下位境界を求める。本稿では,データと敵対的制約から競合ハイパーグラフを構築する際に発生する最適0-1損失を求めるための一般的なフレームワークを提供する。
論文参考訳（メタデータ） (2023-02-21T15:17:13Z)
RF+clust for Leave-One-Problem-Out Performance Prediction [0.9281671380673306]
本稿では,LOPO(Left-one-problem-out)のパフォーマンス予測について検討する。我々は、標準ランダムフォレスト(RF)モデル予測が性能値の重み付き平均値で校正することで改善できるかどうかを解析する。
論文参考訳（メタデータ） (2023-01-23T16:14:59Z)
Parametric Classification for Generalized Category Discovery: A Baseline Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文参考訳（メタデータ） (2022-11-21T18:47:11Z)
The Impact of Using Regression Models to Build Defect Classifiers [13.840006058766766]
継続的欠陥数を欠陥クラスと非欠陥クラスに分類することは、よくあるプラクティスである。両手法を用いて構築した欠陥分類器の性能と解釈を比較した。
論文参考訳（メタデータ） (2022-02-12T22:12:55Z)
Is the Performance of My Deep Network Too Good to Be True? A Direct Approach to Estimating the Bayes Error in Binary Classification [86.32752788233913]
分類問題において、ベイズ誤差は、最先端の性能を持つ分類器を評価するための基準として用いられる。我々はベイズ誤差推定器を提案する。そこでは,クラスの不確かさを示すラベルの平均値のみを評価できる。我々の柔軟なアプローチは、弱い教師付きデータであってもベイズ誤差を推定できる。
論文参考訳（メタデータ） (2022-02-01T13:22:26Z)
Score-Based Generative Classifiers [9.063815952852783]
生成モデルは、MNISTのような単純なデータセット上で逆向きに堅牢な分類器として使われてきた。これまでの結果は、データの可能性と分類精度のトレードオフを示唆している。スコアに基づく生成モデルは,標準的な識別モデルと比較して,分類精度のギャップを埋めていることを示す。
論文参考訳（メタデータ） (2021-10-01T15:05:33Z)
No Fear of Heterogeneity: Classifier Calibration for Federated Learning with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文参考訳（メタデータ） (2021-06-09T12:02:29Z)
Model Rectification via Unknown Unknowns Extraction from Deployment Samples [8.0497115494227]
本稿では, 訓練後のモデル修正を, 教師付き方式で実施することを目的とした, 汎用的なアルゴリズムフレームワークを提案する。 RTSCVは未知の未知(u.u.s)を抽出する RTSCVは最先端のアプローチよりも一貫して優れていることを示す。
論文参考訳（メタデータ） (2021-02-08T11:46:19Z)
Solving Long-tailed Recognition with Deep Realistic Taxonomic Classifier [68.38233199030908]
ロングテール認識は、現実世界のシナリオにおける自然な非一様分散データに取り組む。モダンは人口密度の高いクラスではうまく機能するが、そのパフォーマンスはテールクラスでは著しく低下する。 Deep-RTCは、リアリズムと階層的予測を組み合わせたロングテール問題の新しい解法として提案されている。
論文参考訳（メタデータ） (2020-07-20T05:57:42Z)
An Unsupervised Learning Classifier with Competitive Error Performance [0.0]
このモデルは、選択された識別超平面上での小さなステップシフトと回転操作の漸進的な実行に基づいている。 ImageNetデータセットベンチマークのサブセットに選択された特徴抽出器と共に適用すると、エラーの確率は6.2 %になる。この結果は、同じデータセットで事実上役に立たないことを示すk-Meansのような、一般的な教師なし学習スキームとも対照的である。
論文参考訳（メタデータ） (2018-06-25T11:12:03Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。