論文の概要: Moving from Cross-Project Defect Prediction to Heterogeneous Defect
Prediction: A Partial Replication Study
- arxiv url: http://arxiv.org/abs/2103.03490v1
- Date: Fri, 5 Mar 2021 06:29:45 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-08 14:39:33.501109
- Title: Moving from Cross-Project Defect Prediction to Heterogeneous Defect
Prediction: A Partial Replication Study
- Title(参考訳): クロスプロジェクト欠陥予測から異種欠陥予測への移行:部分レプリケーションによる検討
- Authors: Hadi Jahanshahi, Mucahit Cevik, Ay\c{s}e Ba\c{s}ar
- Abstract要約: 以前の研究では、しばしば機械学習技術を使ってバグ予測モデルを構築し、検証し、改善した。
これらのモデルから得られる知識は、ソースプロジェクトで十分なメトリクスが収集されていない場合、ターゲットプロジェクトと重複することはない。
得られた結果の再現と検証により,系統的に異種欠陥予測(HDP)を統合した。
その結果,hdpアルゴリズムはパラメータ選択に対する感度が高いため,多くのケースで実現不可能であることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Software defect prediction heavily relies on the metrics collected from
software projects. Earlier studies often used machine learning techniques to
build, validate, and improve bug prediction models using either a set of
metrics collected within a project or across different projects. However,
techniques applied and conclusions derived by those models are restricted by
how identical those metrics are. Knowledge coming from those models will not be
extensible to a target project if no sufficient overlapping metrics have been
collected in the source projects. To explore the feasibility of transferring
knowledge across projects without common labeled metrics, we systematically
integrated Heterogeneous Defect Prediction (HDP) by replicating and validating
the obtained results. Our main goal is to extend prior research and explore the
feasibility of HDP and finally to compare its performance with that of its
predecessor, Cross-Project Defect Prediction. We construct an HDP model on
different publicly available datasets. Moreover, we propose a new ensemble
voting approach in the HDP context to utilize the predictive power of multiple
available datasets. The result of our experiment is comparable to that of the
original study. However, we also explored the feasibility of HDP in real cases.
Our results shed light on the infeasibility of many cases for the HDP algorithm
due to its sensitivity to the parameter selection. In general, our analysis
gives a deep insight into why and how to perform transfer learning from one
domain to another, and in particular, provides a set of guidelines to help
researchers and practitioners to disseminate knowledge to the defect prediction
domain.
- Abstract(参考訳): ソフトウェア欠陥予測は、ソフトウェアプロジェクトから集められたメトリクスに大きく依存します。
以前の研究では、しばしば機械学習技術を使用して、プロジェクト内または異なるプロジェクト間で収集されたメトリクスのセットを使用して、バグ予測モデルを構築し、検証し、改善した。
しかしながら、これらのモデルが適用した手法と結論は、これらの指標がどの程度同一であるかによって制限される。
これらのモデルから得られる知識は、ソースプロジェクトで十分な重複メトリクスが収集されていない場合、ターゲットプロジェクトに拡張できない。
共通ラベル付きメトリクスを使わずにプロジェクト間で知識を伝達できる可能性を探るため,得られた成果を再現し検証することにより,異種欠陥予測(HDP)を体系的に統合した。
我々の主な目標は、先行研究を拡張し、HDPの実現可能性を探究し、最終的にその性能を前任のクロスプロジェクト欠陥予測と比べることです。
公開データセットの異なるHDPモデルを構築しています。
さらに,複数の利用可能なデータセットの予測能力を活用するために,HDPコンテキストにおける新しいアンサンブル投票手法を提案する。
私たちの実験の結果は、元の研究のそれと匹敵します。
しかし,実例ではHDPの実現可能性についても検討した。
その結果,hdpアルゴリズムはパラメータ選択に対する感度が高いため,多くのケースで実現不可能であることが判明した。
一般的に、私たちの分析は、あるドメインから別のドメインへの転送学習を行う理由と方法について深い洞察を与え、特に、研究者や実践者が欠陥予測ドメインに知識を広めるのに役立つ一連のガイドラインを提供します。
関連論文リスト
- Predictions as Surrogates: Revisiting Surrogate Outcomes in the Age of AI [12.569286058146343]
我々は、生物統計学における数十年前の代理結果モデルと予測駆動推論(PPI)の新たな分野との正式な関係を確立する。
我々は、既存のPPI提案よりも効率的な統計的推論手法である、補正予測を用いた推論を開発する。
我々は,最先端の機械学習/AIモデルを活用した3つのアプリケーションを通じて,既存のPPI提案よりも有効サンプルサイズが大幅に向上したことを示す。
論文 参考訳(メタデータ) (2025-01-16T18:30:33Z) - The Impact of Defect (Re) Prediction on Software Testing [1.5869998695491834]
クロスプロジェクト欠陥予測(CPDP)は、同じプロジェクトから過去のデータが入手できない可能性があるため、外部プロジェクトからのデータを使用することを目的としている。
Bandit Algorithm(BA)に基づくアプローチは、これまで最も適切な学習プロジェクトを選択するために提案されてきた。
本研究の目的は,特に早期試験において,見渡す欠陥を減らすため,BA法を改善することである。
論文 参考訳(メタデータ) (2024-04-17T03:34:13Z) - Explainable Software Defect Prediction from Cross Company Project
Metrics Using Machine Learning [5.829545587965401]
本研究では,様々な機械学習アルゴリズムを適用した欠陥予測モデルの開発に焦点をあてる。
既存の欠陥予測研究で注目すべき問題は、開発モデルにおける透明性の欠如である。
論文 参考訳(メタデータ) (2023-06-14T17:46:08Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Defect Prediction Using Stylistic Metrics [2.286041284499166]
本稿では,プロジェクト内およびプロジェクト内欠陥予測におけるスタイリスティックな指標の影響を分析することを目的とする。
実験は5つの人気のあるオープンソースプロジェクトの14のリリースで実施されている。
論文 参考訳(メタデータ) (2022-06-22T10:11:05Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Uncertainty Prediction for Machine Learning Models of Material
Properties [0.0]
物質特性のAIベースの予測の不確実性は、物質科学におけるAIアプリケーションの成功と信頼性にとって非常に重要である。
このような個人的不確実性を得るための3つの異なるアプローチを比較し、それらを12のML物理特性で検証する。
論文 参考訳(メタデータ) (2021-07-16T16:33:55Z) - Test-time Collective Prediction [73.74982509510961]
マシンラーニングの複数のパーティは、将来のテストポイントを共同で予測したいと考えています。
エージェントは、すべてのエージェントの集合の集合的な専門知識の恩恵を受けることを望んでいるが、データやモデルパラメータを解放する意思はないかもしれない。
我々は、各エージェントの事前学習モデルを利用して、テスト時に集合的な予測を行う分散型メカニズムを探索する。
論文 参考訳(メタデータ) (2021-06-22T18:29:58Z) - NADS: Neural Architecture Distribution Search for Uncertainty Awareness [79.18710225716791]
機械学習(ML)システムは、トレーニングデータとは異なるディストリビューションから来るテストデータを扱う場合、しばしばOoD(Out-of-Distribution)エラーに遭遇する。
既存のOoD検出アプローチはエラーを起こしやすく、時にはOoDサンプルに高い確率を割り当てることもある。
本稿では,すべての不確実性を考慮したアーキテクチャの共通構築ブロックを特定するために,ニューラルアーキテクチャ分布探索(NADS)を提案する。
論文 参考訳(メタデータ) (2020-06-11T17:39:07Z) - Ambiguity in Sequential Data: Predicting Uncertain Futures with
Recurrent Models [110.82452096672182]
逐次データによる曖昧な予測を扱うために,Multiple hypothesis Prediction(MHP)モデルの拡張を提案する。
また、不確実性を考慮するのに適した曖昧な問題に対する新しい尺度も導入する。
論文 参考訳(メタデータ) (2020-03-10T09:15:42Z) - Meta-Learned Confidence for Few-shot Learning [60.6086305523402]
数ショットのメトリックベースのアプローチのための一般的なトランスダクティブ推論手法は、最も確実なクエリ例の平均で、各クラスのプロトタイプを更新することである。
本稿では,各クエリの信頼度をメタラーニングして,ラベルのないクエリに最適な重みを割り当てる手法を提案する。
4つのベンチマークデータセットに対してメタ学習の信頼度で、少数ショットの学習モデルを検証した。
論文 参考訳(メタデータ) (2020-02-27T10:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。