論文の概要: The Effect of Defect (Re) Prediction on Software Testing
- arxiv url: http://arxiv.org/abs/2404.11040v1
- Date: Wed, 17 Apr 2024 03:34:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-18 15:24:20.887457
- Title: The Effect of Defect (Re) Prediction on Software Testing
- Title(参考訳): 欠陥(Re)予測がソフトウェアテストに及ぼす影響
- Authors: Yukasa Murakami, Yuta Yamasaki, Masateru Tsunoda, Akito Monden, Amjed Tahir, Kwabena Ebo Bennin, Koji Toda, Keitaro Nakasai,
- Abstract要約: プロジェクト間の欠陥予測は、同じプロジェクトから過去のデータが入手できない可能性があるため、外部プロジェクトからのデータを使用することを目的としている。
Bandit Algorithm(BA)に基づくアプローチは,これまで最も適切な学習プロジェクトを選択するために提案されてきた。
本研究の目的は,特に早期の検査において,見渡す欠陥を減らすため,BA法を改善することである。
- 参考スコア(独自算出の注目度): 1.5869998695491834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: Cross-project defect prediction (CPDP) aims to use data from external projects as historical data may not be available from the same project. In CPDP, deciding on a particular historical project to build a training model can be difficult. To help with this decision, a Bandit Algorithm (BA) based approach has been proposed in prior research to select the most suitable learning project. However, this BA method could lead to the selection of unsuitable data during the early iteration of BA (i.e., early stage of software testing). Selecting an unsuitable model can reduce the prediction accuracy, leading to potential defect overlooking. This study aims to improve the BA method to reduce defects overlooking, especially during the early stage of testing. Once all modules have been tested, modules tested in the early stage are re-predicted, and some modules are retested based on the re-prediction. To assess the impact of re-prediction and retesting, we applied five kinds of BA methods, using 8, 16, and 32 OSS projects as learning data. The results show that the newly proposed approach steadily reduced the probability of defect overlooking on 86.7% of the BA methods and projects combinations.
- Abstract(参考訳): 背景: クロスプロジェクト欠陥予測(CPDP)は、同じプロジェクトから過去のデータが入手できない可能性があるため、外部プロジェクトからのデータを使用することを目的としている。
CPDPでは、トレーニングモデルを構築するための特定の歴史的プロジェクトを決定することは困難である。
この決定を支援するために、Bandit Algorithm (BA) ベースのアプローチが先行研究で提案され、最も適切な学習プロジェクトを選択する。
しかし、このBA手法は、BAの初期イテレーション(すなわち、ソフトウェアテストの初期段階)において、不適切なデータの選択につながる可能性がある。
不適切なモデルを選択することで、予測精度が低下し、潜在的な欠陥を見落としてしまう可能性がある。
本研究の目的は,特に早期の検査において,見渡す欠陥を減らすため,BA法を改善することである。
一度すべてのモジュールがテストされると、初期段階でテストされたモジュールは再予測され、いくつかのモジュールは再予測に基づいて再テストされる。
再予測と再テストの効果を評価するため,8,16,32のOSSプロジェクトを学習データとして,5種類のBA手法を適用した。
その結果,新たに提案された手法は,BA手法とプロジェクトの組み合わせの86.7%の欠陥を見越す確率を着実に低下させた。
関連論文リスト
- A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [48.96686419141881]
大規模言語モデル(LLM)における最初の形式的確率的評価フレームワークを紹介する。
モデルの出力分布に関する高い確率保証を持つ新しい指標を導出する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文 参考訳(メタデータ) (2024-10-04T15:44:23Z) - An Empirical Study of the Impact of Test Strategies on Online Optimization for Ensemble-Learning Defect Prediction [2.547631669143471]
我々は,最高精度アンサンブル法を選択するために,オンライン最適化手法であるBanditアルゴリズム(BA)を用いる。
我々は6つの一般的な欠陥予測データセット、バッジのような4つのアンサンブル学習方法、そして、最初に正の予測モジュールをテストする(PF)3つのテスト戦略を使用した。
以上の結果から, BAをPFに適用した場合, 予測精度は平均で向上し, 6つのデータセットのうち最低5つで検出された欠陥数は7%増加した。
論文 参考訳(メタデータ) (2024-09-10T07:06:50Z) - Building Defect Prediction Models by Online Learning Considering Defect Overlooking [1.5869998695491834]
オンライン学習に基づく欠陥予測モデルの構築は、予測精度を向上させることができる。
非欠陥(non-defective)"と予測されるモジュールは、そのようなモジュールのテストケースが少なくなる可能性がある。
誤テスト結果は、オンライン学習による学習データとして使用され、予測精度に悪影響を及ぼす可能性がある。
論文 参考訳(メタデータ) (2024-04-17T03:20:46Z) - Uncertainty-Calibrated Test-Time Model Adaptation without Forgetting [55.17761802332469]
テスト時間適応(TTA)は、与えられたモデルw.r.t.を任意のテストサンプルに適用することにより、トレーニングデータとテストデータの間の潜在的な分散シフトに取り組むことを目指している。
事前の手法は各テストサンプルに対してバックプロパゲーションを実行するため、多くのアプリケーションに対して許容できない最適化コストがかかる。
本稿では, 有効サンプル選択基準を策定し, 信頼性および非冗長なサンプルを同定する, 効率的なアンチフォッティングテスト時間適応法を提案する。
論文 参考訳(メタデータ) (2024-03-18T05:49:45Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Software Defect Prediction by Online Learning Considering Defect
Overlooking [1.655352281097533]
オンライン学習に基づく欠陥予測モデルの構築は、予測精度を向上させることができる。
新しいデータポイントを追加する際に、新しい予測モデルを継続的に再構築する。
しかし、モジュールを"非欠陥"(負の予測)として予測すると、そのようなモジュールのテストケースが少なくなる。
論文 参考訳(メタデータ) (2023-08-25T15:02:22Z) - Learning Sample Difficulty from Pre-trained Models for Reliable
Prediction [55.77136037458667]
本稿では,大規模事前学習モデルを用いて,サンプル難易度を考慮したエントロピー正規化による下流モデルトレーニングを指導する。
我々は、挑戦的なベンチマークで精度と不確実性の校正を同時に改善する。
論文 参考訳(メタデータ) (2023-04-20T07:29:23Z) - Uncertainty estimation of pedestrian future trajectory using Bayesian
approximation [137.00426219455116]
動的トラフィックシナリオでは、決定論的予測に基づく計画は信頼できない。
著者らは、決定論的アプローチが捉えられない近似を用いて予測中の不確実性を定量化する。
将来の状態の不確実性に対する降雨重量と長期予測の影響について検討した。
論文 参考訳(メタデータ) (2022-05-04T04:23:38Z) - Moving from Cross-Project Defect Prediction to Heterogeneous Defect
Prediction: A Partial Replication Study [0.0]
以前の研究では、しばしば機械学習技術を使ってバグ予測モデルを構築し、検証し、改善した。
これらのモデルから得られる知識は、ソースプロジェクトで十分なメトリクスが収集されていない場合、ターゲットプロジェクトと重複することはない。
得られた結果の再現と検証により,系統的に異種欠陥予測(HDP)を統合した。
その結果,hdpアルゴリズムはパラメータ選択に対する感度が高いため,多くのケースで実現不可能であることが判明した。
論文 参考訳(メタデータ) (2021-03-05T06:29:45Z) - Counterfactual Predictions under Runtime Confounding [74.90756694584839]
本研究は, 過去のデータからすべての関連要因を抽出した環境で, 事実予測タスクについて検討する。
本稿では,この環境下での対実予測モデル学習のための2次ロバスト手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T15:49:05Z) - Software Defect Prediction Based On Deep Learning Models: Performance
Study [0.5735035463793008]
Stack Sparse Auto-Encoder(SSAE)とDeep Belief Network(DBN)の2つのディープラーニングモデルがデプロイされ、NASAデータセットを分類する。
実験の結果,十分なサンプルが得られたデータセットの精度が向上した。
論文 参考訳(メタデータ) (2020-04-02T06:02:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。