論文の概要: The Untold Impact of Learning Approaches on Software Fault-Proneness
Predictions
- arxiv url: http://arxiv.org/abs/2207.05710v1
- Date: Tue, 12 Jul 2022 17:31:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 15:48:48.411890
- Title: The Untold Impact of Learning Approaches on Software Fault-Proneness
Predictions
- Title(参考訳): ソフトウェア障害予測における学習アプローチの影響
- Authors: Mohammad Jamil Ahmad, Katerina Goseva-Popstojanova and Robyn R. Lutz
- Abstract要約: 本稿では,2つの学習手法である useAllPredictAll と usePredictPost が,ソフトウェア故障予測の性能に与える影響について検討する。
useAllPredictAllを使用すると、リリース内とリリース間の両方で、usePredictPostを使用するよりも大幅にパフォーマンスが向上する。
- 参考スコア(独自算出の注目度): 2.01747440427135
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software fault-proneness prediction is an active research area, with many
factors affecting prediction performance extensively studied. However, the
impact of the learning approach (i.e., the specifics of the data used for
training and the target variable being predicted) on the prediction performance
has not been studied, except for one initial work. This paper explores the
effects of two learning approaches, useAllPredictAll and usePrePredictPost, on
the performance of software fault-proneness prediction, both within-release and
across-releases. The empirical results are based on data extracted from 64
releases of twelve open-source projects. Results show that the learning
approach has a substantial, and typically unacknowledged, impact on the
classification performance. Specifically, using useAllPredictAll leads to
significantly better performance than using usePrePredictPost learning
approach, both within-release and across-releases. Furthermore, this paper
uncovers that, for within-release predictions, this difference in
classification performance is due to different levels of class imbalance in the
two learning approaches. When class imbalance is addressed, the performance
difference between the learning approaches is eliminated. Our findings imply
that the learning approach should always be explicitly identified and its
impact on software fault-proneness prediction considered. The paper concludes
with a discussion of potential consequences of our results for both research
and practice.
- Abstract(参考訳): ソフトウェア故障確率予測は活発な研究領域であり、予測性能に影響を及ぼす要因が広く研究されている。
しかし、予測性能に対する学習アプローチ(すなわち、トレーニングに使用されるデータと予測対象変数の仕様)の影響は、1つの初期研究を除いて研究されていない。
本稿では,2つの学習手法である useAllPredictAll と usePredictPost が,リリース内およびリリース間におけるソフトウェア故障予測の性能に与える影響について検討する。
実験結果は、12のオープンソースプロジェクトの64リリースから抽出されたデータに基づいている。
結果から,学習手法が分類性能に大きく影響していることが示唆された。
具体的には、useAllPredictAllを使用することで、リリース内とリリース間の両方で、usePredictPost学習アプローチを使用するよりもパフォーマンスが大幅に向上する。
さらに,この分類性能の違いは,2つの学習アプローチにおけるクラス不均衡のレベルの違いによるものであることを明らかにした。
クラス不均衡に対処すると、学習アプローチ間の性能差が排除される。
我々の知見は、学習アプローチが常に明示的に識別され、ソフトウェア欠陥発生予測に対する影響が考慮されるべきであることを示唆している。
本論文は,研究と実践の両面での結果の潜在的な影響について考察した。
関連論文リスト
- Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - Variance of ML-based software fault predictors: are we really improving
fault prediction? [0.3222802562733786]
我々は、最先端の故障予測手法のばらつきを実験的に分析する。
我々は,クラス毎の精度測定値において最大10.10%のばらつきを観測した。
論文 参考訳(メタデータ) (2023-10-26T09:31:32Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Prediction of Dilatory Behavior in eLearning: A Comparison of Multiple
Machine Learning Models [0.2963240482383777]
タスクの不合理な遅延である Procrastination は、オンライン学習においてよくある出来事である。
このような予測に焦点を当てた研究はほとんどない。
様々な種類の予測器と様々な手法の予測性能の比較を含む研究は、事実上存在しない。
論文 参考訳(メタデータ) (2022-06-30T07:24:08Z) - Learning Predictions for Algorithms with Predictions [49.341241064279714]
予測器を学習するアルゴリズムに対して,一般的な設計手法を導入する。
オンライン学習の手法を応用して、敵のインスタンスに対して学習し、堅牢性と一貫性のあるトレードオフを調整し、新しい統計的保証を得る。
両部マッチング,ページマイグレーション,スキーレンタル,ジョブスケジューリングの手法を解析することにより,学習アルゴリズムの導出におけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-02-18T17:25:43Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - A framework for predicting, interpreting, and improving Learning
Outcomes [0.0]
本研究では,学生の観察的,行動的,受験的特徴に基づいて,テストスコアを予測するEmbibe Score Quotient Model(ESQ)を開発した。
ESQは、学生の将来的な採点可能性の予測や、個別の学習ナッジの提供に使用することができる。
論文 参考訳(メタデータ) (2020-10-06T11:22:27Z) - Predicting MOOCs Dropout Using Only Two Easily Obtainable Features from
the First Week's Activities [56.1344233010643]
いくつかの特徴は、学習者の誘惑や興味の欠如に寄与すると考えられており、そのことが解脱や総減退につながる可能性がある。
この研究は、いくつかの機械学習アプローチを比較して、最初の1週間から早期のドロップアウトを予測することを目的としている。
論文 参考訳(メタデータ) (2020-08-12T10:44:49Z) - Counterfactual Predictions under Runtime Confounding [74.90756694584839]
本研究は, 過去のデータからすべての関連要因を抽出した環境で, 事実予測タスクについて検討する。
本稿では,この環境下での対実予測モデル学習のための2次ロバスト手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T15:49:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。