論文の概要: The Good, the Bad, and the Ugly: Predicting Highly Change-Prone Source Code Methods at Their Inception
- arxiv url: http://arxiv.org/abs/2408.05704v1
- Date: Sun, 11 Aug 2024 06:20:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-13 15:57:51.969285
- Title: The Good, the Bad, and the Ugly: Predicting Highly Change-Prone Source Code Methods at Their Inception
- Title(参考訳): 良いこと、悪いこと、うらやましいこと:その開始時に、高度に変更が伴うソースコードメソッドを予測する
- Authors: Shaiful Chowdhury,
- Abstract要約: 将来のメンテナンスの負担を軽減するための主要な戦略は、変更の起こりやすいコードコンポーネントの早期予測と識別である。
49の著名なオープンソースJavaプロジェクトから,74,051のソースコードメソッドを分析した。
その結果,約80%の変化が20%の手法に集中していることが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The cost of software maintenance often surpasses the initial development expenses, making it a significant concern for the software industry. A key strategy for alleviating future maintenance burdens is the early prediction and identification of change-prone code components, which allows for timely optimizations. While prior research has largely concentrated on predicting change-prone files and classes, an approach less favored by practitioners, this paper shifts focus to predicting highly change-prone methods, aligning with the preferences of both practitioners and researchers. We analyzed 774,051 source code methods from 49 prominent open-source Java projects. Our findings reveal that approximately 80% of changes are concentrated in just 20% of the methods, demonstrating the Pareto 80/20 principle. Moreover, this subset of methods is responsible for the majority of the identified bugs in these projects. After establishing their critical role in mitigating software maintenance costs, our study shows that machine learning models can effectively identify these highly change-prone methods from their inception. Additionally, we conducted a thorough manual analysis to uncover common patterns (or concepts) among the more difficult-to-predict methods. These insights can help future research develop new features and enhance prediction accuracy.
- Abstract(参考訳): ソフトウェアメンテナンスのコストは、しばしば初期の開発コストを上回り、ソフトウェア産業にとって重要な関心事となる。
将来のメンテナンスの負担を軽減するための重要な戦略は、変更の起こりやすいコードコンポーネントの早期予測と識別であり、タイムリーな最適化を可能にする。
従来の研究は、変化の激しいファイルやクラスを予測することに集中しており、実践者があまり好まないアプローチであるが、本論文は、実践者と研究者の両方の好みに合わせて、高度に変化の激しい方法を予測することに重点を移している。
49の著名なオープンソースJavaプロジェクトから,74,051のソースコードメソッドを分析した。
その結果,約80%の変化が20%の手法に集中していることが判明し,Pareto 80/20の原則が証明された。
さらに、これらのメソッドのサブセットは、これらのプロジェクトで特定されたバグの大部分の原因となっている。
ソフトウェアメンテナンスコストの軽減において重要な役割を担った後、機械学習モデルは、これらの高度に変化しやすい手法を、その開始から効果的に識別できることを示した。
さらに,より予測が難しい手法の共通パターン(概念)を明らかにするために,手作業による詳細な分析を行った。
これらの洞察は、将来の研究で新しい機能を開発し、予測精度を高めるのに役立つ。
関連論文リスト
- Feature Importance in the Context of Traditional and Just-In-Time Software Defect Prediction Models [5.1868909177638125]
本研究では,Apache Camelプロジェクトの公開データセットから,従来型およびJust-In-Timeアプローチを取り入れた欠陥予測モデルを開発した。
機械学習アルゴリズムと比較して,これらのデータセットに多層深層学習アルゴリズムを適用した。
深層学習アルゴリズムは80%と86%の精度を達成し, 従来型とジャスト・イン・タイムの欠陥予測では, それぞれ66%と78%の受信演算子曲線(AUC)のスコアが得られた。
論文 参考訳(メタデータ) (2024-11-07T22:49:39Z) - Achieving Fairness in Predictive Process Analytics via Adversarial Learning [50.31323204077591]
本稿では、デバイアスフェーズを予測ビジネスプロセス分析に組み込むことの課題に対処する。
本研究の枠組みは, 4つのケーススタディで検証し, 予測値に対する偏り変数の寄与を著しく低減することを示した。
論文 参考訳(メタデータ) (2024-10-03T15:56:03Z) - Code Revert Prediction with Graph Neural Networks: A Case Study at J.P. Morgan Chase [10.961209762486684]
コードリバース予測は、コード変更がソフトウェア開発で逆転またはロールバックされる可能性を予測または予測することを目的としている。
コード欠陥検出の以前の方法は、独立した機能に依存していたが、コードスクリプト間の関係を無視していた。
本稿では,コードインポートグラフとコード特徴を統合した,コード逆転予測のための系統的研究について述べる。
論文 参考訳(メタデータ) (2024-03-14T15:54:29Z) - Learning-Augmented Algorithms with Explicit Predictors [67.02156211760415]
アルゴリズム設計の最近の進歩は、過去のデータと現在のデータから得られた機械学習モデルによる予測の活用方法を示している。
この文脈における以前の研究は、予測器が過去のデータに基づいて事前訓練され、ブラックボックスとして使用されるパラダイムに焦点を当てていた。
本研究では,予測器を解き,アルゴリズムの課題の中で生じる学習問題を統合する。
論文 参考訳(メタデータ) (2024-03-12T08:40:21Z) - Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.72940700598055]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。
入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。
私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文 参考訳(メタデータ) (2024-03-04T16:21:54Z) - Non-Clairvoyant Scheduling with Predictions Revisited [77.86290991564829]
非論理的スケジューリングでは、優先度不明な処理条件でジョブをスケジューリングするためのオンライン戦略を見つけることが課題である。
我々はこのよく研究された問題を、アルゴリズム設計に(信頼できない)予測を統合する、最近人気の高い学習強化された設定で再検討する。
これらの予測には所望の特性があり, 高い性能保証を有するアルゴリズムと同様に, 自然な誤差測定が可能であることを示す。
論文 参考訳(メタデータ) (2022-02-21T13:18:11Z) - Learning Predictions for Algorithms with Predictions [49.341241064279714]
予測器を学習するアルゴリズムに対して,一般的な設計手法を導入する。
オンライン学習の手法を応用して、敵のインスタンスに対して学習し、堅牢性と一貫性のあるトレードオフを調整し、新しい統計的保証を得る。
両部マッチング,ページマイグレーション,スキーレンタル,ジョブスケジューリングの手法を解析することにより,学習アルゴリズムの導出におけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2022-02-18T17:25:43Z) - Few-shot Quality-Diversity Optimization [50.337225556491774]
品質多様性(QD)の最適化は、強化学習における知覚的最小値とスパース報酬を扱う上で効果的なツールであることが示されている。
本稿では,タスク分布の例から,パラメータ空間の最適化によって得られる経路の情報を利用して,未知の環境でQD手法を初期化する場合,数発の適応が可能であることを示す。
ロボット操作とナビゲーションベンチマークを用いて、疎密な報酬設定と密集した報酬設定の両方で実施された実験は、これらの環境でのQD最適化に必要な世代数を著しく削減することを示している。
論文 参考訳(メタデータ) (2021-09-14T17:12:20Z) - FRUGAL: Unlocking SSL for Software Analytics [17.63040340961143]
教師なし学習は、ラベルのないデータの中に隠されたパターンを学ぶための有望な方向である。
FRUGALは、単純な最適化方式に基づくチューニング半教師付き手法である。
論文 参考訳(メタデータ) (2021-08-22T21:15:27Z) - Machine Learning Techniques for Software Quality Assurance: A Survey [5.33024001730262]
我々は,障害予測とテストケース優先順位付けの両方における様々なアプローチについて考察する。
近年,障害予測のためのディープラーニングアルゴリズムは,プログラムのセマンティクスと障害予測機能とのギャップを埋めるのに役立つ。
論文 参考訳(メタデータ) (2021-04-29T00:37:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。