論文の概要: Commit-Aware Learning-Based Test Case Prioritization for Continuous Integration
- arxiv url: http://arxiv.org/abs/2604.25363v1
- Date: Tue, 28 Apr 2026 08:30:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.773861
- Title: Commit-Aware Learning-Based Test Case Prioritization for Continuous Integration
- Title(参考訳): 継続的統合のためのコミットアウェアラーニングに基づくテストケース優先順位付け
- Authors: Lorenzo Abbondante, Gerardo Canfora,
- Abstract要約: 継続的インテグレーション(CI)パイプラインにおける回帰テストは、テストスイートのサイズと実行頻度の増大により、ますますコストがかかる。
テストケース優先順位付け(TCP)は、早期に障害を公開するためにテストを再順序付けすることでこの問題を軽減する。
本稿では,バージョン管理差分,テストカバレッジ関係,過去の実行行動などの構造特性を統一的な予測モデルに組み合わせた,コミット対応学習型TCP手法を提案する。
- 参考スコア(独自算出の注目度): 0.3781421673607643
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Regression testing in Continuous Integration (CI) pipelines is increasingly costly due to the growing size and execution frequency of test suites. Test Case Prioritization (TCP) mitigates this problem by reordering tests to expose faults earlier. However, most existing techniques rely primarily on historical execution data and coverage metrics, neglecting the rich structural information contained in code changes. This paper proposes a commit-aware, learning-based TCP method that combines structural properties of version-control diffs, test coverage relations, and historical execution behavior into a unified predictive model. Given a new commit, the method estimates the probability that each test suite will reveal at least one failure and prioritizes test execution accordingly. We evaluate our method on five Defects4J projects using a leave-one-project-out cross-project validation setting. Results show that the commit-aware TCP significantly outperform non-commit-aware-baselines in both classification and prioritization effectiveness. Our findings show that including commit structural semantics substantially enhances regression fault detection and enables robust, generalizable learning-based TCP in CI environments.
- Abstract(参考訳): 継続的インテグレーション(CI)パイプラインにおける回帰テストは、テストスイートのサイズと実行頻度の増大により、ますますコストがかかる。
テストケース優先順位付け(TCP)は、早期に障害を公開するためにテストを再順序付けすることでこの問題を軽減する。
しかし、既存のほとんどのテクニックは、主に過去の実行データとカバレッジメトリクスに依存しており、コードの変更に含まれる豊富な構造情報を無視しています。
本稿では,バージョン管理差分,テストカバレッジ関係,過去の実行行動などの構造特性を統一的な予測モデルに組み合わせた,コミット対応学習型TCP手法を提案する。
新しいコミットが与えられた場合、各テストスイートが少なくとも1つの障害を明らかにし、それに従ってテスト実行を優先順位付けする確率を推定する。
本手法は,5つのDefects4Jプロジェクトにおいて,プロジェクト間検証設定を用いて評価を行う。
その結果,コミットアウェアTCPは,分類と優先順位付けの両面で,非コミットアウェアベースラインを著しく上回ることがわかった。
この結果から,コミット構造的セマンティクスを含めることにより,回帰障害の検出が大幅に向上し,CI環境における堅牢で一般化可能な学習ベースTCPの実現が可能となった。
関連論文リスト
- Understanding the Role of Training Data in Test-Time Scaling [56.12341509545198]
線形回帰のための文脈内重み予測タスクを訓練した変圧器の試験時間スケーリング性能について検討した。
多様な、関連性があり、難しいタスクセットでのトレーニングが、テスト時間のスケーリングに最高のパフォーマンスをもたらすことを示す。
論文 参考訳(メタデータ) (2025-10-04T01:38:48Z) - Learning-Based Testing for Deep Learning: Enhancing Model Robustness with Adversarial Input Prioritization [0.0]
このプロジェクトはディープニューラルネットワーク(DNN)における障害検出とモデルロバスト性の向上を目的としている。
本手法は, アーキテクチャ固有の特徴や形式的検証に頼ることなく, モデル欠陥を暴露する確率の高い逆入力のサブセットを選択する。
テストの置換を効率的に組織することにより、さまざまなデータセット、モデルアーキテクチャ、および敵攻撃テクニックで、潜在的なすべての障害を著しく高速に発見する。
論文 参考訳(メタデータ) (2025-09-28T16:31:30Z) - On the Mistaken Assumption of Interchangeable Deep Reinforcement Learning Implementations [58.60617136236957]
ディープ・強化学習(Deep Reinforcement Learning, DRL)とは、エージェントがニューラルネットワークを使って特定の環境でどのアクションをとるかを学ぶ人工知能のパラダイムである。
DRLは最近、ドライビングシミュレーター、3Dロボット制御、マルチプレイヤー・オンライン・バトル・アリーナ・ビデオゲームといった複雑な環境を解くことで注目を集めている。
現在、Deep Q-Network (DQN) や Proximal Policy Optimization (PPO) アルゴリズムのような、これらのエージェントを訓練する最先端のアルゴリズムの実装が数多く存在する。
論文 参考訳(メタデータ) (2025-03-28T16:25:06Z) - Segment-Based Test Case Prioritization: A Multi-objective Approach [8.972346309150199]
TCP(Test Case Prioritization)は、目的関数を最大化する実行順序でテストケースをスケジュールするコスト効率の高いソリューションである。
進化的検索アルゴリズムと4つのカバレッジ基準を用いてUIテストケースを優先する多目的最適化手法を提案する。
提案手法は,APFD(Average Percentage of Faults Detected)とAPFD(APFD with Cost)において,他の手法よりも優れている。
論文 参考訳(メタデータ) (2024-08-01T16:51:01Z) - Towards Explainable Test Case Prioritisation with Learning-to-Rank Models [6.289767078502329]
テストケース優先順位付け(TCP)は、ソフトウェアが進化するにつれて品質を確保するために回帰テストにおいて重要なタスクである。
我々は、異なる説明を必要とするシナリオと、TCPの特異性がそれらにどのように影響するかを提示し、議論する。
論文 参考訳(メタデータ) (2024-05-22T16:11:45Z) - Active Test-Time Adaptation: Theoretical Analyses and An Algorithm [51.84691955495693]
テスト時間適応(TTA)は、教師なし設定でストリーミングテストデータの分散シフトに対処する。
完全TTA設定内に能動学習を統合する能動テスト時間適応(ATTA)の新たな問題設定を提案する。
論文 参考訳(メタデータ) (2024-04-07T22:31:34Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - Sequential Kernelized Independence Testing [77.237958592189]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - DeepOrder: Deep Learning for Test Case Prioritization in Continuous
Integration Testing [6.767885381740952]
この研究は、回帰機械学習に基づいて動作するディープラーニングベースのモデルであるDeepOrderを紹介している。
DeepOrderは、テスト実行の履歴記録に基づいて、以前のテストサイクルの任意の数からテストケースをランク付けする。
実験により, 深部ニューラルネットワークは, 単純な回帰モデルとして, 連続的な統合テストにおいて, テストケースの優先順位付けに効率的に利用できることを示した。
論文 参考訳(メタデータ) (2021-10-14T15:10:38Z) - Test case prioritization using test case diversification and
fault-proneness estimations [0.0]
本稿では,テストケースカバレッジデータ,バグ履歴,テストケースの多様化を考慮したTCPのアプローチを提案する。
クラスタリングに基づくアプローチスキームにフォールト・プレネネスを組み込むことにより,テストケースの多様化が維持される。
実験の結果,提案手法はカバレッジに基づくTCP方式よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-06-19T15:55:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。