論文の概要: On Rank Aggregating Test Prioritizations
- arxiv url: http://arxiv.org/abs/2412.00015v1
- Date: Fri, 15 Nov 2024 11:17:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-08 09:16:07.417158
- Title: On Rank Aggregating Test Prioritizations
- Title(参考訳): テスト優先順位付けのランク付けについて
- Authors: Shouvick Mondal, Tse-Hsun Chen,
- Abstract要約: テストケース優先順位付け(TCP)は回帰テストの最適化に有効な戦略である。
本研究では, (i) アンサンブル選択, (ii) ランク集約, (iii) テストケース実行の3段階パイプラインとして, Ensemble Test Prioritization (EnTP) を提案する。
- 参考スコア(独自算出の注目度): 1.7802147489386628
- License:
- Abstract: Test case prioritization (TCP) has been an effective strategy to optimize regression testing. Traditionally, test cases are ordered based on some heuristic and rerun against the version under test with the goal of yielding a high failure throughput. Almost four decades of TCP research has seen extensive contributions in the light of individual prioritization strategies. However, test case prioritization via preference aggregation has largely been unexplored. We envision this methodology as an opportunity to obtain robust prioritizations by consolidating multiple standalone ranked lists, i.e., performing a consensus. In this work, we propose Ensemble Test Prioritization (EnTP) as a three stage pipeline involving: (i) ensemble selection, (ii) rank aggregation, and (iii) test case execution. We evaluate EnTP on 20 open-source C projects from the Software-artifact Infrastructure Repository and GitHub (totaling: 694,512 SLOC, 280 versions, and 69,305 system level test-cases). We employ an ensemble of 16 standalone prioritization plans, four of which are imposed due to respective state-of-the-art approaches. We build EnTP on the foundations of Hansie, an existing framework on consensus prioritization and show that EnTP's diversity based ensemble selection budget of top-75% followed by rank aggregation can outperform Hansie, and the employed standalone prioritization approaches.
- Abstract(参考訳): テストケース優先順位付け(TCP)は回帰テストの最適化に有効な戦略である。
伝統的に、テストケースはいくつかのヒューリスティックに基づいて順序付けられ、テスト中のバージョンに対して再実行される。
TCP研究の約40年間は、個別の優先順位付け戦略に多大な貢献をしている。
しかし、選好集約によるテストケースの優先順位付けは、ほとんど未検討である。
我々は、この方法論を、複数のスタンドアローンのランクリスト、すなわちコンセンサスを実行することで、堅牢な優先順位付けを得る機会として想定する。
本研究では,Ensemble Test Prioritization (EnTP) を3段階のパイプラインとして提案する。
(i)合奏選曲、
(二)ランクアグリゲーション、及び
(iii) テストケースの実行。
我々は、Software-artifact Infrastructure RepositoryとGitHubの20のオープンソースプロジェクトでEnTPを評価した(トータリング:694,512 SLOC、280バージョン、69,305のシステムレベルのテストケース)。
我々は16の独立した優先順位付け計画のアンサンブルを採用しており、そのうち4つはそれぞれの最先端のアプローチによって課されている。
我々は,既存のコンセンサス優先フレームワークであるHansieの基礎の上にEnTPを構築し,EnTPの多様性に基づくアンサンブル選択予算を75%以上とし,それに続くランクアグリゲーションがHansieを上回り,採用されているスタンドアロンプライオリティ化アプローチを上回り得ることを示す。
関連論文リスト
- CoPS: Empowering LLM Agents with Provable Cross-Task Experience Sharing [70.25689961697523]
クロスタスク体験の共有と選択によるシーケンシャル推論を強化する一般化可能なアルゴリズムを提案する。
我々の研究は、既存のシーケンシャルな推論パラダイムのギャップを埋め、タスク間体験の活用の有効性を検証する。
論文 参考訳(メタデータ) (2024-10-22T03:59:53Z) - Segment-Based Test Case Prioritization: A Multi-objective Approach [8.972346309150199]
TCP(Test Case Prioritization)は、目的関数を最大化する実行順序でテストケースをスケジュールするコスト効率の高いソリューションである。
進化的検索アルゴリズムと4つのカバレッジ基準を用いてUIテストケースを優先する多目的最適化手法を提案する。
提案手法は,APFD(Average Percentage of Faults Detected)とAPFD(APFD with Cost)において,他の手法よりも優れている。
論文 参考訳(メタデータ) (2024-08-01T16:51:01Z) - UniTTA: Unified Benchmark and Versatile Framework Towards Realistic Test-Time Adaptation [66.05528698010697]
Test-Time Adaptationは、テスト中にトレーニング済みのモデルを対象のドメインに適応させることを目的としている。
研究者は様々な挑戦シナリオを特定し、これらの課題に対処するための様々な方法を開発した。
本稿では,包括的かつ広く適用可能な統一テスト時間適応ベンチマークを提案する。
論文 参考訳(メタデータ) (2024-07-29T15:04:53Z) - Feature-oriented Test Case Selection and Prioritization During the Evolution of Highly-Configurable Systems [1.5225153671736202]
機能指向テストケースの選択と優先順位付けアプローチであるFeaTestSelPrioを紹介した。
提案手法では,多数のテストを選択し,ベースラインとして使用される変更ファイル指向アプローチよりも実行に要する時間が長い。
優先順位付けのステップでは、失敗するコミットの86%で、平均的なテスト予算を削減できます。
論文 参考訳(メタデータ) (2024-06-21T16:39:10Z) - Towards Explainable Test Case Prioritisation with Learning-to-Rank Models [6.289767078502329]
テストケース優先順位付け(TCP)は、ソフトウェアが進化するにつれて品質を確保するために回帰テストにおいて重要なタスクである。
我々は、異なる説明を必要とするシナリオと、TCPの特異性がそれらにどのように影響するかを提示し、議論する。
論文 参考訳(メタデータ) (2024-05-22T16:11:45Z) - Constrained C-Test Generation via Mixed-Integer Programming [55.28927994487036]
本研究は,単語の最後の部分のみをギャップに変換する,クローズテスト(ギャップ充足運動)の形式であるC-テストを生成する新しい手法を提案する。
局所最適解を実現するために, ギャップサイズやギャップ配置の変化のみを考慮する従来の研究とは対照的に, 混合整数プログラミング(MIP)アプローチを提案する。
当社のコード、モデル、収集したデータは32の英語のC-Testで、それぞれ20のギャップ(3,200の個別のギャップ応答)をオープンソースライセンスで公開しています。
論文 参考訳(メタデータ) (2024-04-12T21:35:21Z) - Assisted Requirements Selection by Clustering [0.0]
ビジネス利益と投資のバランスが必要とされるため、多くの研究成果に焦点が当てられた複雑なマルチ基準決定プロセスである。
本研究は,要求選択のための定性的MoSCoW法とクラスタ分析の組み合わせについて検討する。
論文 参考訳(メタデータ) (2024-01-23T10:33:44Z) - On Pitfalls of Test-Time Adaptation [82.8392232222119]
TTA(Test-Time Adaptation)は、分散シフトの下で堅牢性に取り組むための有望なアプローチとして登場した。
TTABは,10の最先端アルゴリズム,多種多様な分散シフト,および2つの評価プロトコルを含むテスト時間適応ベンチマークである。
論文 参考訳(メタデータ) (2023-06-06T09:35:29Z) - RnG-KBQA: Generation Augmented Iterative Ranking for Knowledge Base
Question Answering [57.94658176442027]
KBQAのランク・アンド・ジェネレートアプローチであるRnG-KBQAを提案する。
我々はGrailQA と WebQSP データセット上で,最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2021-09-17T17:58:28Z) - Bayesian decision-making under misspecified priors with applications to
meta-learning [64.38020203019013]
トンプソンサンプリングやその他のシーケンシャルな意思決定アルゴリズムは、文脈的包帯における探索と探索のトレードオフに取り組むための一般的なアプローチである。
性能は不特定な事前条件で優雅に低下することを示す。
論文 参考訳(メタデータ) (2021-07-03T23:17:26Z) - Test case prioritization using test case diversification and
fault-proneness estimations [0.0]
本稿では,テストケースカバレッジデータ,バグ履歴,テストケースの多様化を考慮したTCPのアプローチを提案する。
クラスタリングに基づくアプローチスキームにフォールト・プレネネスを組み込むことにより,テストケースの多様化が維持される。
実験の結果,提案手法はカバレッジに基づくTCP方式よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-06-19T15:55:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。