論文の概要: Method-level Change-proneness: A Better Metric for Black-box Test Suite Minimization
- arxiv url: http://arxiv.org/abs/2605.15232v1
- Date: Wed, 13 May 2026 18:13:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.020162
- Title: Method-level Change-proneness: A Better Metric for Black-box Test Suite Minimization
- Title(参考訳): 方法レベルの変更傾向:ブラックボックステストスイートの最小化のためのより良い基準
- Authors: Md Siam, Kazi Sakib,
- Abstract要約: テストスイート最小化(TSM)は、テストスイートのサイズを削減し、障害検出機能を保持する。
我々は,より粒度の高いメソッドレベルのCPを提案し,MCTM(Message-level Change-proneness based Test-suite Minimization)を実装した。
MCTMは平均で0.93の精度と0.94の故障検出率を達成し、クラスレベルのCPと類似性に基づくアプローチを著しく上回っている。
- 参考スコア(独自算出の注目度): 0.651722296019499
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Test Suite Minimization (TSM) reduces the size of test suites while preserving their fault detection capability. In black-box TSM, reduction is performed without analyzing production code. While several black-box TSM approaches have explored metrics like test logs or test similarity, those often suffer from scalability and efficiency issues. On the other hand, change-proneness (CP), recently emerged as an efficient and scalable alternative metric, has only been applied at class level. To accurately identify fault-revealing test cases, we propose CP at finer-grained method-level and implement Method-level Change-proneness based Test-suite Minimization (MCTM). MCTM first calculates CP for each method from version control metadata, then determines the dependency between test cases and methods by analyzing the test-code call-graph. Next, it scores the association between test cases and their invoked methods using statistical measures such as Average, Geometric Mean etc. Finally, test cases with the highest scores are selected to form the reduced suite. Evaluation on 15 open-source Java projects with 635 buggy versions shows MCTM achieves 0.93 accuracy and 0.94 fault detection rate on average, significantly outperforming class-level CP and similarity-based approaches while maintaining superior efficiency.
- Abstract(参考訳): テストスイート最小化(TSM)は、テストスイートのサイズを削減し、障害検出機能を保持する。
ブラックボックスTSMでは、生産コードを分析することなく削減を行う。
いくつかのブラックボックスのTSMアプローチでは、テストログやテストの類似性といったメトリクスを探索しているが、スケーラビリティや効率上の問題に悩まされることが多い。
一方、最近、効率的でスケーラブルな代替指標として登場した変更傾向(CP)は、クラスレベルでのみ適用されている。
欠陥検出テストケースを正確に識別するために,より粒度の細かいメソッドレベルでCPを提案し,MCTM(Message-level Change-proneness based Test-suite Minimization)を実装した。
MCTMはまずバージョン管理メタデータから各メソッドのCPを計算し、テストコードコールグラフを解析してテストケースとメソッド間の依存性を決定する。
次に, 平均値, 幾何平均などの統計指標を用いて, テストケースと実施手法の関連性を評価する。
最後に、最も高いスコアを持つテストケースを選択して、縮小スイートを形成する。
635のバグのあるバージョンを持つ15のオープンソースプロジェクトに対する評価では、MCTMは平均で0.93の精度と0.94の障害検出率を実現し、優れた効率を維持しながら、クラスレベルのCPと類似性に基づくアプローチを著しく上回っている。
関連論文リスト
- Prototype-Based Test-Time Adaptation of Vision-Language Models [58.28899599773308]
PTA(Prototype-based Test-Time Adaptation)
PTAは一連のクラス固有の知識プロトタイプを使用して、テストサンプルから知識を蓄積する。
PTAは最先端の性能を達成しつつ、極めて高い効率を達成する。
論文 参考訳(メタデータ) (2026-04-23T07:20:56Z) - Beyond Raw Detection Scores: Markov-Informed Calibration for Boosting Machine-Generated Text Detection [105.14032334647932]
機械生成テキスト(MGT)は偽情報やフィッシングなどのリスクを生じさせ、信頼性の高い検出の必要性を強調している。
MGTの統計的に区別可能な特徴を抽出するメトリックベース法は、オーバーフィットしがちな複雑なモデルベース法よりも実用的であることが多い。
本稿では,2つのコンテキスト検出スコアの関係をモデル化したマルコフ情報を用いたスコアキャリブレーション手法を提案する。
論文 参考訳(メタデータ) (2026-02-08T16:06:12Z) - Scalable Similarity-Aware Test Suite Minimization with Reinforcement Learning [6.9290255098776425]
TripRLは、多種多様なテストスイートを高いテスト効率で生成する新しい技術である。
本稿では,TripRLのランタイムは,Multi-Criteria Test Suite Minimization問題の規模と線形にスケール可能であることを示す。
論文 参考訳(メタデータ) (2024-08-24T08:43:03Z) - STAMP: Outlier-Aware Test-Time Adaptation with Stable Memory Replay [76.06127233986663]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の分散シフトに、未ラベルのデータのみを用いて対処することを目的としている。
本稿では,サンプル認識とオフリエ拒絶の両方を行う問題に注意を払っている。
本稿では,STAble Memory rePlay (STAMP) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-22T16:25:41Z) - Active Test-Time Adaptation: Theoretical Analyses and An Algorithm [51.84691955495693]
テスト時間適応(TTA)は、教師なし設定でストリーミングテストデータの分散シフトに対処する。
完全TTA設定内に能動学習を統合する能動テスト時間適応(ATTA)の新たな問題設定を提案する。
論文 参考訳(メタデータ) (2024-04-07T22:31:34Z) - LTM: Scalable and Black-box Similarity-based Test Suite Minimization based on Language Models [0.6562256987706128]
テストスイートはソフトウェアが進化するにつれて成長する傾向にあり、割り当てられたテスト予算ですべてのテストケースを実行することができないことが多い。
テストスイートの最小化(TSM)は、冗長なテストケースを削除することで、ソフトウェアテストの効率を改善するために使用される。
LTM(Language model-based Test suite Minimization)を提案する。
論文 参考訳(メタデータ) (2023-04-03T22:16:52Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。