論文の概要: Adaptive Test Generation with Qgrams
- arxiv url: http://arxiv.org/abs/2410.17907v1
- Date: Wed, 23 Oct 2024 14:26:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-24 13:56:44.680391
- Title: Adaptive Test Generation with Qgrams
- Title(参考訳): Qgramを用いた適応テスト生成
- Authors: Matteo Biagiola, Robert Feldt, Paolo Tonella,
- Abstract要約: 我々は、ペアワイズ距離計算を過去の実行のコンパクトアグリゲーションに置き換える、適応的ランダムテストのための新しいフレームワークを提案する。
Qgrams を用いた ART では,平均でランダムテストの 4 倍,従来の距離ベース手法による ART の 3.5 倍の目標がカバーされている。
- 参考スコア(独自算出の注目度): 13.166002843307663
- License:
- Abstract: Adaptive Random Testing (ART) has faced criticism, particularly for its computational inefficiency, as highlighted by Arcuri and Briand. Their analysis clarified how ART requires a quadratic number of distance computations as the number of test executions increases, which limits its scalability in scenarios requiring extensive testing to uncover faults. Simulation results support this, showing that the computational overhead of these distance calculations often outweighs ART's benefits. While various ART variants have attempted to reduce these costs, they frequently do so at the expense of fault detection, lack complexity guarantees, or are restricted to specific input types, such as numerical or discrete data. In this paper, we introduce a novel framework for adaptive random testing that replaces pairwise distance computations with a compact aggregation of past executions, such as counting the Qgrams observed in previous runs. Test case selection then leverages this aggregated data to measure diversity (e.g., entropy of Qgrams), allowing us to reduce the computational complexity from quadratic to linear. Experiments with a benchmark of six web applications, show that ART with Qgrams covers, on average, 4x more unique targets than random testing, and 3.5x more than ART using traditional distance-based methods.
- Abstract(参考訳): アダプティブランダムテスト(ART)は、特にArcuriとBriandが強調した、計算の非効率性に対する批判に直面している。
彼らの分析は、ARTがテスト実行の数が増えるにつれて、二次的な距離計算を必要とすることを明確にし、障害を明らかにするために広範囲なテストを必要とするシナリオのスケーラビリティを制限した。
シミュレーションの結果、これらの距離計算の計算オーバーヘッドがARTの利点を上回ることが示されている。
ARTの様々な変種はこれらのコストを削減しようと試みているが、障害検出や複雑性保証の欠如、数値データや離散データなどの特定の入力タイプに制限されることがしばしばある。
本稿では,前回の実行で観測されたQgramをカウントするなどの,過去の実行をコンパクトに集約したペアワイズ距離計算に置き換える,適応的ランダムテストのための新しいフレームワークを提案する。
テストケースの選択は、この集計データを利用して多様性(例えば、Qgramのエントロピー)を測定し、計算の複雑さを2次から線形に減らす。
6つのWebアプリケーションのベンチマークによる実験によると、Qgramを使ったARTは、ランダムテストの4倍、従来の距離ベース手法によるARTの3.5倍のターゲットをカバーしている。
関連論文リスト
- Learning to Stop Overthinking at Test Time [1.0356759327536202]
テスト時間のスケーリングは、トレーニング時間のスケーリングが限界に達した後に約束される、最も活発な研究領域の1つです。
テスト時間における各サンプルに必要な最適な計算量を決定するためのテスト時間トレーニング手法を提案する。
また,より効率的かつ堅牢な視覚推論のための新しい繰り返しアーキテクチャであるConv-LiGRUを提案する。
論文 参考訳(メタデータ) (2025-02-16T02:17:05Z) - Simple and Provable Scaling Laws for the Test-Time Compute of Large Language Models [70.07661254213181]
大規模言語モデルのテスト時間計算のための2つの原理的アルゴリズムを提案する。
理論的には、1つのアルゴリズムの故障確率は、そのテスト時間計算が大きくなるにつれて指数関数的に減衰する。
論文 参考訳(メタデータ) (2024-11-29T05:29:47Z) - Batch Bayesian Optimization for Replicable Experimental Design [56.64902148159355]
多くの実世界の設計問題は、大規模で異質な観測ノイズのため、複数の実験条件を並列に評価し、各条件を複数回再現する。
本稿では,3つのアルゴリズムを含むReplicable Experimental Designフレームワークのバッチトンプソンサンプリングを提案する。
我々は,アルゴリズムの有効性を,精密農業とAutoMLの2つの実世界の応用例で示す。
論文 参考訳(メタデータ) (2023-11-02T12:46:03Z) - Precise Error Rates for Computationally Efficient Testing [75.63895690909241]
本稿では,計算複雑性に着目した単純な対数-単純仮説テストの問題を再考する。
線形スペクトル統計に基づく既存の試験は、I型とII型の誤差率の間の最良のトレードオフ曲線を達成する。
論文 参考訳(メタデータ) (2023-11-01T04:41:16Z) - Toward Cost-effective Adaptive Random Testing: An Approximate Nearest Neighbor Approach [6.431858417308008]
Adaptive Random Testing (ART)は、ランダムテスト(RT)のテスト効率(障害検出機能を含む)を高める
多くのARTアルゴリズムが研究されており、FSCS(Fixed-Size-Candidate-Set ART)やRRT(Restricted Random Testing)などがある。
論文 参考訳(メタデータ) (2023-05-27T15:37:13Z) - Comparative Study of Coupling and Autoregressive Flows through Robust
Statistical Tests [0.0]
本稿では,アフィン型と有理2次型の両方において,カップリングと自己回帰流の詳細な比較を提案する。
本研究は,4~400の次元を増大させるマルチモーダルターゲット分布の集合に着目した。
以上の結果から,A-RQSアルゴリズムは精度とトレーニング速度の両面で際立っていることが示唆された。
論文 参考訳(メタデータ) (2023-02-23T13:34:01Z) - Sequential Kernelized Independence Testing [101.22966794822084]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - AdAUC: End-to-end Adversarial AUC Optimization Against Long-tail
Problems [102.95119281306893]
我々は、AUCを最適化するための敵の訓練方法を探求するための早期トライアルを提示する。
我々は、AUC最適化問題をサドル点問題として再構成し、目的がインスタンスワイズ関数となる。
我々の分析は, min-max問題の勾配を計算して, 逆例を生成するアルゴリズムが求められているため, 既存の研究と異なる。
論文 参考訳(メタデータ) (2022-06-24T09:13:39Z) - GRACE-C: Generalized Rate Agnostic Causal Estimation via Constraints [3.2374399328078285]
時系列データから因果学習アルゴリズムによって推定される図形構造は、生成プロセスの因果時間スケールがデータの測定時間スケールと一致しない場合、誤解を招く因果情報を提供することができる。
既存のアルゴリズムは、この課題に対応するための限られたリソースを提供するため、研究者は彼らが知っているモデルを使うか、あるいは完全に因果学習を行う必要がある。
既存の方法は、(1)因果差と測定値の違いが知られていること、(2)時間スケールの違いが不明な場合にのみ非常に少数のランダム変数を扱うこと、(3)変数のペアにのみ適用されること、4)変数のペアにしか適用できないこと、など、四つの異なる欠点に直面している。
論文 参考訳(メタデータ) (2022-05-18T22:38:57Z) - Error Estimation for Sketched SVD via the Bootstrap [60.67199274260768]
本稿では,スケッチ化された特異ベクトル/値の実際の誤差を数値的に推定する完全データ駆動型ブートストラップ法を開発した。
この方法は、スケッチされたオブジェクトのみで動作するため、計算コストが安い。
論文 参考訳(メタデータ) (2020-03-10T19:14:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。