論文の概要: Validity-Preserving Delta Debugging via Generator
- arxiv url: http://arxiv.org/abs/2402.04623v1
- Date: Wed, 7 Feb 2024 07:12:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-08 16:28:50.205900
- Title: Validity-Preserving Delta Debugging via Generator
- Title(参考訳): ジェネレータによる妥当性保存デルタデバッギング
- Authors: Luyao Ren, Xing Zhang, Ziyue Hua, Yanyan Jiang, Xiao He, Tao Xie
- Abstract要約: 本稿では,ジェネレータを用いたデルタデバッギング手法であるGReduceを提案する。
GReduceは、削減された有効なテスト入力を出力するジェネレータ上の他の実行を検索する。
GReduceの結果は28.5%、34.6%、75.6%、GReduceは17.5%、0.6%、65.4%である。
- 参考スコア(独自算出の注目度): 11.272261539536842
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Reducing test inputs that trigger bugs is crucial for efficient debugging.
Delta debugging is the most popular approach for this purpose. When test inputs
need to conform to certain specifications, existing delta debugging practice
encounters a validity problem: it blindly applies reduction rules, producing a
large number of invalid test inputs that do not satisfy the required
specifications. This overall diminishing effectiveness and efficiency becomes
even more pronounced when the specifications extend beyond syntactical
structures. Our key insight is that we should leverage input generators, which
are aware of these specifications, to generate valid reduced inputs, rather
than straightforwardly performing reduction on test inputs. In this paper, we
propose a generator-based delta debugging method, namely GReduce, which derives
validity-preserving reducers. Specifically, given a generator and its
execution, demonstrating how the bug-inducing test input is generated, GReduce
searches for other executions on the generator that yield reduced, valid test
inputs. To evaluate the effectiveness, efficiency, and versatility of GReduce,
we apply GReduce and the state-of-the-art reducer Perses in three domains:
graphs, deep learning models, and JavaScript programs. The results of GReduce
are 28.5%, 34.6%, 75.6% in size of those from Perses, and GReduce takes 17.5%,
0.6%, 65.4% time taken by Perses.
- Abstract(参考訳): 効率的なデバッグには、バグを引き起こすテストインプットの削減が不可欠だ。
デルタデバッギングはこの目的のために最も一般的なアプローチである。
テスト入力が特定の仕様に準拠する必要がある場合、既存のdeltaデバッギングプラクティスは有効性の問題に遭遇する。
この全体的な効果と効率の低下は、仕様が構文構造を超えて拡張されるとさらに顕著になる。
私たちの重要な洞察は、これらの仕様に気付いている入力ジェネレータを活用して、テスト入力の直接的な削減を行うのではなく、有効な削減入力を生成するべきだということです。
本稿では,有効性保存型リデューサを導出するジェネレータ型デルタデバッグ手法であるgreduceを提案する。
具体的には、ジェネレータとその実行が、バグ誘発テストインプットの生成方法を示すものであることを条件として、GReduceは、削減された有効なテストインプットを出力するジェネレータ上の他の実行を検索する。
GReduceの有効性,効率,汎用性を評価するため,グラフ,ディープラーニングモデル,JavaScriptプログラムの3つの領域にGReduceと最先端のReduce Persesを適用した。
GReduceの結果は28.5%、34.6%、75.6%、GReduceは17.5%、0.6%、65.4%である。
関連論文リスト
- Rethinking PGD Attack: Is Sign Function Necessary? [141.28247334931424]
本稿では,このような手話に基づく更新アルゴリズムが段階的攻撃性能にどのように影響するかを理論的に分析する。
本稿では,手話の使用を排除したRGDアルゴリズムを提案する。
提案したRGDアルゴリズムの有効性は実験で広く実証されている。
論文 参考訳(メタデータ) (2023-12-03T02:26:58Z) - Clover: Closed-Loop Verifiable Code Generation [2.771446134416298]
整合性チェックのよりアクセスしやすい問題に対する正当性チェックを削減できるCloverパラダイムを提案する。
Cloverの中核には、コード、ドキュストリング、フォーマルアノテーション間の一貫性チェックを実行するチェッカーがある。
注釈付きDafnyプログラムを教科書の難易度で記述した手書きデータセットの有効性を実証的に検討した。
論文 参考訳(メタデータ) (2023-10-26T22:58:19Z) - Applying and Extending the Delta Debugging Algorithm for Elevator
Dispatching Algorithms (Experience Paper) [7.289672463326423]
エレベータディスパッチアルゴリズムでは、ソフトウェア開発者に最小限のテスト入力を提供するのが利点である。
本稿では,まずCPSが動作する環境と物理状態をモニタリングすることにより,この手法を強化する。
2番目のステップでは、このような安定した状態を用いて、デルタデバッグアルゴリズムがより効率的に障害発生テストインプットを分離するのを助ける。
論文 参考訳(メタデータ) (2023-05-28T19:27:24Z) - Towards More Realistic Evaluation for Neural Test Oracle Generation [11.005450298374285]
単体テストはソフトウェアの品質を守り、改善するのに役立ちますが、作成とメンテナンスにはかなりの時間と労力が必要です。
最近の研究では、ニューラルモデルを利用してテストオラクル、すなわちニューラルテストオラクル生成(NTOG)を生成することが提案されている。
これらの設定は、既存のNTOGアプローチのパフォーマンスの理解を誤解させる可能性がある。
論文 参考訳(メタデータ) (2023-05-26T15:56:57Z) - Teaching Large Language Models to Self-Debug [62.424077000154945]
大規模言語モデル(LLM)は、コード生成において素晴らしいパフォーマンスを達成した。
本稿では,大規模言語モデルで予測プログラムを数発のデモでデバッグする自己デバッグを提案する。
論文 参考訳(メタデータ) (2023-04-11T10:43:43Z) - Gradient-Free Structured Pruning with Unlabeled Data [57.999191898036706]
ラベルのないデータのみを使用する勾配のない構造化プルーニングフレームワークを提案する。
元々のFLOPカウントの最大40%は、考慮されたすべてのタスクで4%未満の精度で削減できる。
論文 参考訳(メタデータ) (2023-03-07T19:12:31Z) - Fast Test Input Generation for Finding Deviated Behaviors in Compressed
Deep Neural Network [18.205951607889556]
本稿では,TriggerFinder を用いて,圧縮モデルにおける不規則な動作をトリガーする入力を自動的に識別する手法を提案する。
2つのデータセットを持つ18の圧縮モデル上でTriggerFinderを評価する。
論文 参考訳(メタデータ) (2021-12-06T07:12:49Z) - Print Error Detection using Convolutional Neural Networks [0.0]
印刷誤りサンプルを人工的に生成する方法を提案する。
最終訓練されたネットワークは99.83%の精度でテストが完了しました。
論文 参考訳(メタデータ) (2021-04-11T16:30:17Z) - PRover: Proof Generation for Interpretable Reasoning over Rules [81.40404921232192]
本稿では,ルールベース上の二項質問に応答し,対応する証明を生成するトランスフォーマーモデルを提案する。
本モデルは,効率的な制約付き学習パラダイムを用いて,証明グラフに対応するノードやエッジを予測できることを学習する。
我々は、QAと証明生成のための有望な結果を示すために、合成、手書き、人文による規則ベースの実験を行う。
論文 参考訳(メタデータ) (2020-10-06T15:47:53Z) - AQD: Towards Accurate Fully-Quantized Object Detection [94.06347866374927]
本稿では,浮動小数点演算を除去するために,AQDと呼ばれる高精度な量子化オブジェクト検出ソリューションを提案する。
我々のAQDは、非常に低ビットのスキームの下での完全精度と比較して、同等またはそれ以上の性能を実現しています。
論文 参考訳(メタデータ) (2020-07-14T09:07:29Z) - ScoreGAN: A Fraud Review Detector based on Multi Task Learning of
Regulated GAN with Data Augmentation [50.779498955162644]
生成・検出プロセスにおけるレビューテキストとレビューレーティングスコアの両方を利用した不正レビュー検出のためのScoreGANを提案する。
その結果,提案フレームワークは,既存の最先端フレームワークであるFakeGANをAPの7%,YelpとTripAdvisorのデータセットで5%上回る性能を示した。
論文 参考訳(メタデータ) (2020-06-11T16:15:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。