論文の概要: ExplainFuzz: Explainable and Constraint-Conditioned Test Generation with Probabilistic Circuits
- arxiv url: http://arxiv.org/abs/2604.06559v1
- Date: Wed, 08 Apr 2026 01:20:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.284065
- Title: ExplainFuzz: Explainable and Constraint-Conditioned Test Generation with Probabilistic Circuits
- Title(参考訳): ExplainFuzz:確率回路を用いた説明可能・制約付きテスト生成
- Authors: Annaëlle Baiget, Jaron Maene, Seongmin Lee, Benjie Wang, Guy Van den Broeck, Miryung Kim,
- Abstract要約: 本稿では,確率回路(PC)を利用したテスト生成フレームワークであるExplainFuzzを紹介する。
その結果、ExplainFuzzは、生成した入力のコヒーレンスとリアリズムを改善し、pCFGや文法を意識しないPC、LLMと比べて大きなパープレキシティ低減を実現していることがわかった。
- 参考スコア(独自算出の注目度): 35.18215841558984
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding and explaining the structure of generated test inputs is essential for effective software testing and debugging. Existing approaches--including grammar-based fuzzers, probabilistic Context-Free Grammars (pCFGs), and Large Language Models (LLMs)--suffer from critical limitations. They frequently produce ill-formed inputs that fail to reflect realistic data distributions, struggle to capture context-sensitive probabilistic dependencies, and lack explainability. We introduce ExplainFuzz, a test generation framework that leverages Probabilistic Circuits (PCs) to learn and query structured distributions over grammar-based test inputs interpretably and controllably. Starting from a Context-Free Grammar (CFG), ExplainFuzz compiles a grammar-aware PC and trains it on existing inputs. New inputs are then generated via sampling. ExplainFuzz utilizes the conditioning capability of PCs to incorporate test-specific constraints (e.g., a query must have GROUP BY), enabling constrained probabilistic sampling to generate inputs satisfying grammar and user-provided constraints. Our results show that ExplainFuzz improves the coherence and realism of generated inputs, achieving significant perplexity reduction compared to pCFGs, grammar-unaware PCs, and LLMs. By leveraging its native conditioning capability, ExplainFuzz significantly enhances the diversity of inputs that satisfy a user-provided constraint. Compared to grammar-aware mutational fuzzing, ExplainFuzz increases bug-triggering rates from 35% to 63% in SQL and from 10% to 100% in XML. These results demonstrate the power of a learned input distribution over mutational fuzzing, which is often limited to exploring the local neighborhood of seed inputs. These capabilities highlight the potential of PCs to serve as a foundation for grammar-aware, controllable test generation that captures context-sensitive, probabilistic dependencies.
- Abstract(参考訳): 生成されたテストインプットの構造を理解し、説明することは、効果的なソフトウェアテストとデバッグに不可欠である。
既存のアプローチ - 文法ベースのファジィザ、確率論的文脈自由文法(pCFG)、Large Language Models(LLM)など - は、臨界的な制限から救われる。
彼らはしばしば、現実的なデータ分布を反映できず、コンテキストに敏感な確率的依存関係を捉えようと苦労し、説明不可能な不整形入力を生成する。
本稿では,確率回路(PC)を利用したテスト生成フレームワークであるExplainFuzzを紹介する。
Context-Free Grammar (CFG) から始まり、ExplainFuzzは文法を意識したPCをコンパイルし、既存の入力でそれを訓練する。
新しい入力はサンプリングによって生成される。
ExplainFuzzは、PCの条件付け機能を利用して、テスト固有の制約(例えば、クエリはGROUP BYを持つ必要がある)を導入し、制約付き確率的サンプリングを可能にし、文法とユーザが提供する制約を満たす入力を生成する。
その結果, ExplainFuzzは, pCFG, 文法を意識しないPC, LLMに比べて, 入力のコヒーレンスとリアリズムを向上し, パープレキシティの大幅な低減を実現していることがわかった。
ネイティブ条件付け機能を活用することで、ExplainFuzzは、ユーザが提供する制約を満たす入力の多様性を大幅に向上する。
文法を意識した突然変異ファズリングと比較して、ExplainFuzzは、バグトリガ率をSQLで35%から63%、XMLで10%から100%に向上させる。
これらの結果は、しばしばシード入力の局所的な近傍を探索することに制限される突然変異ファジィングに対する学習された入力分布のパワーを示す。
これらの機能は、文脈に敏感で確率的な依存関係をキャプチャする文法を意識した制御可能なテスト生成の基礎として機能するPCの可能性を強調している。
関連論文リスト
- Scaling Agentic Verifier for Competitive Coding [66.11758166379092]
大規模言語モデル(LLM)は強力なコーディング能力を示しているが、1回の試行で競合するプログラミング問題を正しく解くのに苦戦している。
実行ベースの再ランク付けは、有望なテスト時間スケーリング戦略を提供するが、既存のメソッドは、難しいテストケースの生成または非効率的なランダム入力サンプリングによって制約される。
本稿では,プログラムの動作を積極的に推論し,高い差別性のあるテスト入力を検索するエージェント検証手法を提案する。
論文 参考訳(メタデータ) (2026-02-04T06:30:40Z) - You only need 4 extra tokens: Synergistic Test-time Adaptation for LLMs [50.54173262572369]
大規模言語モデル (LLM) は、金融、医療、農業などの専門分野にますます導入されている。
本稿では,言語モデルに対するラベルフリーテスト時適応について検討し,追加の監督なしにモデルをオンザフライで適応する推論時フレームワークであるSyTTAについて述べる。
論文 参考訳(メタデータ) (2025-10-11T14:00:39Z) - Generating Highly Structured Test Inputs Leveraging Constraint-Guided Graph Refinement [4.121384394709256]
本研究では,グラフベース表現を用いて,構造化ドメインに対するテスト入力を統一できるかどうかを検討する。
我々は,8つのAIシステムにおける入力妥当性とセマンティックな保存性を高めるために,このアプローチの有効性を評価する。
論文 参考訳(メタデータ) (2025-07-28T18:54:04Z) - Log Probabilities Are a Reliable Estimate of Semantic Plausibility in Base and Instruction-Tuned Language Models [50.15455336684986]
意味的妥当性を評価するため,LogProbsの有効性と基本的なプロンプトを評価した。
LogProbsは、直接ゼロショットプロンプトよりも、より信頼性の高いセマンティックな妥当性を提供する。
我々は,プロンプトベースの評価の時代においても,LogProbsは意味的妥当性の有用な指標である,と結論付けた。
論文 参考訳(メタデータ) (2024-03-21T22:08:44Z) - Grammar-Constrained Decoding for Structured NLP Tasks without Finetuning [27.59524153097858]
文法制約付き復号法(GCD)は、大言語モデル(LM)の生成を制御するために用いられる。
GCDは一般に構造化NLPタスクの統一フレームワークとして機能する。
文法制約付きLMは、制約なしLMよりも大幅に優れるか、タスク固有の微調整モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-23T11:54:37Z) - BLISS: Robust Sequence-to-Sequence Learning via Self-Supervised Input
Representation [92.75908003533736]
本稿では,自己教師型入力表現を用いたフレームワークレベルの頑健なシーケンス・ツー・シーケンス学習手法BLISSを提案する。
我々は,機械翻訳,文法的誤り訂正,テキスト要約など,BLISSの様々なタスクにおける有効性を検証するための総合的な実験を行った。
論文 参考訳(メタデータ) (2022-04-16T16:19:47Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。