論文の概要: FuzzPilot: Plateau-Triggered Recipe Validation for Structured Text Fuzzing
- arxiv url: http://arxiv.org/abs/2605.26539v1
- Date: Mon, 25 May 2026 11:24:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.66948
- Title: FuzzPilot: Plateau-Triggered Recipe Validation for Structured Text Fuzzing
- Title(参考訳): FuzzPilot:構造化テキストファズリングのためのプラトートリガードレシピバリデーション
- Authors: Zhiyi Yao,
- Abstract要約: FuzzPilotはAFL++用のコントローラで、突然変異ホットパスから高価な推論を移動させる。
カバープラトーは、コーパスをスナップショット化し、突然変異のレシピを作成し、評価し、肯定的なバリデーションの報酬を持つレシピのみを促進する。
- 参考スコア(独自算出の注目度): 0.7735495716720356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: FuzzPilot is a controller for AFL++ that moves expensive reasoning out of the mutation hot path. When coverage plateaus, it snapshots the corpus, prepares candidate mutation recipes, evaluates them in short isolated AFL++ micro-campaigns, and promotes only recipes with positive validation reward. Recipes are JSON data, not generated code: a native custom mutator consumes operator weights, byte ranges, corpus-selection rules, and dictionary tokens. Candidate recipes can come from local rules or from a language-model agent, with Ghidra-derived constants and decompiled context as target hints. This preprint reports a deliberately narrow cJSON evaluation. We compare vanilla AFL++ and the full FuzzPilot agent over five 14,400 s repetitions per arm. cJSON is saturated: baseline AFL++ reaches the exposed 269-edge ceiling at a median of about 2,500 s. The experiments therefore do not show that language-model proposals improve coverage or generalize beyond cJSON. Within this scope, FuzzPilot preserves throughput (median execs_per_sec about 1.06x baseline), shows a descriptively shorter median plateau (1,384 s versus 2,532 s), but the difference is not statistically significant at N=5 (Mann-Whitney p=0.42). The validation gate evaluated 20 model-proposed recipes and promoted none because all rewards were zero. The observed plateau reduction is more likely due to controller snapshot and restart machinery than to the model or recipe mutator. This version is best read as an auditable implementation report and baseline for ongoing non-saturated-target evaluation.
- Abstract(参考訳): FuzzPilotはAFL++用のコントローラで、突然変異ホットパスから高価な推論を移動させる。
カバープラトーが撮影されると、コーパスをスナップショットし、候補突然変異のレシピを作成し、短い孤立したAFL++マイクロキャンプで評価し、肯定的なバリデーションの報酬でレシピのみを促進する。
ネイティブのカスタムミュータは演算子重み、バイト範囲、コーパス選択ルール、辞書トークンを消費する。
候補のレシピは、ローカルルールや言語モデルエージェントから、Ghidraから派生した定数と、ターゲットのヒントとして逆コンパイルされたコンテキストを持つことができる。
このプリプリントは、意図的に狭いcJSON評価を報告します。
我々は、バニラAFL++とフルのFuzzPilotエージェントを、1アームあたり14,400秒の繰り返しで比較する。
cJSONは飽和しており、ベースラインのAFL++は露出した269縁の天井に約2,500秒で到達する。
したがって、実験では言語モデルの提案がcJSONを超えてカバレッジを改善したり一般化したりはしない。
この範囲内では、FuzzPilotはスループットを保ち (median execs_per_sec about 1.06x baseline) 、記述的に短い中央値 (1,384 s 対 2,532 s) を示すが、N=5 (Mann-Whitney p=0.42) では統計的に有意ではない。
検証ゲートは20種類のレシピを評価した。
観測された高原の減少は、モデルやレシピミュータよりも、コントローラのスナップショットと再起動機構による可能性が高い。
このバージョンは、監査可能な実装レポートと、進行中の非飽和ターゲット評価のベースラインとして、最もよく読まれている。
関連論文リスト
- Future Validity is the Missing Statistic: From Impossibility to $Φ$-Estimation for Grammar-Faithful Speculative Decoding [21.074583041375888]
文法制約付き生成は、しばしば局所的な語彙マスキングと投機的復号化と組み合わせられる。
局所マスクアクセスを持つ投機的デコーダ,レバイアサン拒絶,および局所予測分布$mathrmproj$からのロールバック音質サンプルは,文法条件分布$star$ではなく,いずれかを示す。
論文 参考訳(メタデータ) (2026-05-08T13:08:18Z) - PHBench: A Benchmark for Predicting Startup Series A Funding from Product Hunt Launch Signals [0.0]
Product Huntの構造化されたローンチシグナルには、シリーズAの資金調達結果に関する統計的に重要な予測情報が含まれている。
2019年から2025年までの67,292件のProduct Hunt記事からPHBenchを構築し、決定論的ドメインマッチングを通じてCrunchbaseの資金調達記録と関連づけた。
打ち上げから18ヶ月以内に確認されたシリーズAは528件(陽性率は0.78%)。
論文 参考訳(メタデータ) (2026-05-03T17:03:33Z) - When Career Data Runs Out: Structured Feature Engineering and Signal Limits for Founder Success Prediction [0.0]
ファウンダーのキャリアデータからスタートアップの成功を予測することは難しい。
私たちは、生のフィールド(仕事、教育、出口)から直接構造化された28の機能を設計し、決定論的ルールレイヤとXGの強化された切り株を組み合わせました。
我々のモデルは、ゼロショットLCMベースラインに対するVal F0.5 = 0.3030, Precision = 0.3333, Recall = 0.2222 -- +17.7ppの改善を達成する。
論文 参考訳(メタデータ) (2026-04-01T00:28:53Z) - Do Large Language Models Get Caught in Hofstadter-Mobius Loops? [0.0]
本稿では、現代のRLHF学習言語モデルが構造的に類似した矛盾の対象となっていることを論じる。
トレーニングプロセスは、ユーザの嗜好の遵守とユーザの意図に対する疑念を同時に報いる。
結果として生じる行動プロファイルは、クラークがHofstadter-Mobiusループと呼んだものと一致している。
論文 参考訳(メタデータ) (2026-03-10T20:43:37Z) - Moirai 2.0: When Less Is More for Time Series Forecasting [91.36760228926214]
Moirai 2.0は、36Mシリーズの新しいコーパスで訓練されたデコーダのみの基礎モデルである。
これは、精度、速度、モデルサイズの間の強いトレードオフを達成しつつ、事前訓練された上位モデルの1つにランク付けします。
効率性とモデルサイズに関しては、Moirai 2.0は前バージョンであるMoirai 1.0-Largeの2倍の速度と30倍の小型である。
論文 参考訳(メタデータ) (2025-11-12T12:15:35Z) - Leveraging Large Language Models for Predictive Analysis of Human Misery [1.2458057399345226]
本研究では,Large Language Models (LLMs) を用いて,人間に知覚された悲惨なスコアを予測する。
我々は、ゼロショット、固定コンテキスト、検索に基づくプロンプトを含む複数のプロンプト戦略を評価する。
静的評価を超えて,テレビフォーマットに触発された新たなゲーム化フレームワークである"Misery Game Show"を導入する。
論文 参考訳(メタデータ) (2025-08-18T07:02:59Z) - Model Equality Testing: Which Model Is This API Serving? [59.005869726179455]
APIプロバイダは、基本モデルの定量化、透かし、微調整を行い、出力分布を変更することができる。
モデル平等テスト(Model Equality Testing)は,2サンプルテスト問題である。
単純な文字列カーネル上に構築されたテストは、歪みの範囲に対して77.4%の中央値を達成する。
論文 参考訳(メタデータ) (2024-10-26T18:34:53Z) - Confidence-Based Model Selection: When to Take Shortcuts for
Subpopulation Shifts [119.22672589020394]
モデル信頼度がモデル選択を効果的に導くことができるConfidence-based Model Selection (CosMoS)を提案する。
我々はCosMoSを,データ分散シフトのレベルが異なる複数のテストセットを持つ4つのデータセットで評価した。
論文 参考訳(メタデータ) (2023-06-19T18:48:15Z) - Knockoffs-SPR: Clean Sample Selection in Learning with Noisy Labels [56.81761908354718]
雑音ラベルを用いた学習のための,理論的に保証されたクリーンサンプル選択フレームワークを提案する。
Knockoffs-SPRは、標準的な教師付きトレーニングパイプラインのサンプル選択モジュールと見なすことができる。
さらに、ラベルなしデータとしてノイズデータのサポートを利用する半教師付きアルゴリズムと組み合わせる。
論文 参考訳(メタデータ) (2023-01-02T07:13:28Z) - Enhancing Self-Consistency and Performance of Pre-Trained Language
Models through Natural Language Inference [72.61732440246954]
大規模な事前訓練された言語モデルは、テスト入力間の論理的一貫性を欠いていることが多い。
本研究では,事前学習したNLPモデルの一貫性と精度を高めるためのフレームワークであるConCoRDを提案する。
ConCoRDは、市販のクローズドブックQAおよびVQAモデルの精度と一貫性を一貫して向上することを示す。
論文 参考訳(メタデータ) (2022-11-21T21:58:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。