論文の概要: Fuzzing with Agents? Generators Are All You Need
- arxiv url: http://arxiv.org/abs/2604.01442v1
- Date: Wed, 01 Apr 2026 22:28:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.086063
- Title: Fuzzing with Agents? Generators Are All You Need
- Title(参考訳): エージェントでファジィする? 発電機は必要なものすべて
- Authors: Vasudev Vikram, Rohan Padhye,
- Abstract要約: 我々は、AI符号化エージェントがターゲット固有のジェネレータを自動で合成できるかどうかを検討する。
我々は,実世界の7つのJavaライブラリのファジターゲット上の人書きジェネレータに対して,Gentooの3つの構成を評価する。
- 参考スコア(独自算出の注目度): 1.743178097265341
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Modern generator-based fuzzing techniques combine lightweight input generators with coverage-guided mutation as a method of exploring deep execution paths in a target program. A complimentary approach in prior research focuses on creating highly customized, domain-specific generators that encode structural and semantic logic sufficient enough to reach deep program states; the challenge comes from the overhead of writing and testing these complex generators. We investigate whether AI coding agents can automatically synthesize such target-specific generators, and whether the resulting generators are strong enough to obviate the need for coverage guidance and mutation entirely. Our approach, Gentoo, is comprised of an LLM coding agent (provided terminal access and source code of the fuzz target and its library) instructed to iteratively synthesize and refine an input generator, and optionally provided fine-grained predicate-level coverage feedback. We evaluate three configurations of Gentoo against human-written generators on fuzz targets for 7 real-world Java libraries. Our findings show that agent-synthesized generators achieve statistically significantly higher branch coverage than human-written baseline generators on 4 of 7 benchmarks. Critically, the use of coverage guidance and mutation strategies is not statistically significantly beneficial for agent-synthesized generators, but is significant for all human-written generators, suggesting that structural and semantic logic encoded in the agent generators makes coverage guidance largely unnecessary.
- Abstract(参考訳): 現代のジェネレータベースのファジリング技術は、ターゲットプログラムの深い実行経路を探索する方法として、軽量な入力ジェネレータとカバレッジ誘導突然変異を組み合わせたものである。
先行研究における補完的なアプローチは、構造論理と意味論理をエンコードして深いプログラム状態に到達するための高度にカスタマイズされたドメイン固有のジェネレータを作ることである。
我々は、AI符号化エージェントが、そのようなターゲット固有のジェネレータを自動で合成できるかどうか、また、生成したジェネレータが、カバレッジガイダンスや突然変異を完全に回避できるほど強いかどうかを検討する。
我々のアプローチであるGentooは、入力ジェネレータを反復的に合成・洗練するよう指示されたLCM符号化エージェント(ファズターゲットとそのライブラリの端末アクセスおよびソースコードを提供する)と、任意に詳細な述語レベルのカバレッジフィードバックを提供する。
我々は,実世界の7つのJavaライブラリのファジターゲット上の人書きジェネレータに対して,Gentooの3つの構成を評価する。
その結果, エージェント合成型ジェネレータは, 人手書きのベースラインジェネレータよりも, 統計的に有意に高いカバレッジが得られることがわかった。
批判的に、カバレッジガイダンスと突然変異戦略の使用は、エージェント合成ジェネレータにとって統計的に有益ではないが、すべての人書きジェネレータにとって重要なものであり、エージェントジェネレータにエンコードされた構造論理と意味論理が、カバレッジガイダンスをほとんど不要にしていることを示唆している。
関連論文リスト
- NLGR: Utilizing Neighbor Lists for Generative Rerank in Personalized Recommendation Systems [13.848284819312953]
ジェネレーティブリジェネレータの近隣リストモデルは、空間におけるジェネレータのパフォーマンスを改善することを目的としている。
本稿では,既存のリストから任意の隣接リストへ柔軟にジャンプ可能な,サンプリングに基づく非自己回帰生成手法を提案する。
NLGRの有効性を実証し,NLGRをMeituanフードデリバリープラットフォームに導入することに成功している。
論文 参考訳(メタデータ) (2025-02-10T02:06:17Z) - Genetic Instruct: Scaling up Synthetic Generation of Coding Instructions for Large Language Models [59.60208063956459]
大規模言語モデル(LLM)は、効果的なアライメントのために高品質な命令データを必要とする。
本稿では,大規模かつ高品質な符号化命令を合成するスケーラブルなアルゴリズムであるGenematic-Instructを提案する。
論文 参考訳(メタデータ) (2024-07-29T20:42:59Z) - Generator-Based Fuzzers with Type-Based Targeted Mutation [1.4507298892594764]
以前の研究では、カバレッジ誘導型ファジィザは静的解析、テイント解析、制約解法を混合してこの問題に対処していた。
本稿では,Java GBFの文字列検索とともに,型ベースの突然変異を導入する。
ベースラインのGBFツールと比較すると、アプリケーションカバレッジは平均20%改善しており、サードパーティのコードを含めると、より大きく改善されている。
論文 参考訳(メタデータ) (2024-06-04T07:20:13Z) - ATM: Adversarial Tuning Multi-agent System Makes a Robust Retrieval-Augmented Generator [22.81784849762196]
大規模言語モデル (LLM) は、検索強化世代 (RAG) の恩恵を受けることが証明されている。
ATM(Adversarial Tuning Multi-agent System)を用いた検索拡張ジェネレータの最適化を提案する。
論文 参考訳(メタデータ) (2024-05-28T12:18:50Z) - Parameter-Efficient Detoxification with Contrastive Decoding [78.5124331048714]
Detoxification Generator (DETOXIGEN) は、不要なスタイルから退避する推論時間アルゴリズムである。
実際の生成では、トレーニングされたデトキシファイタを使用して、生成元が各デコードステップでコントラストする好ましくないトークンを生成する。
生成品質を損なうことなく,従来のデトキシフィケーション指標のアプローチを著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-01-13T01:46:20Z) - Red Teaming Language Model Detectors with Language Models [114.36392560711022]
大規模言語モデル(LLM)は、悪意のあるユーザによって悪用された場合、重大な安全性と倫理的リスクをもたらす。
近年,LLM生成テキストを検出し,LLMを保護するアルゴリズムが提案されている。
1) LLMの出力中の特定の単語を, 文脈が与えられたシノニムに置き換えること, 2) 生成者の書き方を変更するための指示プロンプトを自動で検索すること,である。
論文 参考訳(メタデータ) (2023-05-31T10:08:37Z) - Joint Generator-Ranker Learning for Natural Language Generation [99.16268050116717]
JGRは、ジェネレータとローダを単一のフレームワークに統合する、新しいジョイントトレーニングアルゴリズムである。
ジェネレータとランク装置を反復的に更新することにより、JGRは学習を効果的に調和させ、共同で品質を高めることができる。
論文 参考訳(メタデータ) (2022-06-28T12:58:30Z) - Revisiting Discriminator in GAN Compression: A Generator-discriminator
Cooperative Compression Scheme [65.5405625485559]
GAN圧縮は、リソース制約のあるエッジデバイスにGANをデプロイする際の計算オーバーヘッドとメモリ使用量を大幅に削減することを目的としている。
本稿では,GAN圧縮における識別器の役割を再考し,GAN圧縮のための新しいジェネレータ-識別器協調圧縮スキームであるGCCを設計する。
論文 参考訳(メタデータ) (2021-10-27T13:54:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。