論文の概要: FuzzAgent: Multi-Agent System for Evolutionary Library Fuzzing
- arxiv url: http://arxiv.org/abs/2605.14431v1
- Date: Thu, 14 May 2026 06:21:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.659065
- Title: FuzzAgent: Multi-Agent System for Evolutionary Library Fuzzing
- Title(参考訳): FuzzAgent:進化的ライブラリファジリングのためのマルチエージェントシステム
- Authors: Yunlong Lyu, Peng Chen, Fengyi Wu, Junzhe Yu, Kit Long Hon, Hao Chen,
- Abstract要約: ライブラリファジィングはソフトウェアサプライチェーンの強化に不可欠だが、大規模に採用するコストは高い。
本稿では,図書館ファジィングを進化過程に変換するマルチエージェントシステムFuzzAgentを紹介する。
実世界の20のC/C++ライブラリ上で4つの最先端ベースラインに対してFuzzAgentを評価する。
- 参考スコア(独自算出の注目度): 8.054484953700365
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Library fuzzing is essential for hardening the software supply chain, but adopting it at scale remains expensive. Practitioners still spend substantial effort on environment setup, struggle to generate harnesses that respect intricate API constraints, and lack reliable means to tell genuine library bugs from harness-induced crashes. Recent LLM-based systems automate parts of this pipeline, yet they typically operate as one-shot code generators that ignore runtime feedback, which limits both the depth of code they reach and the validity of the bugs they report. We argue that effective library fuzzing is iterative by nature: each campaign exposes new coverage bottlenecks and crashes, and the next campaign should evolve from these signals rather than restart from scratch. Building on this insight, we present FuzzAgent, a multi-agent system that turns library fuzzing into an evolutionary process, in which a team of specialized agents collaborates over the full fuzzing lifecycle and grounds every decision in concrete runtime evidence, so that the harness suite is successively refined toward deeper coverage and higher-fidelity crash analysis across rounds. We evaluate FuzzAgent on 20 real-world C/C++ libraries against four state-of-the-art baselines (OSS-Fuzz, OSS-Fuzz-Gen, PromptFuzz, and PromeFuzz). FuzzAgent completes the full fuzzing lifecycle for all 20 libraries without human intervention and reaches 179619 branches, exceeding OSS-Fuzz, PromptFuzz, PromeFuzz, and OSS-Fuzz-Gen by 45.1%, 73.2%, 92.1%, and 191.2%, respectively. FuzzAgent also identifies 102 genuine library bugs, 78 of which have already been acknowledged and fixed by upstream maintainers.
- Abstract(参考訳): ライブラリファジィングはソフトウェアサプライチェーンの強化に不可欠だが、大規模に採用するコストは高い。
実践者は依然として環境設定に多大な労力を費やし、複雑なAPI制約を尊重するハーネスを生成するのに苦労している。
最近のLLMベースのシステムはパイプラインの一部を自動化するが、通常は、実行時のフィードバックを無視したワンショットコードジェネレータとして動作する。
各キャンペーンは、新しいカバレッジボトルネックとクラッシュを露呈し、次のキャンペーンは、スクラッチから再起動するのではなく、これらのシグナルから進化すべきである。
この知見に基づいて、図書館ファジィングを進化的なプロセスに変えるマルチエージェントシステムであるFuzzAgentを紹介します。
実世界の20のC/C++ライブラリ上でFuzzAgentを、最先端の4つのベースライン(OSS-Fuzz、OSS-Fuzz-Gen、PromptFuzz、PromeFuzz)に対して評価する。
FuzzAgentは、人間の介入なしに20の図書館のフルファジングライフサイクルを完了し、OSS-Fuzz、PromptFuzz、PromeFuzz、OSS-Fuzz-Genを45.1%、73.2%、92.1%、191.2%超えた179619の支店に到達した。
FuzzAgentはまた102の真のライブラリバグを特定しており、そのうち78はすでに上流のメンテナによって承認され、修正されている。
関連論文リスト
- SlopCodeBench: Benchmarking How Coding Agents Degrade Over Long-Horizon Iterative Tasks [55.76734816061826]
我々は20の問題と93のチェックポイントからなる言語に依存しないベンチマークであるSlopCodeBenchを紹介する。
我々は、冗長性、重複コードの割合、構造的侵食という2つの軌道レベルの品質信号を追跡する。
11モデルにまたがるエンドツーエンドの問題を解決するエージェントは存在しない。
論文 参考訳(メタデータ) (2026-03-25T19:26:44Z) - The Bitter Lesson of Diffusion Language Models for Agentic Workflows: A Comprehensive Reality Check [54.08619694620588]
本稿では,2つの異なるエージェントパラダイムであるEmbodied AgentsとTool-Calling AgentsにまたがるdLLMの包括的評価を行う。
Agentboard と BFCL では,現在の dLLM が信頼できるエージェントバックボーンとして機能しないという,"ビットレッスン" が報告されている。
論文 参考訳(メタデータ) (2026-01-19T11:45:39Z) - Where LLM Agents Fail and How They can Learn From Failures [62.196870049524364]
大規模言語モデル(LLM)エージェントは、複雑なマルチステップタスクの解決において有望であることを示す。
単一ルート原因エラーがその後の決定を通じて伝播する、障害のカスケードに対する脆弱性を増幅する。
現在のシステムは、モジュール的で体系的な方法でエージェントエラーを包括的に理解できるフレームワークを欠いている。
AgentErrorTaxonomyは、メモリ、リフレクション、計画、アクション、システムレベルの操作にまたがる障害モードのモジュール分類である。
論文 参考訳(メタデータ) (2025-09-29T18:20:27Z) - Scheduzz: Constraint-based Fuzz Driver Generation with Dual Scheduling [16.453200060615234]
本稿では,ライブラリの合理的使用法を理解し,APIの組み合わせ制約を抽出するために,新しいライブラリファジリング手法であるSchudzzを提案する。
Scheduzzは計算オーバーヘッドを大幅に削減し、21のライブラリのうち16でUTopiaを上回っている。
最新技術であるCKGFuzzer、Promptfuzz、手作りのOSS-Fuzzよりも1.62倍、1.50倍、および1.89倍高いカバレッジを実現している。
論文 参考訳(メタデータ) (2025-07-24T10:51:11Z) - LibLMFuzz: LLM-Augmented Fuzz Target Generation for Black-box Libraries [0.0]
LibLMFuzzは、クローズドソースライブラリのファジングに関連するコストを削減するフレームワークである。
LibLMFuzzは広く使われている4つのLinuxライブラリでテストされ、558のfuzz-able API関数に対して構文的に正しいドライバを作成した。
論文 参考訳(メタデータ) (2025-07-20T17:38:51Z) - LLAMA: Multi-Feedback Smart Contract Fuzzing Framework with LLM-Guided Seed Generation [56.84049855266145]
進化的突然変異戦略とハイブリッドテスト技術を統合したマルチフィードバックスマートコントラクトファジリングフレームワーク(LLAMA)を提案する。
LLAMAは、91%の命令カバレッジと90%のブランチカバレッジを達成すると同時に、148の既知の脆弱性のうち132が検出される。
これらの結果は、現実のスマートコントラクトセキュリティテストシナリオにおけるLAMAの有効性、適応性、実用性を強調している。
論文 参考訳(メタデータ) (2025-07-16T09:46:58Z) - Your Fix Is My Exploit: Enabling Comprehensive DL Library API Fuzzing with Large Language Models [49.214291813478695]
AIアプリケーションで広く使用されているディープラーニング(DL)ライブラリは、オーバーフローやバッファフリーエラーなどの脆弱性を含むことが多い。
従来のファジィングはDLライブラリの複雑さとAPIの多様性に悩まされている。
DLライブラリのためのLLM駆動ファジィ手法であるDFUZZを提案する。
論文 参考訳(メタデータ) (2025-01-08T07:07:22Z) - FuzzCoder: Byte-level Fuzzing Test via Large Language Model [46.18191648883695]
我々は,攻撃を成功させることで,入力ファイルのパターンを学習するために,微調整された大言語モデル(FuzzCoder)を採用することを提案する。
FuzzCoderは、プログラムの異常な動作を引き起こすために、入力ファイル内の突然変異位置と戦略位置を予測することができる。
論文 参考訳(メタデータ) (2024-09-03T14:40:31Z) - Prompt Fuzzing for Fuzz Driver Generation [6.238058387665971]
本稿では,プロンプトファジングのためのカバーガイドファジングであるPromptFuzzを提案する。
未発見のライブラリコードを探索するためにファズドライバを反復的に生成する。
PromptFuzzはOSS-FuzzとHopperの2倍のブランチカバレッジを達成した。
論文 参考訳(メタデータ) (2023-12-29T16:43:51Z) - Benchmarking Deep Learning Fuzzers [11.118370064698869]
ベンチマークでは、最先端の3つのDLファザ、FreeFuzz、DeepRel、DocTerを、その命令に従って実行します。
これらのファジィザは、ベンチマークデータセットで収集された多くの実際のバグを検出することができません。
我々の系統分析では、これらのファジッターが実際のバグを検知する能力に影響を及ぼす4つの主要な、広く、共通の要因を同定する。
論文 参考訳(メタデータ) (2023-10-10T18:09:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。