論文の概要: Coverage-Guided Multi-Agent Harness Generation for Java Library Fuzzing
- arxiv url: http://arxiv.org/abs/2603.08616v1
- Date: Mon, 09 Mar 2026 16:59:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:16.589241
- Title: Coverage-Guided Multi-Agent Harness Generation for Java Library Fuzzing
- Title(参考訳): Javaライブラリファジングのためのカバーガイド型マルチエージェントハーネス生成
- Authors: Nils Loose, Nico Winkel, Kristoffer Hempel, Felix Mächtle, Julian Hans, Thomas Eisenbarth,
- Abstract要約: Javaライブラリのファジハーネス生成を自動化するマルチエージェントアーキテクチャを提案する。
5つのReActエージェントはワークフローを研究、合成、コンパイルの修復、カバレッジ分析、改善に分解する。
生成したハーネスはOSS-Fuzzベースラインよりも中央値26%向上し,パッケージスコープのカバレッジでは Jazzer AutoFuzz が5%向上した。
- 参考スコア(独自算出の注目度): 4.258856450871922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Coverage-guided fuzzing has proven effective for software testing, but targeting library code requires specialized fuzz harnesses that translate fuzzer-generated inputs into valid API invocations. Manual harness creation is time-consuming and requires deep understanding of API semantics, initialization sequences, and exception handling contracts. We present a multi-agent architecture that automates fuzz harness generation for Java libraries through specialized LLM-powered agents. Five ReAct agents decompose the workflow into research, synthesis, compilation repair, coverage analysis, and refinement. Rather than preprocessing entire codebases, agents query documentation, source code, and callgraph information on demand through the Model Context Protocol, maintaining focused context while exploring complex dependencies. To enable effective refinement, we introduce method-targeted coverage that tracks coverage only during target method execution to isolate target behavior, and agent-guided termination that examines uncovered source code to distinguish productive refinement opportunities from diminishing returns. We evaluated our approach on seven target methods from six widely-deployed Java libraries totaling 115,000+ Maven dependents. Our generated harnesses achieve a median 26\% improvement over OSS-Fuzz baselines and outperform Jazzer AutoFuzz by 5\% in package-scope coverage. Generation costs average \$3.20 and 10 minutes per harness, making the approach practical for continuous fuzzing workflows. During a 12-hour fuzzing campaign, our generated harnesses discovered 3 bugs in projects that are already integrated into OSS-Fuzz, demonstrating the effectiveness of the generated harnesses.
- Abstract(参考訳): カバレッジ誘導ファジィングは、ソフトウェアテストに有効であることが証明されているが、ライブラリコードをターゲットにするには、ファジィ生成した入力を有効なAPI呼び出しに変換する特別なファジィハーネスが必要である。
手動ハーネスの作成には時間がかかり、APIセマンティクス、初期化シーケンス、例外処理コントラクトの深い理解が必要となる。
特殊なLLMエージェントを用いて,Javaライブラリのファジハーネス生成を自動化するマルチエージェントアーキテクチャを提案する。
5つのReActエージェントはワークフローを研究、合成、コンパイルの修復、カバレッジ分析、改善に分解する。
コードベース全体を前処理する代わりに、エージェントは、複雑な依存関係を探索しながら集中したコンテキストを維持しながら、Model Context Protocolを通じて、必要に応じてドキュメント、ソースコード、コールグラフ情報をクエリします。
効率的な改良を実現するために,対象のメソッド実行中のみのカバレッジをトラッキングして対象の動作を分離するメソッドターゲットカバレッジと,未発見のソースコードを検証し,生産的な改良機会とリターンの減少を区別するエージェントガイドの終了を導入する。
我々は,約115,000人以上のMaven依存者を対象に,広くデプロイされた6つのJavaライブラリの7つのターゲットメソッドに対するアプローチを評価した。
生成したハーネスは,OSS-FuzzベースラインとJazzer AutoFuzzのパッケージスコープカバレッジにおいて,中央値の26倍の改善を実現している。
ジェネレーションコストは平均3.20ドル、ハーネスあたり10分であり、継続的なファジリングワークフローに実用的なアプローチとなっている。
12時間のファジィキャンペーンで、生成したハーネスはOSS-Fuzzに統合されたプロジェクトの3つのバグを発見し、生成したハーネスの有効性を実証した。
関連論文リスト
- HarnessAgent: Scaling Automatic Fuzzing Harness Construction with Tool-Augmented LLM Pipelines [22.70950665226898]
HarnessAgentはツール拡張されたエージェントフレームワークで、何百ものOSS-Fuzzターゲットに対して完全に自動化され、スケーラブルなハーネス構築を実現する。
OSS-Fuzzプロジェクトと178のC++プロジェクトから243のターゲット関数に対してHarnessAgentを評価する。
論文 参考訳(メタデータ) (2025-12-03T03:55:09Z) - DetectAnyLLM: Towards Generalizable and Robust Detection of Machine-Generated Text Across Domains and Models [60.713908578319256]
タスク指向の知識で検出器を最適化するために,DDL(Direct Discrepancy Learning)を提案する。
そこで本研究では,最新のMGTD性能を実現する統合検出フレームワークであるTectAnyLLMを紹介する。
MIRAGEは5つのテキストドメインにまたがる10のコーパスから人書きテキストをサンプリングし、17個の最先端のLLMを使用して再生成または修正する。
論文 参考訳(メタデータ) (2025-09-15T10:59:57Z) - DiffuCoder: Understanding and Improving Masked Diffusion Models for Code Generation [68.19756761027351]
拡散大言語モデル(dLLM)は自己回帰(AR)モデルの魅力的な代替品である。
本研究は,それらの認知過程と強化学習手法について考察する。
我々の研究は、dLLM生成のメカニズムについて深い洞察を与え、効果的な拡散ネイティブなRLトレーニングフレームワークを提供します。
論文 参考訳(メタデータ) (2025-06-25T17:35:47Z) - What to Retrieve for Effective Retrieval-Augmented Code Generation? An Empirical Study and Beyond [32.467437657603604]
リポジトリレベルのコード生成は、複雑なコード依存と長いコンテキストの処理における大きな言語モデル(LLM)の制限のため、依然として困難である。
ユーザクエリを実装ステップに分解し,セマンティックな記述マッチングを通じてAPIを検索する,チェーン・オブ・シントを利用した新しいコンテキスト統合手法であるAllianceCoderを提案する。
CoderEvalとRepoExecに関する広範な実験を通じて、AllianceCoderは最先端のパフォーマンスを実現し、Pass@1を既存のアプローチよりも最大20%改善した。
論文 参考訳(メタデータ) (2025-03-26T14:41:38Z) - ExploraCoder: Advancing code generation for multiple unseen APIs via planning and chained exploration [70.26807758443675]
ExploraCoderはトレーニング不要のフレームワークで、大規模な言語モデルにコードソリューションで見えないAPIを呼び出す権限を与える。
実験の結果、ExploreaCoderは、事前のAPI知識に欠けるモデルのパフォーマンスを大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-12-06T19:00:15Z) - Commit0: Library Generation from Scratch [77.38414688148006]
Commit0は、AIエージェントにスクラッチからライブラリを書くよう促すベンチマークである。
エージェントには、ライブラリのAPIを概説する仕様文書と、インタラクティブなユニットテストスイートが提供されている。
Commit0はまた、モデルが生成したコードに対して静的解析と実行フィードバックを受け取る、インタラクティブな環境も提供する。
論文 参考訳(メタデータ) (2024-12-02T18:11:30Z) - Online Intrinsic Rewards for Decision Making Agents from Large Language Model Feedback [52.763620660061115]
ONIは、RLポリシーと本質的な報酬関数を同時に学習する分散アーキテクチャである。
我々は、様々な複雑さを持つ報酬モデリングのためのアルゴリズムの選択範囲を探索する。
提案手法は,NetHack Learning Environment の様々な課題にまたがって,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-10-30T13:52:43Z) - Are Human Rules Necessary? Generating Reusable APIs with CoT Reasoning and In-Context Learning [14.351476383642016]
そこで我々は,Stack OverflowコードスニペットのAPIzationを自動的に実行する,Code2APIという新しいアプローチを提案する。
Code2APIは、追加のモデルトレーニングや手作業のルールを必要としない。
他の外部ツールに頼ることなく、パーソナルコンピュータに簡単にデプロイできる。
論文 参考訳(メタデータ) (2024-05-06T14:22:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。