論文の概要: A Multi-Agent Framework for Automated Exploit Generation with Constraint-Guided Comprehension and Reflection
- arxiv url: http://arxiv.org/abs/2604.05130v1
- Date: Mon, 06 Apr 2026 19:47:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-08 17:42:09.468264
- Title: A Multi-Agent Framework for Automated Exploit Generation with Constraint-Guided Comprehension and Reflection
- Title(参考訳): 制約誘導的理解と反射を考慮したマルチエージェントによる自動爆発生成フレームワーク
- Authors: Siyi Chen, Tianhan Luo, Shijian Wu, Xiangyu Liu, Yilin Zhou, Qi Li, Wenyuan Xu,
- Abstract要約: Vulnsageは自動エクスプロイト生成のためのマルチエージェントフレームワークである。
explosionjsのような最先端のツールよりも34.64%のエクスプロイトを生成する。
Vulnsageは、現実世界のシナリオで146のゼロデイ脆弱性を発見し、検証した。
- 参考スコア(独自算出の注目度): 30.539826266048014
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Open-source libraries are widely used in modern software development, introducing significant security vulnerabilities. While static analysis tools can identify potential vulnerabilities at scale, they often generate overwhelming reports with high false positive rates. Automated Exploit Generation (AEG) emerges as a promising solution to confirm vulnerability authenticity by generating an exploit. However, traditional AEG approaches based on fuzzing or symbolic execution face path coverage and constraint-solving problems. Although LLMs show great potential for AEG, how to effectively leverage them to comprehend vulnerabilities and generate corresponding exploits is still an open question. To address these challenges, we propose Vulnsage, a multi-agent framework for AEG. Vulnsage simulates human security researchers' workflows by decomposing the complex AEG process into multiple specialized sub-agents: Code Analyzer Agent, Code Generation Agent, Validation Agent, and a set of Reflection Agents, orchestrated by a central supervisor through iterative cycles. Given a target program, the Code Analyzer Agent performs static analysis to identify potential vulnerabilities and collects relevant information for each one. The Code Generation Agent then utilizes an LLM to generate candidate exploits. The Validation Agent and Reflection Agents form a feedback-driven self-refinement loop that uses execution traces and runtime error analysis to either improve the exploit iteratively or reason about the false positive alert. Experimental evaluation demonstrates that Vulnsage succeeds in generating 34.64\% more exploits than state-of-the-art tools such as \explodejs. Furthermore, Vulnsage has successfully discovered and verified 146 zero-day vulnerabilities in real-world scenarios, demonstrating its practical effectiveness for assisting security assessment in software supply chains.
- Abstract(参考訳): オープンソースライブラリは現代のソフトウェア開発で広く使われており、重大なセキュリティ脆弱性が導入されている。
静的解析ツールは、大規模に潜在的な脆弱性を特定することができるが、しばしば偽陽性率の高い圧倒的なレポートを生成する。
AEG(Automated Exploit Generation)は、エクスプロイトを生成して脆弱性の信頼性を確認するための、有望なソリューションとして登場した。
しかし、従来のAIGアプローチはファジィング(fuzzing)やシンボリックな実行フェイスパスのカバレッジと制約解決の問題に基づいている。
LLMはAEGにとって大きな可能性を示しているが、それを効果的に活用して脆弱性を理解し、それに対応するエクスプロイトを生成する方法は未解決の問題である。
これらの課題に対処するため、AEGのためのマルチエージェントフレームワークであるVulnsageを提案する。
Vulnsageは、複雑なAIGプロセスを複数の特別なサブエージェントに分解することで、人間のセキュリティ研究者のワークフローをシミュレートする。
ターゲットプログラムが与えられた場合、Code Analyzer Agentは静的解析を行い、潜在的な脆弱性を特定し、各脆弱性に関連する情報を収集する。
コード生成エージェントはLLMを使用して候補エクスプロイトを生成する。
バリデーションエージェントとリフレクションエージェントはフィードバック駆動の自己修正ループを形成し、実行トレースと実行時エラー分析を使用してエクスプロイトを反復的に改善するか、偽陽性警告を推論する。
実験的評価により、Vulnsageは \explodejsのような最先端ツールよりも34.64\%のエクスプロイトを生成することに成功した。
さらに、Vulnsageは現実世界のシナリオで146のゼロデイ脆弱性を発見し、検証し、ソフトウェアサプライチェーンのセキュリティアセスメントを支援するための実用的効果を実証した。
関連論文リスト
- AXE: An Agentic eXploit Engine for Confirming Zero-Day Vulnerability Reports [9.184243224127377]
Agentic eXploit Engine (AXE)は、Webアプリケーションを利用するためのマルチエージェントフレームワークである。
AXEは30%のエクスプロイト成功率を実現しており、最先端のブラックボックスベースラインよりも3倍改善されている。
エクスプロイトの成功のために、AXEは実行可能で再現可能な概念実証成果物を生成する。
論文 参考訳(メタデータ) (2026-02-15T23:25:14Z) - Execution-State-Aware LLM Reasoning for Automated Proof-of-Vulnerability Generation [36.950993500170014]
本稿では,PoV生成を反復的仮説検証法として再構成するエージェントフレームワークであるDrillAgentを提案する。
我々は、実世界のC/C++脆弱性の大規模なベンチマークであるSEC-bench上でDrillAgentを評価する。
論文 参考訳(メタデータ) (2026-02-14T03:17:27Z) - VulnResolver: A Hybrid Agent Framework for LLM-Based Automated Vulnerability Issue Resolution [27.16762667503862]
VulnResolverは、自動脆弱性解決のための最初のハイブリッドエージェントフレームワークである。
自律エージェントの適応性と、ワークフロー誘導修理の安定性を2つの特殊エージェントを通じて結合する。
VulnResolverはSEC-bench Liteの75%の問題を解決する。
論文 参考訳(メタデータ) (2026-01-20T13:09:16Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - RedCodeAgent: Automatic Red-teaming Agent against Diverse Code Agents [70.24175620901538]
コードエージェントは、強力なコード生成機能とコードインタプリタとの統合により、広く採用されている。
現在の静的安全性ベンチマークとレッドチームツールは、出現する現実世界のリスクシナリオを特定するのに不十分である。
我々はRedCodeAgentを提案する。RedCodeAgentは、多様なコードエージェントの脆弱性を体系的に発見するように設計された、最初の自動リピートエージェントである。
論文 参考訳(メタデータ) (2025-10-02T22:59:06Z) - Automated Vulnerability Validation and Verification: A Large Language Model Approach [7.482522010482827]
本稿では、生成AI、特に大規模言語モデル(LLM)を利用したエンドツーエンド多段階パイプラインを提案する。
本手法は,国立脆弱性データベース(National Vulnerability Database)のCVE開示情報から抽出する。
これは、Retrieval-Augmented Generation (RAG)を使用して、外部の公開知識(例えば、脅威アドバイザリ、コードスニペット)で拡張する。
パイプラインは生成されたアーティファクトを反復的に洗練し、テストケースでのアタック成功を検証し、複雑なマルチコンテナセットアップをサポートする。
論文 参考訳(メタデータ) (2025-09-28T19:16:12Z) - OpenAgentSafety: A Comprehensive Framework for Evaluating Real-World AI Agent Safety [58.201189860217724]
OpenAgentSafetyは,8つの危機リスクカテゴリにまたがるエージェントの動作を評価する包括的なフレームワークである。
従来の作業とは異なり、我々のフレームワークは、Webブラウザ、コード実行環境、ファイルシステム、bashシェル、メッセージングプラットフォームなど、実際のツールと対話するエージェントを評価します。
ルールベースの分析とLSM-as-judgeアセスメントを組み合わせることで、過度な行動と微妙な不安全行動の両方を検出する。
論文 参考訳(メタデータ) (2025-07-08T16:18:54Z) - ATAG: AI-Agent Application Threat Assessment with Attack Graphs [23.757154032523093]
本稿では,Attack Graphs (ATAG) を用いたAIエージェントアプリケーションThreatアセスメントを提案する。
ATAGは、AIエージェントアプリケーションに関連するセキュリティリスクを体系的に分析するために設計された、新しいフレームワークである。
マルチエージェントアプリケーションにおけるAIエージェント脅威の積極的な識別と緩和を容易にする。
論文 参考訳(メタデータ) (2025-06-03T13:25:40Z) - AgentVigil: Generic Black-Box Red-teaming for Indirect Prompt Injection against LLM Agents [54.29555239363013]
本稿では,間接的なインジェクション脆弱性を自動的に検出し,悪用するための汎用的なブラックボックスファジリングフレームワークであるAgentVigilを提案する。
我々はAgentVigilをAgentDojoとVWA-advの2つの公開ベンチマークで評価し、o3-miniとGPT-4oに基づくエージェントに対して71%と70%の成功率を達成した。
攻撃を現実世界の環境に適用し、悪質なサイトを含む任意のURLに誘導するエージェントをうまく誘導する。
論文 参考訳(メタデータ) (2025-05-09T07:40:17Z) - Identifying the Risks of LM Agents with an LM-Emulated Sandbox [68.26587052548287]
言語モデル(LM)エージェントとツールは、豊富な機能セットを可能にすると同時に、潜在的なリスクを増幅する。
これらのエージェントを高いコストでテストすることは、高いリスクと長い尾のリスクを見つけるのをますます困難にします。
ツール実行をエミュレートするためにLMを使用し、さまざまなツールやシナリオに対してLMエージェントのテストを可能にするフレームワークであるToolEmuを紹介します。
論文 参考訳(メタデータ) (2023-09-25T17:08:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。