論文の概要: Program Analysis Guided LLM Agent for Proof-of-Concept Generation
- arxiv url: http://arxiv.org/abs/2604.07624v1
- Date: Wed, 08 Apr 2026 21:55:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.580398
- Title: Program Analysis Guided LLM Agent for Proof-of-Concept Generation
- Title(参考訳): プログラム解析ガイドによる概念生成のためのLCMエージェント
- Authors: Achintya Desai, Md Shafiuzzaman, Wenbo Guo, Tevfik Bultan,
- Abstract要約: 本稿では,プログラム解析ガイドによる概念生成の証明(PAGENT)という新しい手法を提案する。
PAGENTは、静的解析ガイダンスと消毒剤ベースのプロファイリングを提供するための軽量で規則ベースの静的解析フェーズと、PoC生成エージェントによる動的解析ガイダンスを提供するカバレッジ情報を統合する。
提案手法は,PoC生成タスクにおいて,従来のトップパフォーマンスエージェントアプローチよりも132%優れていた。
- 参考スコア(独自算出の注目度): 3.462916206368371
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Software developers frequently receive vulnerability reports that require them to reproduce the vulnerability in a reliable manner by generating a proof-of-concept (PoC) input that triggers it. Given the source code for a software project and a specific code location for a potential vulnerability, automatically generating a PoC for the given vulnerability has been a challenging research problem. Symbolic execution and fuzzing techniques require expert guidance and manual steps and face scalability challenges for PoC generation. Although recent advances in LLMs have increased the level of automation and scalability, the success rate of PoC generation with LLMs remains quite low. In this paper, we present a novel approach called Program Analysis Guided proof of concept generation agENT (PAGENT) that is scalable and significantly improves the success rate of automated PoC generation compared to prior results. PAGENT integrates lightweight and rule-based static analysis phases for providing static analysis guidance and sanitizer-based profiling and coverage information for providing dynamic analysis guidance with a PoC generation agent. Our experiments demonstrate that the resulting hybrid approach significantly outperforms the prior top-performing agentic approach by 132% for the PoC generation task.
- Abstract(参考訳): ソフトウェア開発者はしばしば脆弱性レポートを受け取り、それをトリガーする概念実証(PoC)インプットを生成することによって、脆弱性を信頼できる方法で再現する必要がある。
ソフトウェアプロジェクトのソースコードと潜在的な脆弱性のための特定のコードロケーションを考えると、与えられた脆弱性に対するPoCを自動的に生成することは、難しい研究問題でした。
シンボリックな実行とファジィングのテクニックは、専門家のガイダンスと手作業のステップを必要とし、PoC生成のためのスケーラビリティの課題に直面します。
LLMの最近の進歩は、自動化とスケーラビリティのレベルを増大させているが、LLMによるPoC生成の成功率は非常に低いままである。
本稿では,プログラム解析ガイドによる概念生成証明(PAGENT)と呼ばれる新しい手法を提案する。
PAGENTは、静的解析ガイダンスと消毒剤ベースのプロファイリングを提供するための軽量で規則ベースの静的解析フェーズと、PoC生成エージェントによる動的解析ガイダンスを提供するカバレッジ情報を統合する。
提案手法は,PoC生成タスクにおいて,従来のトップパフォーマンスエージェントアプローチよりも132%優れていた。
関連論文リスト
- PoC-Adapt: Semantic-Aware Automated Vulnerability Reproduction with LLM Multi-Agents and Reinforcement Learning-Driven Adaptive Policy [0.47998222538650537]
自動PoC生成と検証のためのエンドツーエンドフレームワークであるPoC-Adaptを提案する。
PoC-Adaptは、基本的なセマンティックランタイムバリデーションとアダプティブポリシー学習に基づいて設計されている。
実験によると、PoC-Adaptは信頼性を25%向上し、エクスプロイト生成コストを低減している。
論文 参考訳(メタデータ) (2026-04-08T02:59:42Z) - Execution-State-Aware LLM Reasoning for Automated Proof-of-Vulnerability Generation [36.950993500170014]
本稿では,PoV生成を反復的仮説検証法として再構成するエージェントフレームワークであるDrillAgentを提案する。
我々は、実世界のC/C++脆弱性の大規模なベンチマークであるSEC-bench上でDrillAgentを評価する。
論文 参考訳(メタデータ) (2026-02-14T03:17:27Z) - LLMs in Code Vulnerability Analysis: A Proof of Concept [0.3441021278275805]
従来のソフトウェアセキュリティ分析手法は、現代人の規模や複雑さに合わせたペースを維持するのに苦労している。
本稿では,重要なソフトウェアセキュリティタスクを自動化するために,コード固有および汎用大規模言語モデルの導入について検討する。
論文 参考訳(メタデータ) (2026-01-13T16:16:11Z) - AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning [2.918225266151982]
AVIATORはAIによる最初の脆弱性注入ワークフローである。
高忠実で多様な大規模な脆弱性データセット生成のために、現実的でカテゴリ固有の脆弱性を自動的に注入する。
セマンティック分析、LoRAベースのファインチューニングとRetrieval-Augmented Generationで強化されたインジェクション合成、静的解析とLLMベースの識別器によるインジェクション後の検証を組み合わせる。
論文 参考訳(メタデータ) (2025-08-28T14:59:39Z) - White-Basilisk: A Hybrid Model for Code Vulnerability Detection [45.03594130075282]
我々は、優れた性能を示す脆弱性検出の新しいアプローチであるWhite-Basiliskを紹介する。
White-Basiliskは、パラメータ数2億の脆弱性検出タスクで結果を得る。
この研究は、コードセキュリティにおける新しいベンチマークを確立し、コンパクトで効率的に設計されたモデルが、特定のタスクにおいてより大きなベンチマークよりも優れているという実証的な証拠を提供する。
論文 参考訳(メタデータ) (2025-07-11T12:39:25Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - DS-Agent: Automated Data Science by Empowering Large Language Models with Case-Based Reasoning [56.887047551101574]
大規模言語モデル(LLM)エージェントとケースベース推論(CBR)を利用した新しいフレームワークであるDS-Agentを提案する。
開発段階では、DS-AgentはCBRフレームワークに従い、自動イテレーションパイプラインを構築する。
デプロイメントの段階では、DS-Agentは、シンプルなCBRパラダイムで低リソースのデプロイメントステージを実装し、LCMの基本能力に対する需要を大幅に削減する。
論文 参考訳(メタデータ) (2024-02-27T12:26:07Z) - Let's reward step by step: Step-Level reward model as the Navigators for
Reasoning [64.27898739929734]
Process-Supervised Reward Model (PRM)は、トレーニングフェーズ中にステップバイステップのフィードバックをLLMに提供する。
LLMの探索経路を最適化するために,PRMからのステップレベルのフィードバックを応用した欲求探索アルゴリズムを提案する。
提案手法の汎用性を探るため,コーディングタスクのステップレベル報酬データセットを自動生成する手法を開発し,コード生成タスクにおける同様の性能向上を観察する。
論文 参考訳(メタデータ) (2023-10-16T05:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。