論文の概要: OpenAnt: LLM-Powered Vulnerability Discovery Through Code Decomposition, Adversarial Verification, and Dynamic Testing
- arxiv url: http://arxiv.org/abs/2606.19149v2
- Date: Thu, 18 Jun 2026 15:18:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 13:55:51.908291
- Title: OpenAnt: LLM-Powered Vulnerability Discovery Through Code Decomposition, Adversarial Verification, and Dynamic Testing
- Title(参考訳): OpenAnt: コードの分解、逆検証、動的テストによるLLM駆動の脆弱性発見
- Authors: Nahum Korda, Gadi Evron,
- Abstract要約: 本稿では,オープンソースの脆弱性発見システムOpenAntを紹介する。
静的プログラム解析とLLMベースの推論を多段階パイプラインに統合する。
OpenAntはApache 2.0ライセンスの下でオープンソースとしてリリースされた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automated vulnerability discovery in large codebases remains challenging: traditional static analysis produces high false-positive rates, while dynamic approaches such as fuzzing require substantial infrastructure and often target narrow classes of bugs. Recent advances in large language models (LLMs) enable semantic reasoning about program behavior, but applying LLMs to repository-scale security analysis introduces challenges related to context management, cost, and verification. We present OpenAnt, an open-source vulnerability discovery system that integrates static program analysis with LLM-based reasoning in a multi-stage pipeline. OpenAnt introduces three key techniques. First, codebases are decomposed into self-contained analysis units filtered by reachability from external entry points, reducing the analysis surface by up to 97% while preserving attack-relevant code. Second, candidate vulnerabilities undergo adversarial verification through constrained attacker simulation, where the model evaluates exploitability under realistic attacker capabilities. Third, findings are validated through dynamic verification, in which exploit environments are generated automatically, executed in sandboxed containers, and discarded after use. Evaluation on widely used open-source projects including OpenSSL, WordPress, and Flowise shows that this architecture can identify previously unknown vulnerabilities while maintaining manageable analysis cost and substantially reducing false positives. Our results suggest that closed-loop vulnerability discovery pipelines, combining semantic reasoning with exploit validation, provide a practical path toward scalable automated security analysis. OpenAnt is released as open source under the Apache 2.0 license at https://github.com/knostic/OpenAnt.
- Abstract(参考訳): 従来の静的解析は高い偽陽性率を発生させる一方、ファジィングのような動的アプローチは相当なインフラを必要とし、しばしば狭いバグクラスをターゲットにしている。
大規模言語モデル(LLM)の最近の進歩は,プログラムの動作に関する意味論的推論を可能にするが,LLMをリポジトリスケールのセキュリティ分析に適用することは,コンテキスト管理やコスト,検証に関わる課題をもたらす。
静的プログラム解析とLCMに基づく推論を多段階パイプラインで統合した,オープンソースの脆弱性発見システムOpenAntを提案する。
OpenAntは3つの重要なテクニックを紹介している。
まず、コードベースは、外部エントリポイントからの到達性によってフィルタリングされた自己完結分析ユニットに分解され、アタック関連コードの保存中に分析表面を最大97%削減する。
第二に、候補の脆弱性は制約された攻撃者シミュレーションを通じて敵の検証を受け、そこでモデルは現実的な攻撃者機能下での攻撃性を評価する。
第3に、エクスプロイト環境を自動生成し、サンドボックスコンテナで実行し、使用後に破棄する動的検証を通じて、調査結果を検証する。
OpenSSL、WordPress、Flowiseなど、広く使用されているオープンソースプロジェクトの評価によると、このアーキテクチャは、管理可能な分析コストを維持しながら、既知の脆弱性を特定し、偽陽性を大幅に減らすことができる。
この結果から,セマンティック推論とエクスプロイトバリデーションを組み合わせたクローズループ脆弱性発見パイプラインが,スケーラブルな自動セキュリティ分析への実践的な道筋を提供する可能性が示唆された。
OpenAntはApache 2.0ライセンスのもと、https://github.com/knostic/OpenAntでオープンソースとしてリリースされた。
関連論文リスト
- Understanding and Mitigating Prompt Leaking Attacks in Real-World LLM-Based Applications [57.33208520608409]
本稿では,大規模言語モデル(LLM)に基づくアプリケーションにおいて,プロンプトリークのシステマティックスタディを提案する。
デプロイの80%以上は、現実的な逆クエリの下で、システムにリークする。
我々は、最適化可能なソフトプロンプトを用いてモデルの注意を喚起する実用的な防御であるARAを提案する。
論文 参考訳(メタデータ) (2026-06-17T04:20:00Z) - FuzzingBrain V2: A Multi-Agent LLM System for Automated Vulnerability Discovery and Reproduction [7.802658978010212]
ソフトウェア脆弱性は重大なセキュリティ上の脅威となり、2025年には5万近いCVEが報告された。
大規模言語モデル(LLM)は自動脆弱性検出を約束する一方で、3つの重要な課題が残っている。
本稿では、4つの重要な貢献を通じてこれらのギャップに対処するマルチエージェントシステムFuzzingBrain V2を提案する。
論文 参考訳(メタデータ) (2026-05-20T22:17:14Z) - VulTriage: Triple-Path Context Augmentation for LLM-Based Vulnerability Detection [29.553970297594887]
VulTriageは脆弱性検出のための3重パスコンテキスト拡張フレームワークである。
VulTriageは、主要なペアワイドおよび分類指標上で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2026-05-10T10:20:05Z) - GoAT-X: A Graph of Auditing Thoughts for Securing Token Transactions in Cross-Chain Contracts [52.51342355102833]
マルチチェーンエコシステムの重要な基盤であるクロスチェーンブリッジは、攻撃者にとって主要なターゲットとなっている。
バイトコードレベルの静的解析のような既存の防御は、チェーン間の相互作用のセマンティックな複雑さを扱うには不十分である。
パターンマッチングから体系的な第一原理検証へ自動的なクロスチェーンスマートコントラクト監査を移行するフレームワークであるGoAT-Xを提案する。
論文 参考訳(メタデータ) (2026-04-27T11:34:21Z) - A Multi-Agent Framework for Automated Exploit Generation with Constraint-Guided Comprehension and Reflection [30.539826266048014]
Vulnsageは自動エクスプロイト生成のためのマルチエージェントフレームワークである。
explosionjsのような最先端のツールよりも34.64%のエクスプロイトを生成する。
Vulnsageは、現実世界のシナリオで146のゼロデイ脆弱性を発見し、検証した。
論文 参考訳(メタデータ) (2026-04-06T19:47:17Z) - Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - Why Does the LLM Stop Computing: An Empirical Study of User-Reported Failures in Open-Source LLMs [50.075587392477935]
オープンソースのDeepSeek、Llama、Qwenのエコシステムから、705の現実世界の失敗に関する大規模な実証的研究を行った。
ホワイトボックスオーケストレーションは、モデルアルゴリズムの欠陥からデプロイメントスタックのシステム的脆弱性へと、信頼性のボトルネックを移動させます。
論文 参考訳(メタデータ) (2026-01-20T06:42:56Z) - Multi-Agent Taint Specification Extraction for Vulnerability Detection [49.27772068704498]
コンテナ分析を使用した静的アプリケーションセキュリティテスト(SAST)ツールは、高品質な脆弱性検出結果を提供するものとして広く見なされている。
本稿では,Large Language Models (LLM) のセマンティック理解と従来の静的プログラム解析を戦略的に組み合わせたマルチエージェントシステムであるSemTaintを提案する。
私たちは、SemTaintを最先端のSASTツールであるCodeQLと統合し、これまでCodeQLで検出できなかった162の脆弱性の106を検出して、その効果を実証しています。
論文 参考訳(メタデータ) (2026-01-15T21:31:51Z) - Automated Vulnerability Validation and Verification: A Large Language Model Approach [7.482522010482827]
本稿では、生成AI、特に大規模言語モデル(LLM)を利用したエンドツーエンド多段階パイプラインを提案する。
本手法は,国立脆弱性データベース(National Vulnerability Database)のCVE開示情報から抽出する。
これは、Retrieval-Augmented Generation (RAG)を使用して、外部の公開知識(例えば、脅威アドバイザリ、コードスニペット)で拡張する。
パイプラインは生成されたアーティファクトを反復的に洗練し、テストケースでのアタック成功を検証し、複雑なマルチコンテナセットアップをサポートする。
論文 参考訳(メタデータ) (2025-09-28T19:16:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。