論文の概要: Argus: Reorchestrating Static Analysis via a Multi-Agent Ensemble for Full-Chain Security Vulnerability Detection
- arxiv url: http://arxiv.org/abs/2604.06633v1
- Date: Wed, 08 Apr 2026 03:18:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.321343
- Title: Argus: Reorchestrating Static Analysis via a Multi-Agent Ensemble for Full-Chain Security Vulnerability Detection
- Title(参考訳): Argus: フルチェーンセキュリティ脆弱性検出のためのマルチエージェントアンサンブルによる静的解析の再構築
- Authors: Zi Liang, Qipeng Xie, Jun He, Bohuan Xue, Weizheng Wang, Yuandao Cai, Fei Luo, Boxian Zhang, Haibo Hu, Kaishun Wu,
- Abstract要約: 脆弱性検出に特化して設計された最初のマルチエージェントフレームワークであるArgusを紹介する。
包括的サプライチェーン分析、協調的マルチエージェント、Retrieval-Augmented Generation(RAG)やReActといった最先端技術の統合を含む。
Argusは、偽陽性と運用コストを同時に削減しながら、真の脆弱性の大量検出によって、既存の方法よりも大幅に優れています。
- 参考スコア(独自算出の注目度): 17.384452053454037
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advancements in Large Language Models (LLMs) have sparked interest in their application to Static Application Security Testing (SAST), primarily due to their superior contextual reasoning capabilities compared to traditional symbolic or rule-based methods. However, existing LLM-based approaches typically attempt to replace human experts directly without integrating effectively with existing SAST tools. This lack of integration results in ineffectiveness, including high rates of false positives, hallucinations, limited reasoning depth, and excessive token usage, making them impractical for industrial deployment. To overcome these limitations, we present a paradigm shift that reorchestrates the SAST workflow from current LLM-assisted structure to a new LLM-centered workflow. We introduce Argus (Agentic and Retrieval-Augmented Guarding System), the first multi-agent framework designed specifically for vulnerability detection. Argus incorporates three key novelties: comprehensive supply chain analysis, collaborative multi-agent workflows, and the integration of state-of-the-art techniques such as Retrieval-Augmented Generation (RAG) and ReAct to minimize hallucinations and enhance reasoning. Extensive empirical evaluation demonstrates that Argus significantly outperforms existing methods by detecting a higher volume of true vulnerabilities while simultaneously reducing false positives and operational costs. Notably, Argus has identified several critical zero-day vulnerabilities with CVE assignments.
- Abstract(参考訳): 近年のLLM(Large Language Models)の進歩は、従来のシンボルやルールベースの手法と比較して、コンテキスト推論能力に優れていることから、静的アプリケーションセキュリティテスト(SAST)への関心を喚起している。
しかし、既存のLSMベースのアプローチは、通常、既存のSASTツールと効果的に統合することなく、人間の専門家を直接置き換えようとしている。
この統合の欠如は、偽陽性率、幻覚、限定的な推論深さ、過剰なトークンの使用など非効率性をもたらし、産業展開には実用的でない。
これらの制約を克服するために、SASTワークフローを現在のLLM支援構造から新しいLLM中心のワークフローに再構成するパラダイムシフトを提案する。
Argus(Agentic and Retrieval-Augmented Guarding System)は,脆弱性検出に特化して設計された,最初のマルチエージェントフレームワークである。
Argusには、包括的なサプライチェーン分析、協調的なマルチエージェントワークフロー、そして幻覚を最小化し推論を強化するためにRetrieval-Augmented Generation (RAG)やReActといった最先端技術の統合という3つの重要な新機能が含まれている。
大規模な経験的評価は、Argusが偽陽性と運用コストを同時に削減しながら、真の脆弱性の大量検出によって既存の方法よりも大幅に優れていることを示している。
特にArgusは、CVEの割り当てでいくつかの重要なゼロデイ脆弱性を特定している。
関連論文リスト
- Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。
テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。
Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文 参考訳(メタデータ) (2026-03-23T14:48:54Z) - LaSER: Internalizing Explicit Reasoning into Latent Space for Dense Retrieval [74.72139580745511]
LaSERは、レトリバーの潜在空間に明示的な推論を内部化する、新しい自己蒸留フレームワークである。
提案手法は, 明示的なCoTパイプラインの推論深度と, 標準的な高密度検索器の推論効率をうまく組み合わせる。
論文 参考訳(メタデータ) (2026-03-02T04:11:18Z) - RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。
我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文 参考訳(メタデータ) (2026-01-30T08:29:01Z) - Sponge Tool Attack: Stealthy Denial-of-Efficiency against Tool-Augmented Agentic Reasoning [58.432996881401415]
最近の作業では、エージェント推論を可能にするために、外部ツールで大きな言語モデル(LLM)を拡張している。
本稿では,入力プロンプトを書き換えることのみでエージェント推論を妨害するスポンジツールアタック(STA)を提案する。
STAは、意味的忠実度の高い原文からの良心的な即興的な書き直しを生成する。
論文 参考訳(メタデータ) (2026-01-24T19:36:51Z) - MIRAGE: Misleading Retrieval-Augmented Generation via Black-box and Query-agnostic Poisoning Attacks [47.46936341268548]
Retrieval-Augmented Generation (RAG)システムでは、コーパス中毒という致命的な攻撃面が導入されている。
我々は,厳格なブラックボックスとクエリ非依存環境のために設計された,新しい多段階毒素パイプラインであるMIRAGEを提案する。
大規模な実験により、MIRAGEは攻撃効果とステルスネスの両方において既存のベースラインを著しく上回っていることが示された。
論文 参考訳(メタデータ) (2025-12-09T06:38:16Z) - ParaVul: A Parallel Large Language Model and Retrieval-Augmented Framework for Smart Contract Vulnerability Detection [43.41293570032631]
ParaVulは、スマートコントラクト脆弱性検出の信頼性と精度を向上させるための、検索強化フレームワークである。
LLM微調整のためのスパースローランド適応(SLoRA)を開発した。
脆弱性契約データセットを構築し,RAG(Retrieval-Augmented Generation)システムを開発した。
論文 参考訳(メタデータ) (2025-10-20T03:23:41Z) - CORTEX: Collaborative LLM Agents for High-Stakes Alert Triage [10.088447487211893]
SOC(Security Operations Centers)は、毎日何万ものアラートに圧倒されている。
この過負荷は警告の疲労を引き起こし、見過ごされた脅威やアナリストのバーンアウトにつながる。
警告トリアージのためのマルチエージェントLLMアーキテクチャであるCORTEXを提案する。
論文 参考訳(メタデータ) (2025-09-30T22:09:31Z) - LLM-Driven SAST-Genius: A Hybrid Static Analysis Framework for Comprehensive and Actionable Security [1.259425825328488]
本稿では,Large Language Models (LLMs) と Static Application Security Testing (SAST) の相乗効果を検討した。
LLMはコード解析やパターン認識に優れるが、矛盾や幻覚に陥りやすい。
SAST-GeniusはSem単独と比較して偽陽性を約91%(225~20)減らした。
論文 参考訳(メタデータ) (2025-09-18T21:15:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。