論文の概要: AEAS: Actionable Exploit Assessment System
- arxiv url: http://arxiv.org/abs/2509.17832v1
- Date: Mon, 22 Sep 2025 14:23:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 14:23:49.946748
- Title: AEAS: Actionable Exploit Assessment System
- Title(参考訳): AEAS:行動可能エクスプロイトアセスメントシステム
- Authors: Xiangmin Shen, Wenyuan Cheng, Yan Chen, Zhenyuan Li, Yuqiao Gu, Lingzhi Wang, Wencheng Zhao, Dawei Sun, Jiashui Wang,
- Abstract要約: AEASは静的解析により動作可能なエクスプロイトを評価・優先順位付けする自動システムである。
我々は、レッドチームが頻繁に遭遇する600以上の現実世界のアプリケーションから派生した5000以上の脆弱性のデータセット上でAEASを評価する。
AEASは、機能的なエクスプロイトを推奨する上で、100%トップ3の成功率を獲得し、専門家公認ランキングと強く一致している。
- 参考スコア(独自算出の注目度): 6.65975386083489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Security practitioners face growing challenges in exploit assessment, as public vulnerability repositories are increasingly populated with inconsistent and low-quality exploit artifacts. Existing scoring systems, such as CVSS and EPSS, offer limited support for this task. They either rely on theoretical metrics or produce opaque probability estimates without assessing whether usable exploit code exists. In practice, security teams often resort to manual triage of exploit repositories, which is time-consuming, error-prone, and difficult to scale. We present AEAS, an automated system designed to assess and prioritize actionable exploits through static analysis. AEAS analyzes both exploit code and associated documentation to extract a structured set of features reflecting exploit availability, functionality, and setup complexity. It then computes an actionability score for each exploit and produces ranked exploit recommendations. We evaluate AEAS on a dataset of over 5,000 vulnerabilities derived from 600+ real-world applications frequently encountered by red teams. Manual validation and expert review on representative subsets show that AEAS achieves a 100% top-3 success rate in recommending functional exploits and shows strong alignment with expert-validated rankings. These results demonstrate the effectiveness of AEAS in supporting exploit-driven vulnerability prioritization.
- Abstract(参考訳): 公開脆弱性リポジトリは、一貫性がなく、低品質なエクスプロイトアーティファクトで混雑しているため、セキュリティ実践者はエクスプロイトアセスメントの課題に直面する。
CVSSやEPSSのような既存のスコアリングシステムは、このタスクを限定的にサポートしている。
使用可能なエクスプロイトコードが存在するかどうかを判断することなく、理論的なメトリクスに依存するか、不透明な確率推定を生成する。
実際には、セキュリティチームはエクスプロイトリポジトリを手作業でトリアージすることが多い。
AEASは静的解析により動作可能なエクスプロイトを評価・優先順位付けする自動システムである。
AEASはエクスプロイトコードと関連するドキュメントの両方を分析して、エクスプロイトの可用性、機能、セットアップの複雑さを反映した構造化された機能のセットを抽出する。
次に、エクスプロイト毎にアクションビリティスコアを計算し、ランク付けされたエクスプロイトレコメンデーションを生成する。
我々は、レッドチームが頻繁に遭遇する600以上の現実世界のアプリケーションから派生した5000以上の脆弱性のデータセット上でAEASを評価する。
手作業による検証と専門家による代表的なサブセットに関するレビューは、AEASが機能的なエクスプロイトを推奨する上で、100%トップ3の成功率を達成したことを示している。
これらの結果は、エクスプロイト駆動型脆弱性優先順位付け支援におけるAEASの有効性を示す。
関連論文リスト
- VulnRepairEval: An Exploit-Based Evaluation Framework for Assessing Large Language Model Vulnerability Repair Capabilities [41.85494398578654]
VulnRepairEvalは、関数型Proof-of-Conceptエクスプロイトに固定された評価フレームワークである。
我々のフレームワークは、再現可能な微分評価を可能にする包括的でコンテナ化された評価パイプラインを提供する。
論文 参考訳(メタデータ) (2025-09-03T14:06:10Z) - CVE-Bench: A Benchmark for AI Agents' Ability to Exploit Real-World Web Application Vulnerabilities [6.752938800468733]
大規模言語モデル(LLM)エージェントは、サイバー攻撃を自律的に行う能力が高まっている。
既存のベンチマークは、抽象化されたCapture the Flagコンペティションに制限されているか、包括的なカバレッジが欠如しているため、不足している。
私たちはCVE-Benchを紹介します。CVE-Benchは、クリティカルシヴァリティ・コモン・脆弱性と露出に基づく、現実世界のサイバーセキュリティベンチマークです。
論文 参考訳(メタデータ) (2025-03-21T17:32:32Z) - PredictaBoard: Benchmarking LLM Score Predictability [50.47497036981544]
大きな言語モデル(LLM)は予測不能に失敗することが多い。
これは、安全なデプロイメントを保証する上で、大きな課題となる。
PredictaBoardは,新しいベンチマークフレームワークである。
論文 参考訳(メタデータ) (2025-02-20T10:52:38Z) - SeCodePLT: A Unified Platform for Evaluating the Security of Code GenAI [58.29510889419971]
コード生成大型言語モデル(LLM)のセキュリティリスクと能力を評価するための既存のベンチマークは、いくつかの重要な制限に直面している。
手動で検証し、高品質なシード例から始める、汎用的でスケーラブルなベンチマーク構築フレームワークを導入し、ターゲット突然変異を通じて拡張する。
このフレームワークをPython、C/C++、Javaに適用すると、44のCWEベースのリスクカテゴリと3つのセキュリティ機能にまたがる5.9k以上のサンプルデータセットであるSeCodePLTが構築されます。
論文 参考訳(メタデータ) (2024-10-14T21:17:22Z) - Jailbreaking as a Reward Misspecification Problem [80.52431374743998]
本稿では,この脆弱性をアライメントプロセス中に不特定性に対処する新たな視点を提案する。
本稿では,報酬の相違の程度を定量化し,その有効性を実証する指標ReGapを紹介する。
ReMissは、報酬ミスの空間で敵のプロンプトを生成する自動レッドチームリングシステムである。
論文 参考訳(メタデータ) (2024-06-20T15:12:27Z) - OutCenTR: A novel semi-supervised framework for predicting exploits of
vulnerabilities in high-dimensional datasets [0.0]
私たちは、悪用される可能性のある脆弱性を予測するために、外れ値検出技術を使用しています。
本稿では,ベースライン外乱検出モデルを強化する次元削減手法であるOutCenTRを提案する。
実験の結果,F1スコアの5倍の精度向上が得られた。
論文 参考訳(メタデータ) (2023-04-03T00:34:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。