論文の概要: AutoEG: Exploiting Known Third-Party Vulnerabilities in Black-Box Web Applications
- arxiv url: http://arxiv.org/abs/2604.00704v1
- Date: Wed, 01 Apr 2026 10:07:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.935835
- Title: AutoEG: Exploiting Known Third-Party Vulnerabilities in Black-Box Web Applications
- Title(参考訳): AutoEG: Black-Box Webアプリケーションで既知のサードパーティの脆弱性を爆発させる
- Authors: Ruozhao Yang, Mingfei Cheng, Gelei Deng, Junjie Wang, Tianwei Zhang, Xiaofei Xie,
- Abstract要約: AutoEGは、ブラックボックスWebアプリケーションをターゲットとした生成を悪用するための、完全に自動化されたフレームワークである。
我々は、攻撃目標29の104の現実世界の脆弱性に対してAutoEGを評価し、660のエクスプロイトタスクと55,440のエクスプロイトの試みを行った。
- 参考スコア(独自算出の注目度): 30.68819474524929
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large-scale web applications are widely deployed with complex third-party components, inheriting security risks arising from component vulnerabilities. Security assessment is therefore required to determine whether such known vulnerabilities remain practically exploitable in real applications. Penetration testing is a widely adopted approach that validates exploitability by launching concrete attacks against known vulnerabilities in real-world black-box systems. However, existing approaches often fail to automatically generate reliable exploits, limiting their effectiveness in practical security assessment. This limitation mainly stems from two issues: (1) precisely triggering vulnerabilities with correct technical details, and (2) adapting exploits to diverse real-world deployment settings. In this paper, we propose AutoEG, a fully automated multi-agent framework for exploit generation targeting black-box web applications. AutoEG has two phases: First, AutoEG extracts precise vulnerability trigger logic from unstructured vulnerability information and encapsulates it into reusable trigger functions. Second, AutoEG uses trigger functions for concrete attack objectives and iteratively refines exploits through feedback-driven interaction with the target application. We evaluate AutoEG on 104 real-world vulnerabilities with 29 attack objectives, resulting in 660 exploitation tasks and 55,440 exploit attempts. AutoEG achieves an average success rate of 82.41%, substantially outperforming state-of-the-art baselines, whose best performance reaches only 32.88%.
- Abstract(参考訳): 大規模なWebアプリケーションは複雑なサードパーティコンポーネントで広くデプロイされており、コンポーネントの脆弱性に起因するセキュリティリスクを継承する。
したがって、セキュリティアセスメントは、そのような既知の脆弱性が実際のアプリケーションで実際に悪用されるかどうかを判断するために必要である。
侵入テストは、現実世界のブラックボックスシステムにおける既知の脆弱性に対する具体的な攻撃を起動することで、悪用性を検証する、広く採用されているアプローチである。
しかし、既存のアプローチは、しばしば信頼性の高いエクスプロイトを自動的に生成することができず、実際のセキュリティアセスメントにおける有効性を制限している。
この制限は主に、(1)正確な技術的詳細で脆弱性を正確にトリガーすること、(2)様々な現実世界のデプロイメント設定にエクスプロイトを適用すること、の2つの問題に起因している。
本稿では,ブラックボックスWebアプリケーションを対象とした自動マルチエージェントフレームワークであるAutoEGを提案する。
まず、AutoEGは構造化されていない脆弱性情報から正確な脆弱性トリガーロジックを抽出し、再利用可能なトリガー関数にカプセル化する。
第2に、AutoEGは具体的な攻撃目的のためにトリガー関数を使用し、ターゲットアプリケーションとのフィードバック駆動インタラクションを通じてエクスプロイトを反復的に洗練する。
我々は、攻撃目標29の104の現実世界の脆弱性に対してAutoEGを評価し、660のエクスプロイトタスクと55,440のエクスプロイトの試みを行った。
AutoEGは平均成功率82.41%を達成し、最先端のベースラインをほぼ上回り、最高のパフォーマンスは32.88%に達した。
関連論文リスト
- Automated Red-Teaming Framework for Large Language Model Security Assessment: A Comprehensive Attack Generation and Detection System [4.864011355064205]
本稿では,大規模言語モデル(LLM)におけるセキュリティ脆弱性を明らかにするための,敵のプロンプトを生成し,実行し,評価する自動リピートフレームワークを提案する。
本フレームワークは,メタプロンプトに基づく攻撃合成,マルチモーダル脆弱性検出,および6つの主要な脅威カテゴリにまたがる標準化された評価プロトコルを統合する。
GPT-OSS-20Bモデルの実験では、21の重大度と12の新たな攻撃パターンを含む47の異なる脆弱性が明らかになった。
論文 参考訳(メタデータ) (2025-12-21T19:12:44Z) - Jailbreak Mimicry: Automated Discovery of Narrative-Based Jailbreaks for Large Language Models [0.0]
大規模言語モデル(LLM)は、高度な迅速なエンジニアリング攻撃に対して脆弱なままである。
我々は、物語ベースのジェイルブレイクプロンプトを自動生成するために、コンパクトアタッカーモデルを訓練するための体系的方法論であるジェイルブレイク・ミミミリを紹介する。
我々のアプローチは、敵の迅速な発見を手作業の職人技から再現可能な科学的プロセスに変換する。
論文 参考訳(メタデータ) (2025-10-24T23:53:16Z) - Agentic Discovery and Validation of Android App Vulnerabilities [8.298163888812233]
既存のAndroidの脆弱性検出ツールは、何千もの低信号警告でチームを圧倒している。
アナリストはこれらの結果をトリガして、セキュリティパイプラインのボトルネックを発生させるのに何日も費やしている。
セキュリティの専門家がAndroidの脆弱性を分析し、検証する方法を反映したシステムであるA2を紹介する。
論文 参考訳(メタデータ) (2025-08-29T12:32:35Z) - Mind the Gap: Time-of-Check to Time-of-Use Vulnerabilities in LLM-Enabled Agents [4.303444472156151]
大規模言語モデル(LLM)対応エージェントは、広範囲のアプリケーションで急速に出現している。
本研究は,LSM対応エージェントにおけるTOCTOU(time-of-use)脆弱性に関する最初の研究である。
我々は,このタイプの脆弱性を評価するために設計された,66の現実的なユーザタスクを備えたベンチマークTOCTOU-Benchを紹介する。
論文 参考訳(メタデータ) (2025-08-23T22:41:49Z) - WebGuard: Building a Generalizable Guardrail for Web Agents [59.31116061613742]
WebGuardは、Webエージェントアクションリスクの評価をサポートするために設計された最初のデータセットである。
その中には、22のドメインにわたる193のWebサイトからの4,939の人手によるアノテートアクションが含まれている。
論文 参考訳(メタデータ) (2025-07-18T18:06:27Z) - OpenAgentSafety: A Comprehensive Framework for Evaluating Real-World AI Agent Safety [58.201189860217724]
OpenAgentSafetyは,8つの危機リスクカテゴリにまたがるエージェントの動作を評価する包括的なフレームワークである。
従来の作業とは異なり、我々のフレームワークは、Webブラウザ、コード実行環境、ファイルシステム、bashシェル、メッセージングプラットフォームなど、実際のツールと対話するエージェントを評価します。
ルールベースの分析とLSM-as-judgeアセスメントを組み合わせることで、過度な行動と微妙な不安全行動の両方を検出する。
論文 参考訳(メタデータ) (2025-07-08T16:18:54Z) - SafeAgent: Safeguarding LLM Agents via an Automated Risk Simulator [77.86600052899156]
LLM(Large Language Model)ベースのエージェントは、現実のアプリケーションにますますデプロイされる。
完全自動合成データ生成によるエージェント安全性を体系的に向上する最初のフレームワークであるAutoSafeを提案する。
AutoSafeは安全性のスコアを平均で45%向上させ、現実世界のタスクでは28.91%の改善を実現している。
論文 参考訳(メタデータ) (2025-05-23T10:56:06Z) - When Authentication Is Not Enough: On the Security of Behavioral-Based Driver Authentication Systems [53.2306792009435]
我々はランダムフォレストとリカレントニューラルネットワークアーキテクチャに基づく2つの軽量ドライバ認証システムを開発した。
我々は,SMARTCANとGANCANという2つの新しいエスケープアタックを開発することで,これらのシステムに対する攻撃を最初に提案する。
コントリビューションを通じて、これらのシステムを安全に採用する実践者を支援し、車の盗難を軽減し、ドライバーのセキュリティを高める。
論文 参考訳(メタデータ) (2023-06-09T14:33:26Z) - Autosploit: A Fully Automated Framework for Evaluating the
Exploitability of Security Vulnerabilities [47.748732208602355]
Autosploitは脆弱性の悪用性を評価するためのフレームワークだ。
環境の異なる設定でエクスプロイトを自動的にテストする。
ノイズレス環境とノイズの多い環境の両方で脆弱性を悪用する能力に影響を与えるシステムの特性を識別することができる。
論文 参考訳(メタデータ) (2020-06-30T18:49:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。