論文の概要: APT-Agent: Automated Penetration Testing using Large Language Models
- arxiv url: http://arxiv.org/abs/2605.24949v1
- Date: Sun, 24 May 2026 08:54:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.534604
- Title: APT-Agent: Automated Penetration Testing using Large Language Models
- Title(参考訳): APT-Agent:大規模言語モデルを用いた自動浸透試験
- Authors: William Guanting Li, Alsharif Abuadbba, Kristen Moore, Dan Dongseong Kim,
- Abstract要約: APT-Agentは自動浸透試験フレームワークで、偵察、エクスプロイト、エクスプロイトを編成する。
48.57%(スクリプト・キディ)と18.57%(PentestGPT)と比較すると、84.29%のエンド・ツー・エンドのエクスプロイト成功率を達成している。
- 参考スコア(独自算出の注目度): 7.709270067284272
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Penetration testing is essential to securing modern web infrastructures, yet traditional manual methods struggle to keep pace with their scale and complexity. Large Language Models (LLMs) offer new opportunities for automating these tasks, but existing approaches face two persistent challenges: hallucination of technical entities and insufficient long-term contextual memory. To address these issues, we present APT-Agent, a fully automated LLM-driven penetration testing framework that systematically orchestrates reconnaissance, exploitation, and exfiltration. APT-Agent introduces a hybrid rectification module to recover hallucinated commands and a command-specific memory architecture to preserve operational context across multi-step attack sequences. We evaluate our APT-Agent on Metasploitable 2 against seven vulnerable services spanning web, database, and network protocols. APT-Agent achieves an 84.29% end-to-end exploitation success rate, compared to 48.57% (Script Kiddie) and 18.57% (PentestGPT) under matched conditions. By reducing cognitive burden and minimizing reliance on human intervention, APT-Agent represents a step toward scalable, reliable, and cognitively efficient automation for penetration testing.
- Abstract(参考訳): 近代的なWebインフラストラクチャの確保には浸透テストが不可欠だが,従来の手作業の手法では,スケールや複雑性の維持に苦慮している。
大きな言語モデル(LLM)はこれらのタスクを自動化する新しい機会を提供するが、既存のアプローチでは、技術的な実体の幻覚と長期記憶の不足という2つの永続的な課題に直面している。
APT-Agentは、完全に自動化されたLCM駆動型浸透試験フレームワークで、偵察、搾取、濾過を系統的にオーケストレーションする。
APT-Agentは、幻覚コマンドを復元するためのハイブリッド修正モジュールと、マルチステップ攻撃シーケンス間の運用コンテキストを維持するためのコマンド固有のメモリアーキテクチャを導入している。
我々は、Web、データベース、ネットワークプロトコルにまたがる7つの脆弱なサービスに対して、Metasploitable 2のAPT-Agentを評価する。
APT-Agentは、48.57%(スクリプトキディ)と18.57%(PentestGPT)に対して84.29%のエンドツーエンドのエクスプロイト成功率を達成した。
認知的負担を軽減し、人間の介入への依存を最小化することにより、APT-Agentは、侵入テストのためのスケーラブルで信頼性があり、認知的に効率的な自動化に向けた一歩である。
関連論文リスト
- RetroAgent: From Solving to Evolving via Retrospective Dual Intrinsic Feedback [54.39884046754265]
RetroAgentは、エージェントが複雑なインタラクティブ環境をマスターできるオンラインRLフレームワークである。
実験の結果,RetroAgentはSOTA(State-of-the-art)の性能を達成できた。
論文 参考訳(メタデータ) (2026-03-09T16:23:33Z) - Multi-Agent Collaborative Intrusion Detection for Low-Altitude Economy IoT: An LLM-Enhanced Agentic AI Framework [60.72591149679355]
低高度経済の急速な拡大により、インターネット・オブ・モノ(LAE-IoT)ネットワークは前例のないセキュリティ上の課題を生んだ。
従来の侵入検知システムは、空中IoT環境のユニークな特徴に対処できない。
LAE-IoTネットワークにおける侵入検出を強化するための大規模言語モデル(LLM)対応エージェントAIフレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-25T12:47:25Z) - It's a TRAP! Task-Redirecting Agent Persuasion Benchmark for Web Agents [52.81924177620322]
大規模な言語モデルを利用したWebベースのエージェントは、メール管理やプロフェッショナルネットワーキングといったタスクにますます利用されている。
動的Webコンテンツへの依存は、インジェクション攻撃の引き金に弱い: インターフェース要素に隠された敵対的命令は、エージェントが元のタスクから逸脱するように説得する。
本稿では,タスクリダイレクトエージェントの説得ベンチマーク(TRAP)について紹介する。
論文 参考訳(メタデータ) (2025-12-29T01:09:10Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - VulnBot: Autonomous Penetration Testing for A Multi-Agent Collaborative Framework [4.802551205178858]
既存の大規模言語モデル(LLM)を支援または自動化した浸透テストアプローチは、しばしば非効率に悩まされる。
VulnBotは複雑なタスクを、偵察、スキャン、エクスプロイトという3つの特別なフェーズに分割する。
主なデザインの特徴は、役割の専門化、侵入経路計画、エージェント間コミュニケーション、生成的侵入行動である。
論文 参考訳(メタデータ) (2025-01-23T06:33:05Z) - PentestAgent: Incorporating LLM Agents to Automated Penetration Testing [6.815381197173165]
手動浸透試験は時間と費用がかかる。
大規模言語モデル(LLM)の最近の進歩は、浸透テストを強化する新たな機会を提供する。
我々は,新しいLLMベースの自動浸透試験フレームワークであるPentestAgentを提案する。
論文 参考訳(メタデータ) (2024-11-07T21:10:39Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。