論文の概要: AutoPentester: An LLM Agent-based Framework for Automated Pentesting
- arxiv url: http://arxiv.org/abs/2510.05605v1
- Date: Tue, 07 Oct 2025 06:02:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.120003
- Title: AutoPentester: An LLM Agent-based Framework for Automated Pentesting
- Title(参考訳): AutoPentester: 自動テストのためのLLMエージェントベースのフレームワーク
- Authors: Yasod Ginige, Akila Niroshan, Sajal Jain, Suranga Seneviratne,
- Abstract要約: 本稿では,ペンテストプロセスを自動化する新しいエージェントベースのフレームワークAutoPentesterを提案する。
ターゲットIPが与えられた後、AutoPentesterは、イテレーティブプロセスで共通のセキュリティツールを使用して、自動的にテスト手順を実行する。
サブタスク完了率が27.0%向上し、より少ないステップで脆弱性カバレッジが39.5%向上した。
- 参考スコア(独自算出の注目度): 1.0312951426012829
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Penetration testing and vulnerability assessment are essential industry practices for safeguarding computer systems. As cyber threats grow in scale and complexity, the demand for pentesting has surged, surpassing the capacity of human professionals to meet it effectively. With advances in AI, particularly Large Language Models (LLMs), there have been attempts to automate the pentesting process. However, existing tools such as PentestGPT are still semi-manual, requiring significant professional human interaction to conduct pentests. To this end, we propose a novel LLM agent-based framework, AutoPentester, which automates the pentesting process. Given a target IP, AutoPentester automatically conducts pentesting steps using common security tools in an iterative process. It can dynamically generate attack strategies based on the tool outputs from the previous iteration, mimicking the human pentester approach. We evaluate AutoPentester using Hack The Box and custom-made VMs, comparing the results with the state-of-the-art PentestGPT. Results show that AutoPentester achieves a 27.0% better subtask completion rate and 39.5% more vulnerability coverage with fewer steps. Most importantly, it requires significantly fewer human interactions and interventions compared to PentestGPT. Furthermore, we recruit a group of security industry professional volunteers for a user survey and perform a qualitative analysis to evaluate AutoPentester against industry practices and compare it with PentestGPT. On average, AutoPentester received a score of 3.93 out of 5 based on user reviews, which was 19.8% higher than PentestGPT.
- Abstract(参考訳): 侵入テストと脆弱性評価は、コンピュータシステムを保護するための重要な産業プラクティスである。
サイバー脅威が規模と複雑さを増すにつれ、テストの需要は急増し、効果的にそれを満たすための人間のプロフェッショナルの能力を上回っている。
AI、特にLarge Language Models(LLMs)の進歩により、ペンテストプロセスの自動化が試みられている。
しかし、PentestGPTのような既存のツールは、まだ半マニュアルであり、ペンテストを行うためには、有能な人間のインタラクションが必要である。
そこで本研究では, ペンテスティングプロセスを自動化する, LLM エージェントベースの新しいフレームワーク AutoPentester を提案する。
ターゲットIPが与えられた後、AutoPentesterは、イテレーティブプロセスで共通のセキュリティツールを使用して、自動的にテスト手順を実行する。
以前のイテレーションから出力したツールに基づいて攻撃戦略を動的に生成し、人間のペンタスターアプローチを模倣する。
我々は、Hack The BoxとカスタムメイドのVMを使用してAutoPentesterを評価し、その結果を最先端のPentestGPTと比較した。
その結果、AutoPentesterは27.0%のサブタスク完了率、39.5%の脆弱性カバレッジを達成した。
最も重要なことは、PentestGPTと比較して、人間のインタラクションや介入をはるかに少なくすることです。
さらに、ユーザ調査のためにセキュリティ業界のプロフェッショナルボランティアのグループを募集し、AutoPentesterを業界慣行に対して質的な分析を行い、PentestGPTと比較する。
ユーザーレビューによると、AutoPentesterのスコアは5点中3.93点であり、PentestGPTより19.8%高い。
関連論文リスト
- Look Before You Leap: A GUI-Critic-R1 Model for Pre-Operative Error Diagnosis in GUI Automation [83.92224427735859]
実際の実行に先立って効果的なフィードバックを提供する事前の批判機構を導入する。
そこで我々は,GUI-Critic-TrainとGUI-Critic-Testを作成するために,推論ブートストラップに基づくデータ収集パイプラインを開発した。
我々のモデルは、現在のMLLMと比較して、批評家の精度に大きな利点をもたらす。
論文 参考訳(メタデータ) (2025-06-05T04:12:36Z) - AegisLLM: Scaling Agentic Systems for Self-Reflective Defense in LLM Security [74.22452069013289]
AegisLLMは、敵の攻撃や情報漏洩に対する協調的なマルチエージェント防御である。
テスト時のエージェント推論システムのスケーリングは,モデルの有用性を損なうことなく,ロバスト性を大幅に向上させることを示す。
アンラーニングやジェイルブレイクを含む主要な脅威シナリオに対する総合的な評価は、AegisLLMの有効性を示している。
論文 参考訳(メタデータ) (2025-04-29T17:36:05Z) - General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。
私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。
私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文 参考訳(メタデータ) (2025-03-09T01:13:56Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - Towards Automated Penetration Testing: Introducing LLM Benchmark, Analysis, and Improvements [1.4433703131122861]
本稿では,大規模言語モデル(LLM)を用いた自動浸透試験のためのオープンベンチマークを提案する。
GPT-4o や LLama 3.1-405B などの LLM の性能を最先端の PentestGPT ツールを用いて評価した。
LLama 3.1 は GPT-4o 以上のエッジを実証するが, 両モデルとも, 最小限の人的支援を伴っても, エンド・ツー・エンドの浸透試験を行なわなかった。
論文 参考訳(メタデータ) (2024-10-22T16:18:41Z) - AutoPenBench: Benchmarking Generative Agents for Penetration Testing [42.681170697805726]
本稿では,自動貫入試験における生成エージェント評価のためのオープンベンチマークであるAutoPenBenchを紹介する。
エージェントが攻撃しなければならない脆弱性のあるシステムを表す33のタスクを含む包括的フレームワークを提案する。
完全自律型と半自律型という2つのエージェントアーキテクチャをテストすることで,AutoPenBenchのメリットを示す。
論文 参考訳(メタデータ) (2024-10-04T08:24:15Z) - Hacking, The Lazy Way: LLM Augmented Pentesting [0.0]
我々は、"Pentest Copilot"というツールを使って、"LLM Augmented Pentesting"という新しい概念を紹介した。
提案手法は, LLMを用いて特定のサブタスクを自動化することにより, 浸透試験における自動化に対する従来の抵抗を克服することに焦点を当てる。
Pentest Copilotは、テストツールの利用、アウトプットの解釈、フォローアップアクションの提案など、タスクの卓越した熟練度を示す。
論文 参考訳(メタデータ) (2024-09-14T17:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。