論文の概要: PenTest2.0: Towards Autonomous Privilege Escalation Using GenAI
- arxiv url: http://arxiv.org/abs/2507.06742v1
- Date: Wed, 09 Jul 2025 10:56:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.558997
- Title: PenTest2.0: Towards Autonomous Privilege Escalation Using GenAI
- Title(参考訳): PenTest2.0: GenAIを使用した自律的なプリヴィリエジエスカレーションを目指す
- Authors: Haitham S. Al-Sinani, Chris J. Mitchell,
- Abstract要約: PenTest++は、自動化と倫理的ハッキングをサポートする生成AIを組み合わせたAI拡張システムである。
PenTest2.0は、Large Language Model推論によって完全に駆動される自動特権エスカレーションをサポートする。
動作方法を説明し、概念実証のプロトタイプを提示し、その利点と限界について議論する。
- 参考スコア(独自算出の注目度): 2.3020018305241337
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Ethical hacking today relies on highly skilled practitioners executing complex sequences of commands, which is inherently time-consuming, difficult to scale, and prone to human error. To help mitigate these limitations, we previously introduced 'PenTest++', an AI-augmented system combining automation with generative AI supporting ethical hacking workflows. However, a key limitation of PenTest++ was its lack of support for privilege escalation, a crucial element of ethical hacking. In this paper we present 'PenTest2.0', a substantial evolution of PenTest++ supporting automated privilege escalation driven entirely by Large Language Model reasoning. It also incorporates several significant enhancements: 'Retrieval-Augmented Generation', including both one-line and offline modes; 'Chain-of-Thought' prompting for intermediate reasoning; persistent 'PenTest Task Trees' to track goal progression across turns; and the optional integration of human-authored hints. We describe how it operates, present a proof-of-concept prototype, and discuss its benefits and limitations. We also describe application of the system to a controlled Linux target, showing it can carry out multi-turn, adaptive privilege escalation. We explain the rationale behind its core design choices, and provide comprehensive testing results and cost analysis. Our findings indicate that 'PenTest2.0' represents a meaningful step toward practical, scalable, AI-automated penetration testing, whilst highlighting the shortcomings of generative AI systems, particularly their sensitivity to prompt structure, execution context, and semantic drift, reinforcing the need for further research and refinement in this emerging space. Keywords: AI, Ethical Hacking, Privilege Escalation, GenAI, ChatGPT, LLM (Large Language Model), HITL (Human-in-the-Loop)
- Abstract(参考訳): 今日では倫理的ハッキングは、複雑なコマンド列を実行する熟練した実践者に依存している。
これらの制限を緩和するために、私たちは以前、自動化と倫理的ハッキングワークフローをサポートする生成AIを組み合わせたAI強化システムである'PenTest++'を導入しました。
しかし、PenTest++の重要な制限は、倫理的ハッキングの重要な要素である特権エスカレーションのサポートの欠如であった。
本稿では,大規模言語モデルによる自動エスカレーションをサポートするPenTest++の大幅な進化であるPenTest2.0について述べる。
また、ワンラインモードとオフラインモードの両方を含む'Retrieval-Augmented Generation'、中間的推論を促す'Chain-of-Thought'、ターン間のゴールの進行を追跡する'PenTest Task Trees'、人間が許可したヒントをオプションで統合する'PenTest Task Trees'など、いくつかの重要な機能拡張も含まれている。
動作方法を説明し、概念実証のプロトタイプを提示し、その利点と限界について議論する。
また、制御されたLinuxターゲットへのシステム適用について記述し、マルチターンで適応的な特権エスカレーションを実行できることを示す。
中心となる設計選択の根拠を説明し、包括的なテスト結果とコスト分析を提供する。
この結果から,「PenTest2.0」は,AI自動浸透テストの実践的,スケーラブル化に向けた重要なステップであり,生成AIシステムの欠点,特に構造,実行状況,セマンティックドリフトに対する感受性を強調しつつ,この新興分野におけるさらなる研究と改良の必要性を高めている。
キーワード: AI, Ethical Hacking, Privilege Escalation, GenAI, ChatGPT, LLM (Large Language Model), HITL (Human-in-the-Loop)
関連論文リスト
- SciMaster: Towards General-Purpose Scientific AI Agents, Part I. X-Master as Foundation: Can We Lead on Humanity's Last Exam? [51.112225746095746]
本稿では,人間研究者をエミュレートするツール強化推論エージェントであるX-Masterを紹介する。
XマスターズはHumanity's Last Examに32.1%のスコアで最新記録を樹立した。
論文 参考訳(メタデータ) (2025-07-07T17:50:52Z) - Generative AI Act II: Test Time Scaling Drives Cognition Engineering [28.818378991228563]
2024年現在)は、モデルが知識検索システムからテスト時間スケーリング技術を通じて思考構築エンジンへ移行している場所である。
この新たなパラダイムは、言語に基づく思考を通じて、AIとマインドレベルなつながりを確立する。
包括的なチュートリアルと最適化された実装を通じて、これらの先進的なアプローチを体系的に分解する。
論文 参考訳(メタデータ) (2025-04-18T17:55:58Z) - General Scales Unlock AI Evaluation with Explanatory and Predictive Power [57.7995945974989]
ベンチマークはAIの進歩を導くものだが、汎用AIシステムには限られた説明力と予測力を提供している。
私たちは、一般的なAIベンチマークが実際に何を計測しているかを説明することができる、AI評価のための一般的な尺度を紹介します。
私たちの完全に自動化された方法論は、飽和しない一般的なスケールにインスタンス要求を配置する18の新しく作られたルーリックの上に構築されます。
論文 参考訳(メタデータ) (2025-03-09T01:13:56Z) - PenTest++: Elevating Ethical Hacking with AI and Automation [2.3020018305241337]
PenTest++はAIの拡張されたシステムで、自動化と生成AI(GenAI)を統合し、倫理的ハッキングを最適化する。
自動化と人間の監視のバランスを保ち、重要な段階での意思決定を確実にします。
論文 参考訳(メタデータ) (2025-02-13T16:46:23Z) - Hacking, The Lazy Way: LLM Augmented Pentesting [0.0]
我々は、"Pentest Copilot"というツールを使って、"LLM Augmented Pentesting"という新しい概念を紹介した。
提案手法は, LLMを用いて特定のサブタスクを自動化することにより, 浸透試験における自動化に対する従来の抵抗を克服することに焦点を当てる。
Pentest Copilotは、テストツールの利用、アウトプットの解釈、フォローアップアクションの提案など、タスクの卓越した熟練度を示す。
論文 参考訳(メタデータ) (2024-09-14T17:40:35Z) - Genetic Auto-prompt Learning for Pre-trained Code Intelligence Language Models [54.58108387797138]
コードインテリジェンスタスクにおける即時学習の有効性について検討する。
既存の自動プロンプト設計手法は、コードインテリジェンスタスクに限られている。
本稿では、精巧な遺伝的アルゴリズムを用いてプロンプトを自動設計する遺伝的オートプロンプト(GenAP)を提案する。
論文 参考訳(メタデータ) (2024-03-20T13:37:00Z) - Generative Input: Towards Next-Generation Input Methods Paradigm [49.98958865125018]
我々はGeneInputという新しい生成入力パラダイムを提案する。
すべての入力シナリオと他のインテリジェントな補助入力関数を処理するためにプロンプトを使用し、ユーザーフィードバックでモデルを最適化し、パーソナライズされた結果を提供する。
その結果,FK2C(Full-mode Key-sequence to Characters)タスクにおいて,最先端のパフォーマンスを初めて達成したことを示す。
論文 参考訳(メタデータ) (2023-11-02T12:01:29Z) - Exploration with Principles for Diverse AI Supervision [88.61687950039662]
次世代の予測を用いた大規模トランスフォーマーのトレーニングは、AIの画期的な進歩を生み出した。
この生成AIアプローチは印象的な結果をもたらしたが、人間の監督に大きく依存している。
この人間の監視への強い依存は、AIイノベーションの進歩に重大なハードルをもたらす。
本稿では,高品質なトレーニングデータを自律的に生成することを目的とした,探索型AI(EAI)という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-10-13T07:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。