論文の概要: Towards Automated Pentesting with Large Language Models
- arxiv url: http://arxiv.org/abs/2604.11772v1
- Date: Mon, 13 Apr 2026 17:41:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.727781
- Title: Towards Automated Pentesting with Large Language Models
- Title(参考訳): 大規模言語モデルによる自動テストに向けて
- Authors: Ricardo Bessa, Rui Claro, João Trindade, João Lourenço,
- Abstract要約: 大きな言語モデル(LLM)は、人間の介入を最小限に抑えた有害なマシンコードの生成を可能にすることで、攻撃的なサイバーセキュリティを再定義している。
Microsoft Windowsの脆弱性をターゲットとした悪意のあるコードを生成するフレームワークであるRedShellを紹介する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are redefining offensive cybersecurity by allowing the generation of harmful machine code with minimal human intervention. While attackers take advantage of dark LLMs such as XXXGPT and WolfGPT to produce malicious code, ethical hackers can follow similar approaches to automate traditional pentesting workflows. In this work, we present RedShell, a privacy-preserving, hardware-efficient framework that leverages fine-tuned LLMs to assist pentesters in generating offensive PowerShell code targeting Microsoft Windows vulnerabilities. RedShell was trained on a malicious PowerShell dataset from the literature, which we further enhanced with manually curated code samples. Experiments show that our framework achieves over 90% syntactic validity in generated samples and strong semantic alignment with reference pentesting snippets, outperforming state-of-the-art counterparts in distance metrics such as edit distance (above 50% average code similarity). Additionally, functional experiments emphasize the execution reliability of the snippets produced by RedShell in a testing scenario that mirrors real-world settings. This work sheds light on the state-of-the-art research in the field of Generative AI applied to malicious code generation and automated testing, acknowledging the potential benefits that LLMs hold within controlled environments such as pentesting.
- Abstract(参考訳): 大きな言語モデル(LLM)は、人間の介入を最小限に抑えた有害なマシンコードの生成を可能にすることで、攻撃的なサイバーセキュリティを再定義している。
攻撃者は悪意のあるコードを生成するためにXXXGPTやWolfGPTのような暗いLLMを利用するが、倫理的ハッカーは従来のペンテスティングワークフローを自動化するために同様のアプローチに従うことができる。
本研究では,Microsoft Windowsの脆弱性をターゲットとした攻撃的PowerShellコード生成において,ペンテスタを支援するために,微調整LDMを活用する,プライバシ保護とハードウェア効率のよいフレームワークであるRedShellを紹介する。
RedShellは、文献から悪意のあるPowerShellデータセットでトレーニングされ、手動でキュレートされたコードサンプルでさらに強化しました。
実験により,本フレームワークは,生成したサンプルの90%以上の構文的妥当性と参照ペインティングスニペットとの強いセマンティックアライメントを実現し,編集距離(平均コード類似度50%以上)などの距離測定における最先端の手法よりも優れていた。
さらに、機能実験では、実世界の設定を反映したテストシナリオにおいて、RedShellによって生成されたスニペットの実行信頼性を強調している。
この研究は、悪意のあるコード生成と自動テストに適用されるジェネレーティブAIの分野における最先端の研究に光を当て、LLMがペンテスティングのような制御された環境で保持する潜在的なメリットを認めている。
関連論文リスト
- RedShell: A Generative AI-Based Approach to Ethical Hacking [0.0]
倫理的ハッカーが悪意のあるコードを生成できるようにするツールであるRedShellを提案する。
本実験は, 構文的に有効となるRedShellの強力な性能を示し, 生成したサンプルの10%以下で解析誤差が生じることを示した。
この研究は、Pentestingに適用されたジェネレーティブAIの分野における最先端の研究に光を当て、将来の進歩の足掛かりとなる。
論文 参考訳(メタデータ) (2026-04-13T14:10:44Z) - Detecting PowerShell-based Fileless Cryptojacking Attacks Using Machine Learning [0.09320657506524148]
シークレットジャック攻撃は、Windows OS環境におけるシンベースのエクスプロイトに基づくステルステクニックによって効果的になった。
AST(Abstracttax Tree)ベースの微調整のCodeBERTは高いリコール率を達成した。
論文 参考訳(メタデータ) (2026-02-20T15:32:15Z) - RealSec-bench: A Benchmark for Evaluating Secure Code Generation in Real-World Repositories [58.32028251925354]
LLM(Large Language Models)は、コード生成において顕著な能力を示しているが、セキュアなコードを生成する能力は依然として重要で、未調査の領域である。
我々はRealSec-benchを紹介します。RealSec-benchは、現実世界の高リスクなJavaリポジトリから慎重に構築されたセキュアなコード生成のための新しいベンチマークです。
論文 参考訳(メタデータ) (2026-01-30T08:29:01Z) - Lightweight Yet Secure: Secure Scripting Language Generation via Lightweight LLMs [14.355160053196824]
大規模言語モデル(LLM)は、コード生成、脆弱性検出、PythonやJavaScriptなどの言語の自動修正において、強力な機能を示している。
SecGenEval-PSは,セキュアなスクリプティング生成,セキュリティ解析,自動修復においてLLMを評価するために設計されたベンチマークである。
モデルセキュリティ機能を強化するために,データ合成と微調整を組み合わせたフレームワークPSSecを提案する。
論文 参考訳(メタデータ) (2026-01-10T04:00:56Z) - Trust Me, I Know This Function: Hijacking LLM Static Analysis using Bias [3.178301843099705]
大規模言語モデル(LLM)は、自動化されたコードレビューと静的解析を大規模に実行するようにますます信頼されている。
本稿では,LLMに基づくコード解析において重要な脆弱性を特定し,活用する。
我々は、FPA(Familiar Pattern Attack)をターゲットコードに検出し、注入する、完全に自動化されたブラックボックスアルゴリズムを開発した。
論文 参考訳(メタデータ) (2025-08-24T13:42:48Z) - ObscuraCoder: Powering Efficient Code LM Pre-Training Via Obfuscation Grounding [60.37988508851391]
言語モデル(LM)は、コード記述ツールボックスのベースとなっている。
Code-LMの事前学習目標の変更を探求する研究は、データ効率の向上と構文とセマンティクスの相互接続性の向上を目的としており、顕著に不十分である。
本研究では,Code-LMが表面的な構文を超越し,事前学習したサンプルの効率を高めるために,難読化コードの基盤について検討する。
論文 参考訳(メタデータ) (2025-03-27T23:08:53Z) - AutoPT: How Far Are We from the End2End Automated Web Penetration Testing? [54.65079443902714]
LLMによって駆動されるPSMの原理に基づく自動浸透試験エージェントであるAutoPTを紹介する。
以上の結果から, AutoPT は GPT-4o ミニモデル上でのベースラインフレームワーク ReAct よりも優れていた。
論文 参考訳(メタデータ) (2024-11-02T13:24:30Z) - ShadowCode: Towards (Automatic) External Prompt Injection Attack against Code LLMs [56.46702494338318]
本稿では,コード指向の大規模言語モデルに対する(自動)外部プロンプトインジェクションという,新たな攻撃パラダイムを紹介する。
コードシミュレーションに基づいて誘導摂動を自動生成する,シンプルで効果的な方法であるShadowCodeを提案する。
3つの人気のあるプログラミング言語にまたがる31の脅威ケースを発生させるため、13の異なる悪意のある目標に対して本手法を評価した。
論文 参考訳(メタデータ) (2024-07-12T10:59:32Z) - LLMs as Hackers: Autonomous Linux Privilege Escalation Attacks [0.0]
我々は,完全に自動化されたLanguage Models(LLM)駆動の,自動Linux特権エスカレーション攻撃用プロトタイプであるHackingBuddyGPTを紹介する。
GPT-4-Turboは高い有効性を示し,33~83%の脆弱性を悪用した。
論文 参考訳(メタデータ) (2023-10-17T17:15:41Z) - AutoDAN: Generating Stealthy Jailbreak Prompts on Aligned Large Language Models [54.95912006700379]
本稿では,大規模言語モデルに対する新たなジェイルブレイク攻撃であるAutoDANを紹介する。
AutoDANは、慎重に設計された階層型遺伝的アルゴリズムによって、ステルスなジェイルブレイクプロンプトを自動的に生成できる。
論文 参考訳(メタデータ) (2023-10-03T19:44:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。