Fugu-MT 論文翻訳(概要): Red-MIRROR: Agentic LLM-based Autonomous Penetration Testing with Reflective Verification and Knowledge-augmented Interaction

論文の概要: Red-MIRROR: Agentic LLM-based Autonomous Penetration Testing with Reflective Verification and Knowledge-augmented Interaction

arxiv url: http://arxiv.org/abs/2603.27127v1
Date: Sat, 28 Mar 2026 04:34:09 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-31 23:18:44.799082
Title: Red-MIRROR: Agentic LLM-based Autonomous Penetration Testing with Reflective Verification and Knowledge-augmented Interaction
Title（参考訳）: Red-MIRROR: 反射的検証と知識付加インタラクションを用いたエージェントLDMによる自律貫入試験
Authors: Tran Vy Khang, Nguyen Dang Nguyen Khang, Nghi Hoang Khoa, Do Thi Thu Hien, Van-Hau Pham, Phan The Duy,
Abstract要約: 本稿では,新しいマルチエージェント自動浸透試験システムであるRed-MIRRORを提案する。 Red-MIRRORは、エージェント間推論を明示的に管理するために、密結合したメモリリフレクションバックボーンを導入している。 XBOWベンチマークとVulhub CVEの実証評価は、Red-MIRRORが最先端エージェントに匹敵するパフォーマンスを達成することを示している。
参考スコア（独自算出の注目度）: 0.42222053626544365
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Web applications remain the dominant attack surface in cybersecurity, where vulnerabilities such as SQL injection, XSS, and business logic flaws continue to cause significant data breaches. While penetration testing is effective for identifying these weaknesses, traditional manual approaches are time-consuming and heavily dependent on scarce expert knowledge. Recent Large Language Models (LLM)-based multi-agent systems have shown promise in automating penetration testing, yet they still suffer from critical limitations: over-reliance on parametric knowledge, fragmented session memory, and insufficient validation of attack payloads and responses. This paper proposes Red-MIRROR, a novel multi-agent automated penetration testing system that introduces a tightly coupled memory-reflection backbone to explicitly govern inter-agent reasoning. By synthesizing Retrieval-Augmented Generation (RAG) for external knowledge augmentation, a Shared Recurrent Memory Mechanism (SRMM) for persistent state management, and a Dual-Phase Reflection mechanism for adaptive validation, Red-MIRROR provides a robust solution for complex web exploitation. Empirical evaluation on the XBOW benchmark and Vulhub CVEs shows that Red-MIRROR achieves performance comparable to state-of-the-art agents on Vulhub scenarios, while demonstrating a clear advantage on the XBOW benchmark. On the XBOW benchmark, Red-MIRROR attains an overall success rate of 86.0 percent, outperforming PentestAgent (50.0 percent), AutoPT (46.0 percent), and the VulnBot baseline (6.0 percent). Furthermore, the system achieves a 93.99 percent subtask completion rate, indicating strong long-horizon reasoning and payload refinement capability. Finally, we discuss ethical implications and propose safeguards to mitigate misuse risks.
Abstract（参考訳）: サイバーセキュリティにおけるWebアプリケーションは、SQLインジェクションやXSS、ビジネスロジックの欠陥といった脆弱性が重大なデータ漏洩を引き起こし続けている。浸透テストはこれらの弱点を特定するのに有効であるが、従来の手作業のアプローチは時間を要するため、専門家の知識不足に大きく依存している。近年のLarge Language Models(LLM)ベースのマルチエージェントシステムは、侵入テストの自動化を約束しているが、パラメトリック知識への過度な依存、セッションメモリの断片化、攻撃ペイロードとレスポンスの不十分な検証といった、重大な制限に悩まされている。本稿では,マルチエージェント自動浸透試験システムであるRed-MIRRORを提案する。 Retrieval-Augmented Generation(RAG)を外部知識強化のために合成し、状態管理のための共有リカレントメモリメカニズム(SRMM)と適応検証のための2相反射機構により、Red-MIRRORは複雑なWeb利用のための堅牢なソリューションを提供する。 XBOWベンチマークとVulhub CVEの実証的な評価は、Red-MIRRORが、Vulhubシナリオの最先端エージェントに匹敵するパフォーマンスを達成し、XBOWベンチマークで明らかな優位性を示していることを示している。 XBOWベンチマークでは、PentestAgent(50.0%)、AutoPT(46.0%)、VulnBotベースライン(6.0%)を上回り、全体の成功率86.0パーセントに達した。さらに、このシステムは93.99%のサブタスク完了率を達成し、強力なロングホライゾン推論とペイロード改善能力を示している。最後に、倫理的含意について議論し、誤用リスクを軽減するための安全策を提案する。

関連論文リスト

AWE: Adaptive Agents for Dynamic Web Penetration Testing [0.0]
AWEは、自動Web侵入テストのためのメモリ拡張マルチエージェントフレームワークである。軽量なLLMオーケストレーション層に、構造化された脆弱性固有の分析パイプラインを組み込む。 AWEはインジェクションクラスの脆弱性を大幅に向上させる。
論文参考訳（メタデータ） (2026-03-01T07:32:42Z)
ReasAlign: Reasoning Enhanced Safety Alignment against Prompt Injection Attack [52.17935054046577]
本稿では、間接的インジェクション攻撃に対する安全性アライメントを改善するためのモデルレベルのソリューションであるReasAlignを提案する。 ReasAlignには、ユーザクエリの分析、競合する命令の検出、ユーザの意図したタスクの継続性を維持するための構造化された推論ステップが組み込まれている。
論文参考訳（メタデータ） (2026-01-15T08:23:38Z)
Automated Red-Teaming Framework for Large Language Model Security Assessment: A Comprehensive Attack Generation and Detection System [4.864011355064205]
本稿では,大規模言語モデル(LLM)におけるセキュリティ脆弱性を明らかにするための,敵のプロンプトを生成し,実行し,評価する自動リピートフレームワークを提案する。本フレームワークは,メタプロンプトに基づく攻撃合成,マルチモーダル脆弱性検出,および6つの主要な脅威カテゴリにまたがる標準化された評価プロトコルを統合する。 GPT-OSS-20Bモデルの実験では、21の重大度と12の新たな攻撃パターンを含む47の異なる脆弱性が明らかになった。
論文参考訳（メタデータ） (2025-12-21T19:12:44Z)
MAVUL: Multi-Agent Vulnerability Detection via Contextual Reasoning and Interactive Refinement [9.377934769326416]
MAVULは、コンテキスト推論と対話的洗練を統合した、新しいマルチエージェント脆弱性検出システムである。その結果,MAVULは従来のマルチエージェントシステムよりも62%以上の精度で,単エージェントシステムでは600%以上の性能で性能が優れていた。
論文参考訳（メタデータ） (2025-09-30T22:21:43Z)
D-REX: A Benchmark for Detecting Deceptive Reasoning in Large Language Models [62.83226685925107]
Deceptive Reasoning Exposure Suite (D-REX)は、モデルの内部推論プロセスと最終的な出力との相違を評価するために設計された、新しいデータセットである。 D-REXの各サンプルには、敵システムプロンプト、エンドユーザーのテストクエリ、モデルの一見無害な応答、そして重要なことに、モデルの内部チェーンが含まれている。我々は、D-REXが既存のモデルと安全メカニズムに重大な課題をもたらすことを実証した。
論文参考訳（メタデータ） (2025-09-22T15:59:40Z)
VulAgent: Hypothesis-Validation based Multi-Agent Vulnerability Detection [55.957275374847484]
VulAgentは仮説検証に基づくマルチエージェント脆弱性検出フレームワークである。セマンティクスに敏感なマルチビュー検出パイプラインを実装しており、それぞれが特定の分析の観点から一致している。平均して、VulAgentは全体的な精度を6.6%改善し、脆弱性のある固定されたコードペアの正確な識別率を最大450%向上させ、偽陽性率を約36%削減する。
論文参考訳（メタデータ） (2025-09-15T02:25:38Z)
AI Agentic Vulnerability Injection And Transformation with Optimized Reasoning [2.918225266151982]
AVIATORはAIによる最初の脆弱性注入ワークフローである。高忠実で多様な大規模な脆弱性データセット生成のために、現実的でカテゴリ固有の脆弱性を自動的に注入する。セマンティック分析、LoRAベースのファインチューニングとRetrieval-Augmented Generationで強化されたインジェクション合成、静的解析とLLMベースの識別器によるインジェクション後の検証を組み合わせる。
論文参考訳（メタデータ） (2025-08-28T14:59:39Z)
Jailbreaking as a Reward Misspecification Problem [80.52431374743998]
本稿では,この脆弱性をアライメントプロセス中に不特定性に対処する新たな視点を提案する。本稿では,報酬の相違の程度を定量化し,その有効性を実証する指標ReGapを紹介する。 ReMissは、報酬ミスの空間で敵のプロンプトを生成する自動レッドチームリングシステムである。
論文参考訳（メタデータ） (2024-06-20T15:12:27Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。