論文の概要: Simulating SQL Injection Vulnerability Exploitation Using Q-Learning
Reinforcement Learning Agents
- arxiv url: http://arxiv.org/abs/2101.03118v1
- Date: Fri, 8 Jan 2021 17:19:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 05:00:22.065052
- Title: Simulating SQL Injection Vulnerability Exploitation Using Q-Learning
Reinforcement Learning Agents
- Title(参考訳): Q-Learning Reinforcement Learning Agentを用いたSQL注入脆弱性の爆発シミュレーション
- Authors: Laszlo Erdodi, {\AA}vald {\AA}slaugson Sommervoll, Fabio Massimo
Zennaro
- Abstract要約: 我々は,この問題をセキュリティキャプチャ・ザ・フレーグの課題として位置づけることで,ofsqlインジェクション攻撃のダイナミクスを単純化することを検討する。
私たちは異なる強化学習エージェントをデプロイし、効果的なポリシーを学習して実行します。
その結果、セキュリティ環境における強化学習の可能性と限界の理解に寄与することを目指しています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a first formalization of the process of
exploitation of SQL injection vulnerabilities. We consider a simplification of
the dynamics of SQL injection attacks by casting this problem as a security
capture-the-flag challenge. We model it as a Markov decision process, and we
implement it as a reinforcement learning problem. We then deploy different
reinforcement learning agents tasked with learning an effective policy to
perform SQL injection; we design our training in such a way that the agent
learns not just a specific strategy to solve an individual challenge but a more
generic policy that may be applied to perform SQL injection attacks against any
system instantiated randomly by our problem generator. We analyze the results
in terms of the quality of the learned policy and in terms of convergence time
as a function of the complexity of the challenge and the learning agent's
complexity. Our work fits in the wider research on the development of
intelligent agents for autonomous penetration testing and white-hat hacking,
and our results aim to contribute to understanding the potential and the limits
of reinforcement learning in a security environment.
- Abstract(参考訳): 本稿では,SQLインジェクションの脆弱性を悪用するプロセスの最初の形式化を提案する。
我々は、この問題をセキュリティキャプチャー・ザ・フラッグの課題として捉え、SQLインジェクション攻撃のダイナミクスを単純化することを検討する。
我々はそれをマルコフ決定プロセスとしてモデル化し,強化学習問題として実装する。
我々は、エージェントが個々の課題を解決するための特定の戦略だけでなく、問題発生器によってランダムにインスタンス化されたシステムに対してsqlインジェクション攻撃を実行するために適用されるより汎用的なポリシーを学習するように、トレーニングを設計します。
課題の複雑さと学習エージェントの複雑さの関数として,学習方針の品質と収束時間の観点から結果を分析する。
私たちの研究は、自律的侵入テストとホワイトハットハッキングのためのインテリジェントエージェントの開発に関する広範な研究に当てはまり、セキュリティ環境での強化学習の可能性と限界を理解することを目的としています。
関連論文リスト
- Multi-agent Reinforcement Learning-based Network Intrusion Detection System [3.4636217357968904]
侵入検知システム(IDS)は,コンピュータネットワークのセキュリティ確保において重要な役割を担っている。
本稿では,自動,効率的,堅牢なネットワーク侵入検出が可能な,新しいマルチエージェント強化学習(RL)アーキテクチャを提案する。
我々のソリューションは、新しい攻撃の追加に対応し、既存の攻撃パターンの変更に効果的に適応するように設計されたレジリエントなアーキテクチャを導入します。
論文 参考訳(メタデータ) (2024-07-08T09:18:59Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Leveraging Sequentiality in Reinforcement Learning from a Single
Demonstration [68.94506047556412]
本稿では,複雑なロボットタスクの制御ポリシーを1つの実演で学習するために,シーケンシャルなバイアスを活用することを提案する。
本研究は, ヒューマノイド移動やスタンドアップなど, 模擬課題のいくつかを, 前例のないサンプル効率で解くことができることを示す。
論文 参考訳(メタデータ) (2022-11-09T10:28:40Z) - You Only Live Once: Single-Life Reinforcement Learning [124.1738675154651]
多くの現実世界の状況では、そのタスクを繰り返し実行できるポリシーを学ぶことではなく、単一のトライアルで1回だけ新しいタスクを成功させることが目的である。
エージェントが介入なしにひとつのエピソード内でタスクを完了しなければならない問題設定を形式化する。
本稿では,分散マッチング戦略を用いたQ$-weighted adversarial Learning (QWALE)を提案する。
論文 参考訳(メタデータ) (2022-10-17T09:00:11Z) - Option-Aware Adversarial Inverse Reinforcement Learning for Robotic
Control [44.77500987121531]
階層的模倣学習 (Hierarchical Imitation Learning, HIL) は, 長期作業における複雑度の高い動作を, 専門家による実証から再現するために提案されている。
逆逆強化学習に基づく新しいHILアルゴリズムを開発した。
また,目的をエンド・ツー・エンドで学習するための変分オートエンコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-05T00:28:26Z) - Improving robustness of jet tagging algorithms with adversarial training [56.79800815519762]
本研究では,フレーバータグ付けアルゴリズムの脆弱性について,敵攻撃による検証を行った。
シミュレーション攻撃の影響を緩和する対人訓練戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T19:57:19Z) - AGPNet -- Autonomous Grading Policy Network [0.5232537118394002]
マルコフ決定過程として問題を定式化し,エージェントと環境の相互作用を示すシミュレーションを設計する。
我々は、強化学習、行動クローニング、コントラスト学習などの手法を用いて、ハイブリッド政策を訓練する。
我々の訓練されたエージェントであるAGPNetは、人間レベルのパフォーマンスに達し、自律的なグルーピングタスクのために現在の最先端の機械学習手法より優れています。
論文 参考訳(メタデータ) (2021-12-20T21:44:21Z) - Automating Privilege Escalation with Deep Reinforcement Learning [71.87228372303453]
本研究では,エージェントの訓練に深層強化学習を用いることで,悪意あるアクターの潜在的な脅威を実証する。
本稿では,最先端の強化学習アルゴリズムを用いて,局所的な特権エスカレーションを行うエージェントを提案する。
我々のエージェントは、実際の攻撃センサーデータを生成し、侵入検知システムの訓練と評価に利用できる。
論文 参考訳(メタデータ) (2021-10-04T12:20:46Z) - Deep hierarchical reinforcement agents for automated penetration testing [0.0]
本稿では,階層構造を持つHA-DRLを用いた新しい深層強化学習アーキテクチャを提案する。
提案アーキテクチャは,従来の深層学習エージェントよりも高速かつ安定に最適な攻撃策を見出すことができる。
論文 参考訳(メタデータ) (2021-09-14T05:28:22Z) - Modeling Penetration Testing with Reinforcement Learning Using
Capture-the-Flag Challenges: Trade-offs between Model-free Learning and A
Priori Knowledge [0.0]
侵入テストは、システムに対する攻撃をシミュレートしてシステムのセキュリティを評価するためのセキュリティエクササイズである。
本稿では,フラッグハックの難しさをとらえる形で表現された,簡易な浸透試験問題に焦点を当てる。
エージェントに提供可能な事前知識の異なる形式に依存することで、この課題が緩和される可能性を示す。
論文 参考訳(メタデータ) (2020-05-26T11:23:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。