論文の概要: Adversarial SQL Injection Generation with LLM-Based Architectures
- arxiv url: http://arxiv.org/abs/2605.11188v1
- Date: Mon, 11 May 2026 19:52:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.394529
- Title: Adversarial SQL Injection Generation with LLM-Based Architectures
- Title(参考訳): LLMアーキテクチャによる逆SQLインジェクション生成
- Authors: Ali Karakoc, H. Birkan Yilmaz,
- Abstract要約: sqlインジェクション攻撃は、Open Worldwide Application Security Project (OWASP)トップ10の脅威の中で、依然として深刻な攻撃の1つです。
人工知能(AI)の進歩、特にLarge Language Models(LLM)では、防御機構を測定するために敵攻撃テストを自動化する機会が生み出されている。
我々は2つの新しいLCMベースのシステム、Retrieval Augmented Generation for Adrial SQLi(RADAGAS)とRefleXQLi(RefleXQLi)を紹介する。
我々のテストは240の実験から成り、24万のペイロードを生成し、WAFに対して2200万のテストを実行した。
- 参考スコア(独自算出の注目度): 0.15122029613508317
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: SQL injection (SQLi) attacks are still one of the serious attacks ranked in the Open Worldwide Application Security Project (OWASP) Top 10 threats. Today, with advances in Artificial Intelligence (AI), especially in Large Language Models (LLMs), an opportunity has been created for automating adversarial attack tests to measure the defense mechanisms. In this paper, we aim to create a comprehensive evaluation of use cases that utilize LLMs for adversarial SQL injection generation. We introduce two novel LLM-based systems, Retrieval Augmented Generation for Adversarial SQLi (RADAGAS) and Reflective Chain-of-Thought SQLi (RefleXQLi), and compare them with existing baselines against 10 Web Application Firewalls (WAFs) and one execution-based MySQL validator. To perform a comprehensive test, we used six rule-based open-source WAFs (ModSecurity PL1--3, Coraza PL1--3), 2 AI/ML-based WAFs (WAF Brain, CNN-WAF), and 2 commercial WAFs (AWS WAF and Cloudflare WAF). For the LLM models, we used GPT-4o, Claude 3.7 Sonnet, and DeepSeek R1. Our tests consist of 240 experiments that generate 240,000 payloads and perform 2.2 million tests against WAFs. Our comprehensive evaluation reveals that RADAGAS-GPT4o outperforms other baseline models with a 22.73\% bypass rate. The proposed RADAGAS variants are highly successful on AI/ML-based WAFs (92.49\% on WAF-Brain by RADAGAS-DeepSeek, 80.48\% on CNN-WAF by RADAGAS-Claude), but struggle to bypass rule-based WAFs (0--5.70\% on ModSecurity and Coraza). In addition to these findings, another observation is that creating less diverse payloads achieves more bypasses, however they show poor results if the initially chosen payload is not successful. We observe that our findings provide a comprehensive view on using LLM-based approaches in security testing.
- Abstract(参考訳): SQLインジェクション(SQLi)攻撃は、Open Worldwide Application Security Project(OWASP)トップ10の脅威の中で、依然として深刻な攻撃の1つです。
今日、人工知能(AI)の進歩、特にLarge Language Models(LLM)において、防御機構を測定するために敵の攻撃テストを自動化する機会が生み出されている。
本稿では,LLMを逆SQLインジェクション生成に利用するユースケースを総合的に評価することを目的とする。
本稿では,Retrieval Augmented Generation for Adversarial SQLi (RADAGAS) と Reflective Chain-of-Thought SQLi (RefleXQLi) の2つの新しいLCMベースのシステムを紹介し,既存のベースラインと10のWeb Application Firewall (WAF) と1つの実行ベースのMySQLバリデータを比較した。
包括的なテストを行うには、ルールベースのオープンソースWAF(ModSecurity PL1--3, Coraza PL1--3)、2つのAI/MLベースのWAF(WAF Brain, CNN-WAF)、2つの商用WAF(AWS WAF, Cloudflare WAF)を使用しました。
LLMモデルでは、GPT-4o、Claude 3.7 Sonnet、DeepSeek R1を使用しました。
我々のテストは240の実験から成り、24万のペイロードを生成し、WAFに対して2200万のテストを実行した。
総括評価の結果,RADAGAS-GPT4oは22.73倍のバイパス率で他のベースラインモデルよりも優れていた。
提案されたRADAGASはAI/MLベースのWAF(RADAGAS-DeepSeekによるWAF-Brainの92.49 %、RADAGAS-ClaudeによるCNN-WAFの80.48 %)で高い成功を収めているが、ルールベースのWAF(ModSecurityとColazaの0--5.70 %)をバイパスするのに苦労している。
これらの発見に加えて、より多様なペイロードを作成することは、より多くのバイパスを達成するが、初期選択されたペイロードが成功しなかった場合、結果は不十分である。
この結果から, LLM を用いたセキュリティテストの総合的な評価が得られた。
関連論文リスト
- SecureMCP: A Policy-Enforced LLM Data Access Framework for AIoT Systems via Model Context Protocol [0.17188280334580194]
本稿ではポリシー強化LLMデータアクセスフレームワークSecureMCPを提案する。
ロールベースアクセス制御(RBAC)をMPPサーバに組み込んで多層防御を確立する。
82.3%の政策コンプライアンスを2,400の敵クエリで達成し、真の防衛失敗は3.4%に制限されている。
論文 参考訳(メタデータ) (2026-05-06T04:58:52Z) - Revisiting Backdoor Attacks on LLMs: A Stealthy and Practical Poisoning Framework via Harmless Inputs [54.90315421117162]
完全無害データを用いた新しい毒殺法を提案する。
自己回帰型LPMの因果推論に着想を得て,トリガーと肯定的応答プレフィックスの堅牢な関連性を確立することを目指す。
LLMは最初は同意するように見えるが,その後回答を拒む興味深い抵抗現象を観察する。
論文 参考訳(メタデータ) (2025-05-23T08:13:59Z) - Evaluating and Improving the Robustness of Security Attack Detectors Generated by LLMs [6.517076600304129]
大規模言語モデル(LLM)は、セキュリティ要件を実装するアタック検出器などの関数を生成するために、ソフトウェア開発でますます使われている。
本稿では,LLMパイプラインに検索拡張生成(RAG)とセルフランキングを統合するアプローチを提案する。
RAGは外部知識源を取り入れて出力の堅牢性を高める一方、自己整合性の概念にインスパイアされたセルフランキング技術は複数の推論経路を生成し、最も堅牢な検出器を選択するランクを生成する。
論文 参考訳(メタデータ) (2024-11-27T10:48:37Z) - Fine-tuned Large Language Models (LLMs): Improved Prompt Injection Attacks Detection [6.269725911814401]
大きな言語モデル(LLM)は、幅広い言語ベースのタスクに対処する能力が大きく進歩しているため、人気ツールになりつつある。
しかし、LSMのアプリケーションはインジェクション攻撃に対して非常に脆弱であり、致命的な問題を引き起こす。
このプロジェクトでは,インジェクションのインジェクション攻撃に関連するセキュリティ脆弱性について検討する。
論文 参考訳(メタデータ) (2024-10-28T00:36:21Z) - SecAlign: Defending Against Prompt Injection with Preference Optimization [52.48001255555192]
敵のプロンプトは外部のデータソースに注入され、システムの意図した命令をオーバーライドし、悪意のある命令を実行する。
我々は、好みの最適化技術に基づくSecAlignと呼ばれる新しいディフェンスを提案する。
本手法は,訓練中に見られたものよりもはるかに高度な攻撃に対しても,様々なプロンプトインジェクションの成功率を10%に下げる。
論文 参考訳(メタデータ) (2024-10-07T19:34:35Z) - Tensor Trust: Interpretable Prompt Injection Attacks from an Online Game [86.66627242073724]
本稿では,126,000以上のプロンプトインジェクションと46,000以上のプロンプトベースのプロンプトインジェクションに対する「防御」のデータセットを提案する。
我々の知る限り、これは現在、命令追従 LLM に対する人間生成の敵例の最大のデータセットである。
また、データセットを使用して、2種類のプロンプトインジェクションに対する耐性のベンチマークを作成し、これをプロンプト抽出とプロンプトハイジャックと呼ぶ。
論文 参考訳(メタデータ) (2023-11-02T06:13:36Z) - From Prompt Injections to SQL Injection Attacks: How Protected is Your LLM-Integrated Web Application? [4.361862281841999]
本稿では,Langchainフレームワークに基づくWebアプリケーションを対象としたP$$インジェクションの総合的な検討を行う。
以上の結果から,Langchain をベースとした LLM 統合アプリケーションは P$$ のインジェクション攻撃の影響を受けやすいことが示唆された。
本稿では,Langchainフレームワークの拡張として統合可能な4つの効果的な防御手法を提案する。
論文 参考訳(メタデータ) (2023-08-03T19:03:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。