論文の概要: Detecting Prompt Injection Attacks Against Application Using Classifiers
- arxiv url: http://arxiv.org/abs/2512.12583v1
- Date: Sun, 14 Dec 2025 07:35:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.327428
- Title: Detecting Prompt Injection Attacks Against Application Using Classifiers
- Title(参考訳): 分類器を用いたアプリケーションに対するプロンプトインジェクションアタックの検出
- Authors: Safwan Shaheer, G. M. Refatul Islam, Mohammad Rafid Hamid, Md. Abrar Faiaz Khan, Md. Omar Faruk, Yaseen Nur,
- Abstract要約: この作業は、HackAprompt Playground Submissionscorpusに基づいて、プロンプトインジェクションデータセットをキュレートし、拡張する。
LSTM、フィードフォワードニューラルネットワーク、ランダムフォレスト、ネイブベイズなどいくつかの分類器をトレーニングし、Webアプリケーションの悪意のあるプロンプトを検出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Prompt injection attacks can compromise the security and stability of critical systems, from infrastructure to large web applications. This work curates and augments a prompt injection dataset based on the HackAPrompt Playground Submissions corpus and trains several classifiers, including LSTM, feed forward neural networks, Random Forest, and Naive Bayes, to detect malicious prompts in LLM integrated web applications. The proposed approach improves prompt injection detection and mitigation, helping protect targeted applications and systems.
- Abstract(参考訳): プロンプトインジェクション攻撃は、インフラから大規模なWebアプリケーションまで、重要なシステムのセキュリティと安定性を損なう可能性がある。
この研究は、HackAprompt Playground Submissionscorpusに基づいてプロンプトインジェクションデータセットをキュレートし、LSTM、フィードフォワードニューラルネットワーク、ランダムフォレスト、ネイブベイズなどいくつかの分類器を訓練し、LLM統合Webアプリケーションにおける悪意のあるプロンプトを検出する。
提案手法はインジェクションの迅速検出と緩和を改善し,対象とするアプリケーションやシステムを保護する。
関連論文リスト
- PIShield: Detecting Prompt Injection Attacks via Intrinsic LLM Features [33.95073302161128]
既存のプロンプトインジェクション検出法は、しばしば準最適性能および/または高い計算オーバーヘッドを持つ。
本稿では,有効かつ効率的に検出できるPIShieldを提案する。
PIShieldは高効率かつ効率的であり,既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-15T18:34:49Z) - SecInfer: Preventing Prompt Injection via Inference-time Scaling [54.21558811232143]
emphSecInferは,インセンジェンス時間スケーリングに基づくインジェクション攻撃に対する新しい防御法である。
SecInferは、既存のインジェクション攻撃と適応的なインジェクション攻撃の両方を効果的に軽減し、最先端の防御と既存の推論時間スケーリングアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2025-09-29T16:00:41Z) - Enhancing Security in LLM Applications: A Performance Evaluation of Early Detection Systems [1.03590082373586]
迅速なインジェクション攻撃では、攻撃者はシステム命令を悪意を持って操作し、システムの機密性を侵害する。
本研究では,早期インジェクション検出システムの性能について検討し,様々なオープンソースソリューションで実装された技術の検出性能に着目した。
本研究は, 突発的漏洩検出手法の異なる解析方法と, それらの手法を実装した複数の検出方法の比較分析を行った。
論文 参考訳(メタデータ) (2025-06-23T20:39:43Z) - DataSentinel: A Game-Theoretic Detection of Prompt Injection Attacks [87.66245688589977]
LLM統合されたアプリケーションとエージェントは、インジェクション攻撃に弱い。
検出方法は、入力が注入プロンプトによって汚染されているかどうかを判定することを目的とする。
本研究では,迅速なインジェクション攻撃を検出するゲーム理論手法であるDataSentinelを提案する。
論文 参考訳(メタデータ) (2025-04-15T16:26:21Z) - Prompt Injection Detection and Mitigation via AI Multi-Agent NLP Frameworks [0.0]
本稿では,プロンプトインジェクションの脆弱性に対処するためのマルチエージェントNLPフレームワークを提案する。
このフレームワークは、レスポンスの生成、アウトプットの衛生化、ポリシーコンプライアンスの実施のための特別なエージェントを編成する。
論文 参考訳(メタデータ) (2025-03-14T15:41:45Z) - PromptShield: Deployable Detection for Prompt Injection Attacks [1.8146155083014202]
本稿では、デプロイ可能なプロンプトインジェクション検出器のトレーニングと評価のためのベンチマークであるPromptShieldを紹介する。
我々のベンチマークは慎重にキュレートされ、対話型データとアプリケーション構造化データの両方を含んでいる。
我々の研究は、トレーニングデータとより大きなモデルの慎重なキュレーションが、強力な検出器性能に寄与することを示唆している。
論文 参考訳(メタデータ) (2025-01-25T09:03:19Z) - Not what you've signed up for: Compromising Real-World LLM-Integrated
Applications with Indirect Prompt Injection [64.67495502772866]
大規模言語モデル(LLM)は、様々なアプリケーションに統合されつつある。
本稿では、プロンプトインジェクション攻撃を用いて、攻撃者が元の命令をオーバーライドし、制御を採用する方法を示す。
我々は、コンピュータセキュリティの観点から、影響や脆弱性を体系的に調査する包括的な分類法を導出する。
論文 参考訳(メタデータ) (2023-02-23T17:14:38Z) - A Novel Online Incremental Learning Intrusion Prevention System [2.5234156040689237]
本稿では,自己組織型インクリメンタルニューラルネットワークとサポートベクトルマシンを併用したネットワーク侵入防止システムを提案する。
提案システムは,その構造上,シグネチャやルールに依存しないセキュリティソリューションを提供するとともに,既知の攻撃や未知の攻撃を高精度にリアルタイムに軽減することができる。
論文 参考訳(メタデータ) (2021-09-20T13:30:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。