論文の概要: CodeSentinel: A Three-Layer Defense Against Indirect Prompt Injection in Code Contexts
- arxiv url: http://arxiv.org/abs/2606.19235v1
- Date: Wed, 17 Jun 2026 16:12:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.261463
- Title: CodeSentinel: A Three-Layer Defense Against Indirect Prompt Injection in Code Contexts
- Title(参考訳): CodeSentinel: コードコンテキストにおける間接プロンプト注入に対する3層防御
- Authors: Po-Han Cheng, Chia-Mu Yu, Ying-Dar Lin, Yu-Sung Wu, Wei-Bin Lee,
- Abstract要約: コード大言語モデルは、リポジトリ、ドキュメント、発行スレッド、コーディングエージェント環境から外部のコードコンテキストをますます取り出す。
我々は3層推論時サニタイザであるCodeSentinelを提案する。
Tree-sitterを使用して、高リスクモデル対応のCSTノードを抽出し、構文誘導事前フィルタリング、CST誘導動的Min-K%スコアリング、ノード摂動解析を組み合わせて、敵対的かつ自然なセマンティックトリガを検出する。
CodeSentinelは平均ノードレベルF1.80に達し、CodeGarrison、DePA、KillBadCodeを上回っている。
- 参考スコア(独自算出の注目度): 9.504326240833267
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Code large language models increasingly retrieve external code context from repositories, documentation, issue threads, and coding-agent environments, creating an indirect prompt-injection surface where attackers hide instructions in comments, strings, identifiers, or decoy code. We propose CodeSentinel, a three-layer inference-time sanitizer. It uses Tree-sitter to extract high-risk model-facing CST nodes, then combines syntax-guided pre-filtering, CST-guided Dynamic Min-K\% scoring, and node perturbation analysis to detect adversarial and natural-looking semantic triggers. Detected nodes are removed or neutralized before reaching the downstream Code LLM. Across six recent attack families, \CodeSentinel achieves 0.80 average node-level F1, outperforming CodeGarrison, DePA, and KillBadCode.
- Abstract(参考訳): コード大言語モデルは、リポジトリ、ドキュメント、発行スレッド、コーディングエージェント環境から外部コードコンテキストを検索し、攻撃者がコメント、文字列、識別子、デコイコードで命令を隠す間接的なプロンプトインジェクションサーフェスを作成する。
我々は3層推論時サニタイザであるCodeSentinelを提案する。
Tree-sitterを使用して、高リスクモデル対応のCSTノードを抽出し、構文誘導前フィルタリング、CST誘導動的Min-K\%スコア、およびノード摂動解析を組み合わせて、敵対的かつ自然なセマンティックトリガを検出する。
検出されたノードは、下流のコードLLMに到達する前に削除または中和される。
最近の6つの攻撃ファミリの中で、‘CodeSentinel’は平均ノードレベルF1が0.80に達し、CodeGarrison、DePA、KilBadCodeを上回っている。
関連論文リスト
- From Attack Simulation to SIEM Rule: Deterministic Detection-as-Code Synthesis with Probe-Level Traceability [51.56484100374058]
セキュリティチームは、自身のシステムに対する攻撃をシミュレートして、監視が真の侵入者を捕まえるかどうかをチェックする。
人間はそのギャップを手でブリッジし、それぞれの発見を読み、対応するシグマルールを書きます。
ロックされたコーパスからプローブが引き出されると,この変換が部分的に自動化されることを示す。
論文 参考訳(メタデータ) (2026-06-03T14:26:25Z) - Do not copy and paste! Rewriting strategies for code retrieval [0.7710436567988378]
本研究では,スタイリスティック・リフレッシング,NL強化PseudoCode,およびフル自然言語転写の3つの書き直し戦略の階層構造について検討する。
我々は,NLに富んだPseudoCodeとスニペットレベルの自然言語を,一貫した中間体ではなく直接検索表現として評価した。
我々は,デルタH,トークンエントロピー,デルタHの2つの診断手法を導入し,デルタHが3つのリライターファミリーのQC下での検索ゲインを予測することを示す。
論文 参考訳(メタデータ) (2026-05-08T11:31:26Z) - Detecting Data Poisoning in Code Generation LLMs via Black-Box, Vulnerability-Oriented Scanning [12.405265138053329]
コード生成大型言語モデル(LLM)は、現代のソフトウェア開発にますます統合されている。
既存のスキャンアプローチは、トークンレベルの生成一貫性に依存して、攻撃ターゲットを反転させる。
CodeScanは、コード生成モデルに合わせた最初の中毒検出フレームワークである。
論文 参考訳(メタデータ) (2026-03-17T22:08:45Z) - The Trojan Knowledge: Bypassing Commercial LLM Guardrails via Harmless Prompt Weaving and Adaptive Tree Search [58.8834056209347]
大規模言語モデル(LLM)は、有害な出力を誘導するために安全ガードレールをバイパスするジェイルブレイク攻撃に弱いままである。
CKA-Agent(Correlated Knowledge Attack Agent)は、ターゲットモデルの知識基盤の適応的木構造探索としてジェイルブレイクを再構成する動的フレームワークである。
論文 参考訳(メタデータ) (2025-12-01T07:05:23Z) - From Solitary Directives to Interactive Encouragement! LLM Secure Code Generation by Natural Language Prompting [24.27542373791212]
SecCodeは、テキストのみのNLプロンプトでセキュアなコード生成のために、革新的なインタラクティブな励ましプロンプト(EP)技術を活用するフレームワークである。
1) NL Prompts を用いたコード生成,2) コード脆弱性の検出と修正,提案したプロモーションプロンプトの利用,3) 脆弱性のクロスチェッキングとコードセキュリティリファインメント。
論文 参考訳(メタデータ) (2024-10-18T09:32:08Z) - ShadowCode: Towards (Automatic) External Prompt Injection Attack against Code LLMs [56.46702494338318]
本稿では,コード指向の大規模言語モデルに対する(自動)外部プロンプトインジェクションという,新たな攻撃パラダイムを紹介する。
コードシミュレーションに基づいて誘導摂動を自動生成する,シンプルで効果的な方法であるShadowCodeを提案する。
3つの人気のあるプログラミング言語にまたがる31の脅威ケースを発生させるため、13の異なる悪意のある目標に対して本手法を評価した。
論文 参考訳(メタデータ) (2024-07-12T10:59:32Z) - SCALE: Constructing Structured Natural Language Comment Trees for Software Vulnerability Detection [36.37244302912536]
本稿では,事前学習モデルに基づく構造化自然言語コメント木に基づくvulnerAbiLity dEtectionフレームワークを提案する。
提案したStructured Natural Language Comment Tree (SCT)は、コードステートメントのセマンティクスとコード実行シーケンスを統合する。
論文 参考訳(メタデータ) (2024-03-28T02:20:03Z) - Certifying LLM Safety against Adversarial Prompting [70.96868018621167]
大規模言語モデル(LLM)は、入力プロンプトに悪意のあるトークンを追加する敵攻撃に対して脆弱である。
我々は,認証された安全保証とともに,敵のプロンプトを防御する最初の枠組みである消去・チェックを導入する。
論文 参考訳(メタデータ) (2023-09-06T04:37:20Z) - COSEA: Convolutional Code Search with Layer-wise Attention [90.35777733464354]
我々は、畳み込みニューラルネットワークを階層的注意で活用し、コード固有の構造論理をキャプチャする新しいディープラーニングアーキテクチャ、COSEAを提案する。
COSEAは、コード検索タスクの最先端メソッドよりも大幅に改善できる。
論文 参考訳(メタデータ) (2020-10-19T13:53:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。