論文の概要: Securing Code Understanding: Detecting Natural Backdoor Vulnerability in Code Language Models
- arxiv url: http://arxiv.org/abs/2606.10846v1
- Date: Tue, 09 Jun 2026 13:28:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.03727
- Title: Securing Code Understanding: Detecting Natural Backdoor Vulnerability in Code Language Models
- Title(参考訳): コード理解のセキュア: コード言語モデルにおける自然なバックドア脆弱性の検出
- Authors: Yuchen Chen, Weisong Sun, Haocheng Huang, Yuan Xiao, Chunrong Fang, Yiran Zhang, Tingting Xu, Zhenpeng Chen, An Guo, Peizhuo Lv, Xiaofang Zhang, Zhenyu Chen, Yang Liu, Baowen Xu,
- Abstract要約: コード言語モデル(Code Language Models、CodeLM)は、ソフトウェア工学に不可欠なものとなり、コードインテリジェンスタスクを大幅に進歩させた。
近年の研究では、CodeLMsで天然のバックドアと呼ばれる天然のバックドアが発見されている。
CodeLMの自然なバックドア脆弱性のセキュリティへの影響は、まだよく分かっていない。
- 参考スコア(独自算出の注目度): 34.77167315339711
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Code Language Models (CodeLMs) have become integral to software engineering, significantly advancing code intelligence tasks. However, their widespread adoption has raised critical security concerns, particularly regarding susceptibility to backdoor attacks. Recent studies have uncovered naturally occurring backdoors, referred to as natural backdoors, in normally trained deep learning models. Despite posing threats as serious as those introduced through data poisoning, security implications of natural backdoor vulnerabilities in CodeLMs remain poorly understood. In this paper, we conduct a thorough empirical study of natural backdoor vulnerabilities in CodeLMs across various model architectures and code intelligence tasks. Specifically, we examine potential natural backdoor vulnerabilities across 44 scenarios, demonstrating that natural backdoors are prevalent and intrinsic to CodeLMs. We reveal differences between injected and natural backdoor vulnerabilities at both the model and parameter levels. We then analyze the transferability of natural backdoor vulnerabilities from three perspectives: datasets, model architectures, and shared knowledge. We further investigate the causes of natural backdoors from two aspects: training datasets and the model training procedure. We evaluate existing backdoor defense techniques, including pre-training, in-training, and post-training defenses, in mitigating natural backdoors. Finally, we propose ScanNBT, a novel detection method designed to improve comprehensive detection of natural backdoor vulnerabilities in CodeLMs. We aim for our findings to enhance understanding of these vulnerabilities and provide insights for strengthening CodeLM security against backdoor threats.
- Abstract(参考訳): コード言語モデル(Code Language Models、CodeLM)は、ソフトウェア工学に不可欠なものとなり、コードインテリジェンスタスクを大幅に進歩させた。
しかし、その普及により、特にバックドア攻撃への感受性に関する重要なセキュリティ上の懸念が持ち上がっている。
近年の研究では、通常訓練されたディープラーニングモデルにおいて、天然のバックドアと呼ばれる自然に発生するバックドアが発見されている。
データ中毒によって導入されたものほど深刻な脅威を訴えているにもかかわらず、CodeLMの自然なバックドア脆弱性のセキュリティへの影響はいまだに理解されていない。
本稿では,さまざまなモデルアーキテクチャやコードインテリジェンスタスクを対象とした,CodeLMのバックドア脆弱性に関する実証的研究を行う。
具体的には、44のシナリオにまたがる潜在的な自然のバックドア脆弱性を調査し、自然のバックドアがCodeLMに固有のものであることを示す。
モデルレベルとパラメータレベルの両方において、注入されたバックドア脆弱性と自然なバックドア脆弱性の違いを明らかにする。
次に、データセット、モデルアーキテクチャ、共有知識という3つの視点から、自然なバックドア脆弱性の転送可能性を分析します。
さらに、トレーニングデータセットとモデルトレーニング手順の2つの側面から、自然なバックドアの原因について検討する。
自然のバックドアを緩和するために,プレトレーニング,イントレーニング,ポストトレーニングディフェンスなどの既存のバックドアディフェンス技術を評価した。
最後に,ScanNBTを提案する。ScanNBTは,CodeLMの自然なバックドア脆弱性の包括的検出を改善するために設計された,新しい検出手法である。
我々は,これらの脆弱性の理解を深め,バックドアの脅威に対するCodeLMセキュリティを強化するための洞察を提供することを目的としている。
関連論文リスト
- BackdoorVLM: A Benchmark for Backdoor Attacks on Vision-Language Models [63.5775877701015]
textbfBackdoorVLMは視覚言語モデル(VLM)に対するバックドア攻撃を評価するための最初の総合的なベンチマークである。
BackdoorVLMは、マルチモーダルなバックドア脅威を、ターゲットされた拒絶、悪意のある注入、ジェイルブレイク、コンセプト置換、知覚的ハイジャックの5つのカテゴリに分類する。
2つのオープンソースのVLMと3つのマルチモーダルデータセットでテストし、テキスト、画像、バイモーダルトリガにまたがる12の代表的な攻撃手法を用いて、これらの脅威を評価する。
論文 参考訳(メタデータ) (2025-11-24T09:30:38Z) - Backdoor Unlearning by Linear Task Decomposition [69.91984435094157]
ファンデーションモデルは、敵の摂動と標的のバックドア攻撃に非常に敏感である。
既存のバックドア除去アプローチは、有害な振る舞いをオーバーライドするために、コストのかかる微調整に依存している。
このことは、バックドアがモデルの一般的な能力を損なうことなく取り除けるかどうかという問題を提起する。
論文 参考訳(メタデータ) (2025-10-16T16:18:07Z) - Lethe: Purifying Backdoored Large Language Models with Knowledge Dilution [49.78359632298156]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクにおいて優れたパフォーマンスを達成し、大幅な進歩を遂げている。
標準クエリではモデルが正常に動作しますが、特定のトリガがアクティブになると、有害な応答や意図しない出力を生成します。
本稿では,LLMからのバックドアの挙動を知識希釈により除去する新しい手法LETHEを提案する。
論文 参考訳(メタデータ) (2025-08-28T17:05:18Z) - Neutralizing Backdoors through Information Conflicts for Large Language Models [20.6331157117675]
大規模言語モデル(LLM)からバックドアの挙動を除去する新しい手法を提案する。
軽量なデータセットを使用してコンフリクトモデルをトレーニングし、バックドアモデルとマージして悪意のある振る舞いを中和します。
我々は、90%以上のクリーンデータ精度を維持しながら、高度なバックドア攻撃の攻撃成功率を最大98%削減することができる。
論文 参考訳(メタデータ) (2024-11-27T12:15:22Z) - Injecting Undetectable Backdoors in Obfuscated Neural Networks and Language Models [39.34881774508323]
外部の専門家企業が開発したMLモデルにおいて,検出不能なバックドアによる脅威について検討する。
我々は,難読性難読化の概念のセキュリティ性を満足する,難読化ニューラルネットワークにバックドアを植える戦略を開発した。
バックドアを植える手法は, 難読化モデルの重量や構造がアクセス可能である場合でも, バックドアの存在が検出できないことを保証している。
論文 参考訳(メタデータ) (2024-06-09T06:26:21Z) - Backdoor Vulnerabilities in Normally Trained Deep Learning Models [23.821348581095105]
本研究は,通常訓練されたモデルにおいて,20種類のバックドア攻撃をガイダンスとして活用し,その対応性について検討する。
インターネットからダウンロードされる56のモデルには、315の自然のバックドアがあり、あらゆるカテゴリがカバーされています。
既存のスキャナーは、注入されたバックドア用に設計されており、少なくとも65個のバックドアを検知することができる。
論文 参考訳(メタデータ) (2022-11-29T04:55:32Z) - Untargeted Backdoor Attack against Object Detection [69.63097724439886]
我々は,タスク特性に基づいて,無目標で毒のみのバックドア攻撃を設計する。
攻撃によって、バックドアがターゲットモデルに埋め込まれると、トリガーパターンでスタンプされたオブジェクトの検出を失う可能性があることを示す。
論文 参考訳(メタデータ) (2022-11-02T17:05:45Z) - Turn the Combination Lock: Learnable Textual Backdoor Attacks via Word
Substitution [57.51117978504175]
最近の研究では、ニューラルネットワーク処理(NLP)モデルがバックドア攻撃に弱いことが示されている。
バックドアを注入すると、モデルは通常、良質な例で実行されるが、バックドアがアクティブになったときに攻撃者が特定した予測を生成する。
単語置換の学習可能な組み合わせによって活性化される見えないバックドアを提示する。
論文 参考訳(メタデータ) (2021-06-11T13:03:17Z) - Backdoor Learning: A Survey [75.59571756777342]
バックドア攻撃はディープニューラルネットワーク(DNN)に隠れたバックドアを埋め込む
バックドア学習は、急速に成長する研究分野である。
本稿では,この領域を包括的に調査する。
論文 参考訳(メタデータ) (2020-07-17T04:09:20Z) - Backdoors in Neural Models of Source Code [13.960152426268769]
ソースコードの深層学習の文脈でバックドアを研究する。
このようなバックドアをインストールするためにデータセットに毒を盛る方法を示す。
また、バックドアの注入の容易さと、それを除去する能力も示しています。
論文 参考訳(メタデータ) (2020-06-11T21:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。