論文の概要: CodeGuard: A Generalized and Stealthy Backdoor Watermarking for Generative Code Models
- arxiv url: http://arxiv.org/abs/2506.20926v1
- Date: Thu, 26 Jun 2025 01:14:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.933633
- Title: CodeGuard: A Generalized and Stealthy Backdoor Watermarking for Generative Code Models
- Title(参考訳): CodeGuard: ジェネレーティブコードモデルのための汎用的でステルスなバックドア透かし
- Authors: Haoxuan Li, Jiale Zhang, Xiaobing Sun, Xiapu Luo,
- Abstract要約: 実験の結果,コード要約タスクとコード生成タスクの両方において,CodeGuardが最大100%の透かし検証率を達成することがわかった。
ステルス性に関しては、CodeGuard は OnION 検出方法に対して最大 0.078 の検出率で例外的に実行している。
- 参考スコア(独自算出の注目度): 35.78974773421725
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative code models (GCMs) significantly enhance development efficiency through automated code generation and code summarization. However, building and training these models require computational resources and time, necessitating effective digital copyright protection to prevent unauthorized leaks and misuse. Backdoor watermarking, by embedding hidden identifiers, simplifies copyright verification by breaking the model's black-box nature. Current backdoor watermarking techniques face two main challenges: first, limited generalization across different tasks and datasets, causing fluctuating verification rates; second, insufficient stealthiness, as watermarks are easily detected and removed by automated methods. To address these issues, we propose CodeGuard, a novel watermarking method combining attention mechanisms with distributed trigger embedding strategies. Specifically, CodeGuard employs attention mechanisms to identify watermark embedding positions, ensuring verifiability. Moreover, by using homomorphic character replacement, it avoids manual detection, while distributed trigger embedding reduces the likelihood of automated detection. Experimental results demonstrate that CodeGuard achieves up to 100% watermark verification rates in both code summarization and code generation tasks, with no impact on the primary task performance. In terms of stealthiness, CodeGuard performs exceptionally, with a maximum detection rate of only 0.078 against ONION detection methods, significantly lower than baseline methods.
- Abstract(参考訳): 生成コードモデル(GCM)は、自動コード生成とコード要約によって開発効率を大幅に向上させる。
しかし、これらのモデルの構築と訓練には計算資源と時間が必要であり、不正なリークや誤用を防ぐために効果的なデジタル著作権保護が必要である。
バックドアの透かしは、隠れた識別子を埋め込むことで、モデルのブラックボックスの性質を壊すことで著作権の検証を単純化する。
現在のバックドア透かし技術は、2つの大きな課題に直面している。第1に、異なるタスクやデータセット間での限定的な一般化、変動する検証率、第2に、ウォーターマークが自動的な方法で容易に検出され除去されるため、ステルスネスが不十分である。
これらの問題に対処するために,注目機構と分散トリガ埋め込み戦略を組み合わせた新しい透かし方式であるCodeGuardを提案する。
具体的には、CodeGuardは、透かしの埋め込み位置を識別し、検証性を保証するために注意機構を使用している。
さらに、同型文字置換を用いて手動検出を回避し、分散トリガ埋め込みにより自動検出の可能性が低下する。
実験の結果、CodeGuardは、コード要約とコード生成タスクの両方で最大100%の透かし検証を達成でき、主要なタスクのパフォーマンスに影響を与えないことがわかった。
ステルス性という点では、CodeGuard は OnION 検出法に対して最大 0.078 の検出率で、ベースライン法よりも大幅に低い。
関連論文リスト
- Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z) - Robust and Secure Code Watermarking for Large Language Models via ML/Crypto Codesign [15.153228808457628]
RoSeMaryは、LLM生成コードを規制し、知的財産権侵害やソフトウェア開発における不適切な誤用を避ける。
検出性-忠実性-ロマンス性三目的物に付着する高品質な透かしは、符号の低エントロピーの性質のために制限される。
RoSeMaryは、コード機能を保持しながら高い検出精度を達成する。
論文 参考訳(メタデータ) (2025-02-04T07:35:28Z) - Beyond Dataset Watermarking: Model-Level Copyright Protection for Code Summarization Models [37.817691840557984]
CSMは、許可されていないユーザによる搾取のリスクに直面します。
伝統的な透かし法はトリガーと透かしの特徴を別々に設計する必要がある。
モデルレベルの新しい電子透かし埋め込み方式であるModMarkを提案する。
論文 参考訳(メタデータ) (2024-10-18T00:48:00Z) - DIP-Watermark: A Double Identity Protection Method Based on Robust Adversarial Watermark [13.007649270429493]
顔認識(FR)システムはプライバシーのリスクを引き起こす。
1つの対策は敵攻撃であり、不正な悪意のあるFRを欺くことである。
トレース可能な対角線透かしに基づく最初の二重識別保護方式を提案する。
論文 参考訳(メタデータ) (2024-04-23T02:50:38Z) - An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。
両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文 参考訳(メタデータ) (2023-07-30T13:43:27Z) - Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。
実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-24T11:49:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。