Fugu-MT 論文翻訳(概要): CodeGuard: A Generalized and Stealthy Backdoor Watermarking for Generative Code Models

論文の概要: CodeGuard: A Generalized and Stealthy Backdoor Watermarking for Generative Code Models

arxiv url: http://arxiv.org/abs/2506.20926v1
Date: Thu, 26 Jun 2025 01:14:35 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-27 19:53:09.933633
Title: CodeGuard: A Generalized and Stealthy Backdoor Watermarking for Generative Code Models
Title（参考訳）: CodeGuard: ジェネレーティブコードモデルのための汎用的でステルスなバックドア透かし
Authors: Haoxuan Li, Jiale Zhang, Xiaobing Sun, Xiapu Luo,
Abstract要約: 実験の結果,コード要約タスクとコード生成タスクの両方において,CodeGuardが最大100%の透かし検証率を達成することがわかった。ステルス性に関しては、CodeGuard は OnION 検出方法に対して最大 0.078 の検出率で例外的に実行している。
参考スコア（独自算出の注目度）: 35.78974773421725
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative code models (GCMs) significantly enhance development efficiency through automated code generation and code summarization. However, building and training these models require computational resources and time, necessitating effective digital copyright protection to prevent unauthorized leaks and misuse. Backdoor watermarking, by embedding hidden identifiers, simplifies copyright verification by breaking the model's black-box nature. Current backdoor watermarking techniques face two main challenges: first, limited generalization across different tasks and datasets, causing fluctuating verification rates; second, insufficient stealthiness, as watermarks are easily detected and removed by automated methods. To address these issues, we propose CodeGuard, a novel watermarking method combining attention mechanisms with distributed trigger embedding strategies. Specifically, CodeGuard employs attention mechanisms to identify watermark embedding positions, ensuring verifiability. Moreover, by using homomorphic character replacement, it avoids manual detection, while distributed trigger embedding reduces the likelihood of automated detection. Experimental results demonstrate that CodeGuard achieves up to 100% watermark verification rates in both code summarization and code generation tasks, with no impact on the primary task performance. In terms of stealthiness, CodeGuard performs exceptionally, with a maximum detection rate of only 0.078 against ONION detection methods, significantly lower than baseline methods.
Abstract（参考訳）: 生成コードモデル(GCM)は、自動コード生成とコード要約によって開発効率を大幅に向上させる。しかし、これらのモデルの構築と訓練には計算資源と時間が必要であり、不正なリークや誤用を防ぐために効果的なデジタル著作権保護が必要である。バックドアの透かしは、隠れた識別子を埋め込むことで、モデルのブラックボックスの性質を壊すことで著作権の検証を単純化する。現在のバックドア透かし技術は、2つの大きな課題に直面している。第1に、異なるタスクやデータセット間での限定的な一般化、変動する検証率、第2に、ウォーターマークが自動的な方法で容易に検出され除去されるため、ステルスネスが不十分である。これらの問題に対処するために,注目機構と分散トリガ埋め込み戦略を組み合わせた新しい透かし方式であるCodeGuardを提案する。具体的には、CodeGuardは、透かしの埋め込み位置を識別し、検証性を保証するために注意機構を使用している。さらに、同型文字置換を用いて手動検出を回避し、分散トリガ埋め込みにより自動検出の可能性が低下する。実験の結果、CodeGuardは、コード要約とコード生成タスクの両方で最大100%の透かし検証を達成でき、主要なタスクのパフォーマンスに影響を与えないことがわかった。ステルス性という点では、CodeGuard は OnION 検出法に対して最大 0.078 の検出率で、ベースライン法よりも大幅に低い。

関連論文リスト

SWaRL: Safeguard Code Watermarking via Reinforcement Learning [16.888582821315257]
本稿では,頑健で忠実な透かしの枠組みであるSWaRLについて述べる。 SWaRLは生成した出力にユニークで検証可能なシグネチャを埋め込む。本研究では,SWaRLが従来の手法よりも高い透かし検出精度を実現することを示す。
論文参考訳（メタデータ） (2026-01-05T23:35:39Z)
CODE ACROSTIC: Robust Watermarking for Code Generation [49.125981508877565]
既存の言語モデル(LLM)の透かし方法では、コメント削除攻撃に対処できない。我々のアプローチは、コードの低エントロピーと高エントロピーを区別するために、事前の知識を活用することである。次に、このキューリストで導かれた透かしを注入し、既存の方法よりも高い検出性とユーザビリティを実現する。
論文参考訳（メタデータ） (2025-12-14T19:14:54Z)
SSCL-BW: Sample-Specific Clean-Label Backdoor Watermarking for Dataset Ownership Verification [8.045712223215542]
本稿では,サンプル特異的クリーンラベルバックドア透かし(SSCL-BW)を提案する。 U-Netベースの透かしサンプルジェネレータをトレーニングすることにより,サンプル毎に独自の透かしを生成する。ベンチマークデータセットを用いた実験は,提案手法の有効性と潜在的な透かし除去攻撃に対する頑健性を示す。
論文参考訳（メタデータ） (2025-10-30T12:13:53Z)
StableGuard: Towards Unified Copyright Protection and Tamper Localization in Latent Diffusion Models [55.05404953041403]
拡散生成プロセスにバイナリ透かしをシームレスに統合する新しいフレームワークを提案する。画像の忠実さ、透かしの検証、ローカライゼーションの改ざんにおいて、StableGuardは一貫して最先端の手法より優れていることを示す。
論文参考訳（メタデータ） (2025-09-22T16:35:19Z)
Character-Level Perturbations Disrupt LLM Watermarks [64.60090923837701]
我々は,Large Language Model (LLM)ウォーターマーキングのためのシステムモデルを定式化する。我々は、透かし検出器への限られたアクセスに制約された2つの現実的な脅威モデルの特徴付けを行う。我々は,最も制限的な脅威モデルの下で,キャラクタレベルの摂動が透かし除去に著しく有効であることを実証した。現実的な制約下での透かし除去における文字レベルの摂動の優位性と遺伝的アルゴリズム(GA)の有効性を実験的に検証した。
論文参考訳（メタデータ） (2025-09-11T02:50:07Z)
Disappearing Ink: Obfuscation Breaks N-gram Code Watermarks in Theory and Practice [23.788321123219244]
人間が書いたコードからAI生成コードを識別することは、著者の帰属、コンテンツ追跡、誤用検出に不可欠である。 N-gramベースの透かしは、世代中に検出される秘密の透かしを注入する顕著な方法として出現している。ほとんどのクレームは、攻撃のシミュレーションとして単純なコード変換やコードの最適化に対する防御にのみ依存しています。
論文参考訳（メタデータ） (2025-07-07T22:18:19Z)
TAG-WM: Tamper-Aware Generative Image Watermarking via Diffusion Inversion Sensitivity [68.95168727940973]
Tamper-Aware Generative Image WaterMarking(TAG-WM)。本稿では,TAG-WMと命名されたタンパ認識画像ウォーターマーキング手法を提案する。
論文参考訳（メタデータ） (2025-06-30T03:14:07Z)
Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。 RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文参考訳（メタデータ） (2025-02-10T09:15:56Z)
Robust and Secure Code Watermarking for Large Language Models via ML/Crypto Codesign [15.153228808457628]
RoSeMaryは、LLM生成コードを規制し、知的財産権侵害やソフトウェア開発における不適切な誤用を避ける。検出性-忠実性-ロマンス性三目的物に付着する高品質な透かしは、符号の低エントロピーの性質のために制限される。 RoSeMaryは、コード機能を保持しながら高い検出精度を達成する。
論文参考訳（メタデータ） (2025-02-04T07:35:28Z)
Beyond Dataset Watermarking: Model-Level Copyright Protection for Code Summarization Models [37.817691840557984]
CSMは、許可されていないユーザによる搾取のリスクに直面します。伝統的な透かし法はトリガーと透かしの特徴を別々に設計する必要がある。モデルレベルの新しい電子透かし埋め込み方式であるModMarkを提案する。
論文参考訳（メタデータ） (2024-10-18T00:48:00Z)
Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。 MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文参考訳（メタデータ） (2024-05-01T12:03:39Z)
DIP-Watermark: A Double Identity Protection Method Based on Robust Adversarial Watermark [13.007649270429493]
顔認識(FR)システムはプライバシーのリスクを引き起こす。 1つの対策は敵攻撃であり、不正な悪意のあるFRを欺くことである。トレース可能な対角線透かしに基づく最初の二重識別保護方式を提案する。
論文参考訳（メタデータ） (2024-04-23T02:50:38Z)
Reliable Model Watermarking: Defending Against Theft without Compromising on Evasion [15.086451828825398]
回避敵は、ウォーターマークサンプルを記憶したモデルによって生成されるショートカットを、容易に利用することができる。モデルを学習してそれらを正確に認識することで、ユニークな透かし行動が知識注入によって促進される。
論文参考訳（メタデータ） (2024-04-21T03:38:20Z)
Safe and Robust Watermark Injection with a Single OoD Image [90.71804273115585]
高性能なディープニューラルネットワークをトレーニングするには、大量のデータと計算リソースが必要である。安全で堅牢なバックドア型透かし注入法を提案する。我々は,透かし注入時のモデルパラメータのランダムな摂動を誘導し,一般的な透かし除去攻撃に対する防御を行う。
論文参考訳（メタデータ） (2023-09-04T19:58:35Z)
An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文参考訳（メタデータ） (2023-07-30T13:43:27Z)
Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳（メタデータ） (2023-05-24T11:49:52Z)
SSLGuard: A Watermarking Scheme for Self-supervised Learning Pre-trained Encoders [9.070481370120905]
プリトレーニングエンコーダのための最初の透かしアルゴリズムであるSSLGuardを提案する。 SSLGuardはウォーターマーク注入と検証に有効であり、モデル盗難やその他のウォーターマーク除去攻撃に対して堅牢である。
論文参考訳（メタデータ） (2022-01-27T17:41:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。