論文の概要: SWaRL: Safeguard Code Watermarking via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2601.02602v1
- Date: Mon, 05 Jan 2026 23:35:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-07 17:02:12.750108
- Title: SWaRL: Safeguard Code Watermarking via Reinforcement Learning
- Title(参考訳): SWaRL: 強化学習によるコード透かしの保護
- Authors: Neusha Javidnia, Ruisi Zhang, Ashish Kundu, Farinaz Koushanfar,
- Abstract要約: 本稿では,頑健で忠実な透かしの枠組みであるSWaRLについて述べる。
SWaRLは生成した出力にユニークで検証可能なシグネチャを埋め込む。
本研究では,SWaRLが従来の手法よりも高い透かし検出精度を実現することを示す。
- 参考スコア(独自算出の注目度): 16.888582821315257
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present SWaRL, a robust and fidelity-preserving watermarking framework designed to protect the intellectual property of code LLM owners by embedding unique and verifiable signatures in the generated output. Existing approaches rely on manually crafted transformation rules to preserve watermarked code functionality or manipulate token-generation probabilities at inference time, which are prone to compilation errors. To address these challenges, SWaRL employs a reinforcement learning-based co-training framework that uses compiler feedback for functional correctness and a jointly trained confidential verifier as a reward signal to maintain watermark detectability. Furthermore, SWaRL employs low-rank adaptation (LoRA) during fine-tuning, allowing the learned watermark information to be transferable across model updates. Extensive experiments show that SWaRL achieves higher watermark detection accuracy compared to prior methods while fully maintaining watermarked code functionality. The LoRA-based signature embedding steers the base model to generate and solve code in a watermark-specific manner without significant computational overhead. Moreover, SWaRL exhibits strong resilience against refactoring and adversarial transformation attacks.
- Abstract(参考訳): 本稿では,LLMオーナの知的財産権を保護するために,生成した出力に特異かつ検証可能なシグネチャを埋め込むことにより,堅牢かつ忠実に保存できる透かしフレームワークであるSWaRLを提案する。
既存のアプローチは、ウォーターマークされたコード機能を保存するか、推論時にトークン生成確率を操作するために手作業による変換ルールに依存している。
これらの課題に対処するため、SWaRLは、機能的正当性のためにコンパイラフィードバックを使用する強化学習ベースのコトレーニングフレームワークと、透かし検出性を維持するための報酬信号として共同訓練された秘密検証器を採用している。
さらに、SWaRLは微調整中にローランク適応(LoRA)を採用し、学習した透かし情報をモデル更新間で転送できるようにする。
大規模な実験により,SWaRLは従来の方法に比べて透かし検出精度が高く,透かし符号の完全維持が図られた。
LoRAベースのシグネチャ埋め込みはベースモデルを操り、重要な計算オーバーヘッドを伴わずに、透かし固有の方法でコードを生成し、解決する。
さらに、SWaRLはリファクタリングや逆変換攻撃に対して強いレジリエンスを示す。
関連論文リスト
- AuthenLoRA: Entangling Stylization with Imperceptible Watermarks for Copyright-Secure LoRA Adapters [52.556959321030966]
Low-Rank Adaptation (LoRA) は拡散モデルをカスタマイズするための効率的なパラダイムを提供する。
既存の透かし技術はベースモデルをターゲットにするか、LoRAモジュール自体を検証する。
本稿では,LoRAトレーニングプロセスに直接,認識不能でトレーサブルな透かしを埋め込む統一透かしフレームワークであるAuthenLoRAを提案する。
論文 参考訳(メタデータ) (2025-11-26T09:48:11Z) - StableGuard: Towards Unified Copyright Protection and Tamper Localization in Latent Diffusion Models [55.05404953041403]
拡散生成プロセスにバイナリ透かしをシームレスに統合する新しいフレームワークを提案する。
画像の忠実さ、透かしの検証、ローカライゼーションの改ざんにおいて、StableGuardは一貫して最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-09-22T16:35:19Z) - Optimizing Token Choice for Code Watermarking: An RL Approach [41.184827829989494]
我々は,新しい強化学習パラダイムを基盤とした適応型コード透かしフレームワークであるCodeTracerを紹介する。
CodeTracerは、パラメータ化モデルを使用して、次のトークン予測中にトークンの選択をインテリジェントにバイアスするポリシ駆動のアプローチを備えている。
政策学習を容易にするために,実行フィードバックを透かし埋め込み信号とシームレスに統合する包括的報酬システムを開発した。
論文 参考訳(メタデータ) (2025-08-16T06:11:29Z) - TAG-WM: Tamper-Aware Generative Image Watermarking via Diffusion Inversion Sensitivity [76.98973481600002]
本稿では,TAG-WMと命名されたタンパ認識画像ウォーターマーキング手法を提案する。
提案手法は、4つのキーモジュールからなる: 生成品質を保ちつつ、著作権と局所化の透かしを潜伏空間に埋め込むためのデュアルマークジョイントサンプリング (DMJS) アルゴリズム。
実験結果から,TAG-WMは歪み下においても,改質性および局所化能力の両面において最先端性能を達成できることが示された。
論文 参考訳(メタデータ) (2025-06-30T03:14:07Z) - Towards Generalized and Stealthy Watermarking for Generative Code Models [35.78974773421725]
実験の結果,コード要約タスクとコード生成タスクの両方において,CodeGuardが最大100%の透かし検証率を達成することがわかった。
ステルス性に関しては、CodeGuard は OnION 検出方法に対して最大 0.078 の検出率で例外的に実行している。
論文 参考訳(メタデータ) (2025-06-26T01:14:35Z) - Towards Copyright Protection for Knowledge Bases of Retrieval-augmented Language Models via Reasoning [58.57194301645823]
大規模言語モデル(LLM)は、現実のパーソナライズされたアプリケーションにますます統合されている。
RAGで使用される知識基盤の貴重かつしばしばプロプライエタリな性質は、敵による不正使用のリスクをもたらす。
これらの知識基盤を保護するための透かし技術として一般化できる既存の方法は、一般的に毒やバックドア攻撃を含む。
我々は、無害な」知識基盤の著作権保護の名称を提案する。
論文 参考訳(メタデータ) (2025-02-10T09:15:56Z) - Robust and Secure Code Watermarking for Large Language Models via ML/Crypto Codesign [15.153228808457628]
RoSeMaryは、LLM生成コードを規制し、知的財産権侵害やソフトウェア開発における不適切な誤用を避ける。
検出性-忠実性-ロマンス性三目的物に付着する高品質な透かしは、符号の低エントロピーの性質のために制限される。
RoSeMaryは、コード機能を保持しながら高い検出精度を達成する。
論文 参考訳(メタデータ) (2025-02-04T07:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。