論文の概要: Optimizing Token Choice for Code Watermarking: A RL Approach
- arxiv url: http://arxiv.org/abs/2508.11925v1
- Date: Sat, 16 Aug 2025 06:11:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.45631
- Title: Optimizing Token Choice for Code Watermarking: A RL Approach
- Title(参考訳): コードウォーターマーキングのためのトークン選択の最適化 - RLアプローチ
- Authors: Zhimeng Guo, Huaisheng Zhu, Siyuan Xu, Hangfan Zhang, Teng Xiao, Minhao Cheng,
- Abstract要約: 我々は,新しい強化学習訓練パラダイムを基盤とした適応型コード透かしフレームワークであるCodeTracerを紹介する。
CodeTracerの中核となるのは、パラメータ化モデルを使用してトークン選択をインテリジェントにバイアスするポリシ駆動のアプローチだ。
政策学習を容易にするために,実行フィードバックを透かし埋め込み信号とシームレスに統合する包括的報酬システムを開発した。
- 参考スコア(独自算出の注目度): 24.252077432208225
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The need for detecting LLM-generated code necessitates watermarking systems capable of operating within its highly structured and syntactically constrained environment. To address this, we introduce CodeTracer, an innovative adaptive code watermarking framework underpinned by a novel reinforcement learning training paradigm. At its core, CodeTracer features a policy-driven approach that utilizes a parameterized model to intelligently bias token choices during next-token prediction. This strategy ensures that embedded watermarks maintain code functionality while exhibiting subtle yet statistically detectable deviations from typical token distributions. To facilitate policy learning, we devise a comprehensive reward system that seamlessly integrates execution feedback with watermark embedding signals, balancing process-level and outcome-level rewards. Additionally, we employ Gumbel Top-k reparameterization to enable gradient-based optimization of discrete watermarking decisions. Extensive comparative evaluations demonstrate CodeTracer's significant superiority over state-of-the-art baselines in both watermark detectability and the preservation of generated code's functionality.
- Abstract(参考訳): LLM生成コードを検出する必要性は、高度に構造化され、構文的に制約された環境で動作可能な透かしシステムを必要とする。
これを解決するために,新しい強化学習訓練パラダイムを基盤とした,革新的な適応型コード透かしフレームワークであるCodeTracerを紹介した。
CodeTracerの中核となるのは、パラメータ化モデルを使用して、次のトークン予測中にトークンの選択をインテリジェントにバイアスするポリシ駆動のアプローチだ。
この戦略は、埋め込み透かしがコード機能を維持しつつ、典型的なトークン分布から微妙に統計的に検出可能な偏差を示すことを保証します。
政策学習を容易にするため,我々は,実行フィードバックを透かし埋め込み信号とシームレスに統合し,プロセスレベルと結果レベルの報酬のバランスをとる総合的な報酬システムを開発した。
さらに、Gumbel Top-k再パラメータ化を用いて、離散的な透かし決定の勾配に基づく最適化を可能にする。
大規模な比較評価は、ウォーターマーク検出性と生成されたコード機能の保存の両方において、CodeTracerが最先端のベースラインよりも大幅に優れていることを示している。
関連論文リスト
- Gaussian Shading++: Rethinking the Realistic Deployment Challenge of Performance-Lossless Image Watermark for Diffusion Models [66.54457339638004]
著作権保護と不適切なコンテンツ生成は、拡散モデルの実装に課題をもたらす。
本研究では,実世界の展開に適した拡散モデル透かし手法を提案する。
Gaussian Shading++はパフォーマンスのロスレス性を維持するだけでなく、ロバスト性の観点からも既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-04-21T11:18:16Z) - Robust and Secure Code Watermarking for Large Language Models via ML/Crypto Codesign [15.153228808457628]
RoSeMaryは、LLM生成コードを規制し、知的財産権侵害やソフトウェア開発における不適切な誤用を避ける。
検出性-忠実性-ロマンス性三目的物に付着する高品質な透かしは、符号の低エントロピーの性質のために制限される。
RoSeMaryは、コード機能を保持しながら高い検出精度を達成する。
論文 参考訳(メタデータ) (2025-02-04T07:35:28Z) - A Watermark for Order-Agnostic Language Models [55.89285889529492]
Pattern-markは、順序に依存しないLM用に特別に設計されたパターンベースの透かしフレームワークである。
我々は,高周波鍵パターンを持つ透かしキー列を生成するマルコフチェーン型透かし生成器を開発した。
タンパク質MPNN や CMLM などの順序に依存しない LM の評価では,パターンマークによる検出効率の向上,生成品質,ロバスト性などが示されている。
論文 参考訳(メタデータ) (2024-10-17T17:41:28Z) - Token-Specific Watermarking with Enhanced Detectability and Semantic Coherence for Large Language Models [31.062753031312006]
大規模言語モデルは、潜在的な誤報を伴う高品質な応答を生成する。
ウォーターマーキングは、テキストに隠れたマーカーを埋め込むことによって、この文脈において重要な意味を持つ。
ウォーターマーキングのための新しい多目的最適化(MOO)手法を提案する。
本手法は,検出性と意味的整合性を同時に達成する。
論文 参考訳(メタデータ) (2024-02-28T05:43:22Z) - Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。
実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文 参考訳(メタデータ) (2023-05-24T11:49:52Z) - Towards Tracing Code Provenance with Code Watermarking [37.41260851333952]
我々は、ビット文字列を変数に隠蔽し、コードの自然的および操作的意味論を尊重する電子透かしシステムであるCodeMarkを提案する。
自然性のために、我々は、グラフニューラルネットワーク上のコンテキストにおいてよりコヒーレントな透かし変数を生成するためのコンテキスト透かし方式を導入する。
CodeMarkは、透かし要求のバランスが良く、SOTA透かしシステムより優れていることを示す。
論文 参考訳(メタデータ) (2023-05-21T13:53:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。