Fugu-MT 論文翻訳(概要): Marking Code Without Breaking It: Code Watermarking for Detecting LLM-Generated Code

論文の概要: Marking Code Without Breaking It: Code Watermarking for Detecting LLM-Generated Code

arxiv url: http://arxiv.org/abs/2502.18851v1
Date: Wed, 26 Feb 2025 05:46:13 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-27 15:24:46.394701
Title: Marking Code Without Breaking It: Code Watermarking for Detecting LLM-Generated Code
Title（参考訳）: コードを壊さずにマーキングする: LLM生成コードの検出のためのコードウォーターマーキング
Authors: Jungin Kim, Shinwoo Park, Yo-Sub Han,
Abstract要約: コードウォーターマーキングは、生成中にパターンをコードに埋め込むことで、AI生成コードを特定する。既存のメソッドは、条件式中のキーワードなど、プログラムロジックにとって重要なトークンを修正することが多い。本稿では,非構文トークンにのみ透かしを選択的に挿入することで,機能的整合性を維持するSTONEを提案する。
参考スコア（独自算出の注目度）: 4.608510640547953
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Code watermarking identifies AI-generated code by embedding patterns into the code during generation. Effective watermarking requires meeting two key conditions: the watermark should be reliably detectable, and the code should retain its original functionality. However, existing methods often modify tokens that are critical for program logic, such as keywords in conditional expressions or operators in arithmetic computations. These modifications can cause syntax errors or functional failures, limiting the practical use of watermarking. We present STONE, a method that preserves functional integrity by selectively inserting watermarks only into non-syntax tokens. By excluding tokens essential for code execution, STONE minimizes the risk of functional degradation. In addition, we introduce CWEM, a comprehensive evaluation metric that evaluates watermarking techniques based on correctness, detectability, and naturalness. While correctness and detectability have been widely used, naturalness remains underexplored despite its importance. Unnatural patterns can reveal the presence of a watermark, making it easier for adversaries to remove. We evaluate STONE using CWEM and compare its performance with the state-of-the-art approach. The results show that STONE achieves an average improvement of 7.69% in CWEM across Python, C++, and Java. Our code is available in https://github.com/inistory/STONE-watermarking/.
Abstract（参考訳）: コードウォーターマーキングは、生成中にパターンをコードに埋め込むことで、AI生成コードを特定する。効果的な透かしは2つの重要な条件を満たす必要がある。しかし、既存のメソッドは、条件式中のキーワードや算術演算における演算子など、プログラム論理にとって重要なトークンを修正することが多い。これらの変更は構文エラーや機能障害を引き起こし、ウォーターマーキングの実用的使用を制限する。本稿では,非構文トークンにのみ透かしを選択的に挿入することで,機能的整合性を維持するSTONEを提案する。コード実行に必要なトークンを除外することで、STONEは機能劣化のリスクを最小限にする。さらに,その正確性,検出性,自然性に基づいて透かし技術を評価する総合評価指標CWEMを紹介する。正確性と検出性は広く利用されているが、その重要性にもかかわらず自然性は未発見のままである。不自然なパターンは透かしの存在を明らかにし、敵が容易に取り除くことができる。 CWEMを用いてSTONEを評価し,その性能を最先端手法と比較した。その結果、STONEはPython、C++、Javaで平均7.69%のCWEM改善を実現している。私たちのコードはhttps://github.com/inistory/STONE-watermarking/で利用可能です。

関連論文リスト

CODE ACROSTIC: Robust Watermarking for Code Generation [49.125981508877565]
既存の言語モデル(LLM)の透かし方法では、コメント削除攻撃に対処できない。我々のアプローチは、コードの低エントロピーと高エントロピーを区別するために、事前の知識を活用することである。次に、このキューリストで導かれた透かしを注入し、既存の方法よりも高い検出性とユーザビリティを実現する。
論文参考訳（メタデータ） (2025-12-14T19:14:54Z)
A Reinforcement Learning Framework for Robust and Secure LLM Watermarking [40.90513051455007]
我々は、堅牢でセキュアな透かしのためのエンドツーエンドのRLフレームワークを提案する。提案手法では,報奨条件にアンカー機構を導入し,安定したトレーニングを確保するとともに,報奨ハックを防止するための追加の正規化条件を導入する。本手法は,全ての基準において最先端のトレードオフを実現し,他の基準を劣化させることなく,攻撃に対する抵抗性を顕著に改善する。
論文参考訳（メタデータ） (2025-10-23T23:53:03Z)
Character-Level Perturbations Disrupt LLM Watermarks [64.60090923837701]
我々は,Large Language Model (LLM)ウォーターマーキングのためのシステムモデルを定式化する。我々は、透かし検出器への限られたアクセスに制約された2つの現実的な脅威モデルの特徴付けを行う。我々は,最も制限的な脅威モデルの下で,キャラクタレベルの摂動が透かし除去に著しく有効であることを実証した。現実的な制約下での透かし除去における文字レベルの摂動の優位性と遺伝的アルゴリズム(GA)の有効性を実験的に検証した。
論文参考訳（メタデータ） (2025-09-11T02:50:07Z)
Is The Watermarking Of LLM-Generated Code Robust? [5.48277165801539]
コードベースのコンテキストでは、ウォーターマーキングのテクニックがはるかに脆弱であることを示します。具体的には、変数リネームやデッドコード挿入といった単純なセマンティック保存変換が、ウォーターマークを効果的に消去できることを示す。
論文参考訳（メタデータ） (2024-03-24T21:41:29Z)
WatME: Towards Lossless Watermarking Through Lexical Redundancy [58.61972059246715]
本研究では,認知科学レンズを用いた大規模言語モデル(LLM)の異なる機能に対する透かしの効果を評価する。透かしをシームレスに統合するための相互排他型透かし(WatME)を導入する。
論文参考訳（メタデータ） (2023-11-16T11:58:31Z)
Improving the Generation Quality of Watermarked Large Language Models via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。 We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文参考訳（メタデータ） (2023-11-16T08:36:00Z)
Turning Your Strength into Watermark: Watermarking Large Language Model via Knowledge Injection [66.26348985345776]
本稿では,知識注入に基づく大規模言語モデル(LLM)のための新しい透かし手法を提案する。透かし埋め込みの段階では、まず選択した知識に透かしを埋め込んで、透かし付き知識を得る。透かし抽出段階では、疑わしいLLMを問うために、透かし付き知識に関する質問を設計する。実験により, 透かし抽出の成功率は100%近くであり, 提案手法の有効性, 忠実性, ステルス性, 堅牢性を示した。
論文参考訳（メタデータ） (2023-11-16T03:22:53Z)
A Robust Semantics-based Watermark for Large Language Model against Paraphrasing [50.84892876636013]
大規模言語モデル(LLM)は、様々な自然言語処理において優れた能力を示している。 LLMは不適切にも違法にも使用できるという懸念がある。本稿ではセマンティクスに基づく透かしフレームワークSemaMarkを提案する。
論文参考訳（メタデータ） (2023-11-15T06:19:02Z)
A Semantic Invariant Robust Watermark for Large Language Models [27.522264953691746]
以前の透かしアルゴリズムは、攻撃の堅牢性とセキュリティの堅牢性の間のトレードオフに直面していた。これは、トークンの透かしロジットが、先行するトークンの数によって決定されるためである。攻撃の堅牢性とセキュリティの堅牢性の両方を提供するLLMのセマンティック不変な透かし手法を提案する。
論文参考訳（メタデータ） (2023-10-10T06:49:43Z)
An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文参考訳（メタデータ） (2023-07-30T13:43:27Z)
Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳（メタデータ） (2023-05-24T11:49:52Z)
Towards Tracing Code Provenance with Code Watermarking [37.41260851333952]
我々は、ビット文字列を変数に隠蔽し、コードの自然的および操作的意味論を尊重する電子透かしシステムであるCodeMarkを提案する。自然性のために、我々は、グラフニューラルネットワーク上のコンテキストにおいてよりコヒーレントな透かし変数を生成するためのコンテキスト透かし方式を導入する。 CodeMarkは、透かし要求のバランスが良く、SOTA透かしシステムより優れていることを示す。
論文参考訳（メタデータ） (2023-05-21T13:53:12Z)
Watermarking Text Generated by Black-Box Language Models [103.52541557216766]
テキスト生成中に透かしを埋め込むことのできるホワイトボックスLCMに対して,透かしに基づく手法が提案されている。リストを認識した検出アルゴリズムは、透かし付きテキストを識別することができる。我々はブラックボックス言語モデル利用シナリオのための透かしフレームワークを開発する。
論文参考訳（メタデータ） (2023-05-14T07:37:33Z)
A Watermark for Large Language Models [84.95327142027183]
本稿では,プロプライエタリな言語モデルのための透かしフレームワークを提案する。透かしはテキストの品質に無視できない影響で埋め込むことができる。言語モデルAPIやパラメータにアクセスすることなく、効率的なオープンソースアルゴリズムを使って検出することができる。
論文参考訳（メタデータ） (2023-01-24T18:52:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。