Fugu-MT 論文翻訳(概要): Resilient Watermarking for LLM-Generated Codes

論文の概要: Resilient Watermarking for LLM-Generated Codes

arxiv url: http://arxiv.org/abs/2402.07518v2
Date: Tue, 16 Apr 2024 07:27:06 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-17 23:05:59.060915
Title: Resilient Watermarking for LLM-Generated Codes
Title（参考訳）: LLM生成符号に対するレジリエントな透かし
Authors: Boquan Li, Mengdi Zhang, Peixin Zhang, Jun Sun, Xingmei Wang, Zijian Liu, Tianzi Zhang,
Abstract要約: コードの一部がAIによって生成され、どのAIが著者であるかを知ることが望ましい。既存のアプローチは、透かしコードの方がテキストデータの透かしよりも難しいため、満足できない。本稿では,AI生成コードの透かし手法であるACW(AI Code Watermarking)を提案する。
参考スコア（独自算出の注目度）: 9.66163808660033
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: With the development of large language models, multiple AIs are now made available for code generation (such as ChatGPT and StarCoder) and are adopted widely. It is often desirable to know whether a piece of code is generated by AI, and furthermore, which AI is the author. For instance, if a certain version of AI is known to generate vulnerable codes, it is particularly important to know the creator. Existing approaches are not satisfactory as watermarking codes are more challenging compared to watermarking text data, as codes can be altered with relative ease via widely-used code refactoring methods. In this work, we propose ACW (AI Code Watermarking), a novel method for watermarking AI-generated codes. The key idea of ACW is to selectively apply a set of carefully-designed semantic-preserving, idempotent code transformations, whose presence (or absence) allows us to determine the existence of the watermark. It is efficient as it requires no training or fine-tuning and works in a black-box manner. It is resilient as the watermark cannot be easily removed or tampered through common code refactoring methods. Our experimental results show that ACW is effective (i.e., achieving high accuracy, true positive rates and false positive rates) and resilient, significantly outperforming existing approaches.
Abstract（参考訳）: 大規模言語モデルの開発により、複数のAIがコード生成(ChatGPTやStarCoderなど)で利用可能になり、広く採用されている。コードの一部がAIによって生成されるかどうか、さらにどのAIが著者であるかを知ることが望ましいことが多い。例えば、あるバージョンのAIが脆弱なコードを生成することが知られている場合、特に作者を知ることが重要です。既存のアプローチは、透かしコードの方がテキストデータの透かしよりも難しいため、広く使われているコードリファクタリングメソッドを通じて比較的簡単にコードを変更することができるため、満足できない。本稿では,AI生成コードの透かし手法であるACW(AI Code Watermarking)を提案する。 ACWのキーとなる考え方は、慎重に設計されたセマンティック保存、等質なコード変換の集合を選択的に適用することであり、その存在(または欠如)により、透かしの存在を決定できる。トレーニングや微調整を必要とせず、ブラックボックス方式で機能するため、効率的である。透かしは、一般的なコードリファクタリングメソッドで簡単に取り除かれたり、改ざんしたりできないため、耐性がある。実験の結果,ACWは有効であり(高い精度,真正,偽陽性),回復力があり,既存手法よりも優れていた。

関連論文リスト

CODE ACROSTIC: Robust Watermarking for Code Generation [49.125981508877565]
既存の言語モデル(LLM)の透かし方法では、コメント削除攻撃に対処できない。我々のアプローチは、コードの低エントロピーと高エントロピーを区別するために、事前の知識を活用することである。次に、このキューリストで導かれた透かしを注入し、既存の方法よりも高い検出性とユーザビリティを実現する。
論文参考訳（メタデータ） (2025-12-14T19:14:54Z)
Detecting LLM-generated Code with Subtle Modification by Adversarial Training [4.814313782484443]
我々は,入力摂動に対する頑健性を改善するために,敵のトレーニングを利用するCodeGPTSensorの強化版を提案する。 HMCorpデータセットの実験結果から,CodeGPTSensor+は対向テストセットの検出精度を大幅に向上することが示された。
論文参考訳（メタデータ） (2025-07-17T13:38:16Z)
Disappearing Ink: Obfuscation Breaks N-gram Code Watermarks in Theory and Practice [23.788321123219244]
人間が書いたコードからAI生成コードを識別することは、著者の帰属、コンテンツ追跡、誤用検出に不可欠である。 N-gramベースの透かしは、世代中に検出される秘密の透かしを注入する顕著な方法として出現している。ほとんどのクレームは、攻撃のシミュレーションとして単純なコード変換やコードの最適化に対する防御にのみ依存しています。
論文参考訳（メタデータ） (2025-07-07T22:18:19Z)
In-Context Watermarks for Large Language Models [71.29952527565749]
In-Context Watermarking (ICW)は、インシデントエンジニアリングのみで生成されたテキストに透かしを埋め込む。粒度の異なる4つのICW戦略について検討した。本実験は,モデルに依存しない実用的な透かし手法としてのICWの実現可能性を検証するものである。
論文参考訳（メタデータ） (2025-05-22T17:24:51Z)
On-Device Watermarking: A Socio-Technical Imperative For Authenticity In The Age of Generative AI [0.0]
私たちは間違ったアプローチを採用しており、暗号署名による透かしに注力すべきだと論じています。特に音声・視覚コンテンツについては、実際のコンテンツはすべて物理的世界に根ざし、ハードウェアセンサーを介してキャプチャされる。
論文参考訳（メタデータ） (2025-04-15T20:36:52Z)
SoK: Watermarking for AI-Generated Content [112.9218881276487]
ウォーターマーキングスキームは、AI生成コンテンツに隠された信号を埋め込んで、信頼性の高い検出を可能にする。透かしは、誤情報や偽造と戦ってAIの安全性と信頼性を高める上で重要な役割を果たす。本研究の目的は、研究者が透かし法や応用の進歩を指導し、GenAIの幅広い意味に対処する政策立案者を支援することである。
論文参考訳（メタデータ） (2024-11-27T16:22:33Z)
SoK: On the Role and Future of AIGC Watermarking in the Era of Gen-AI [24.187726079290357]
AIGCの透かしは、悪意のあるアクティビティを緩和するための効果的なソリューションを提供する。透かしのコア特性に基づいた分類法を提供する。我々はAIGC透かしの機能とセキュリティの脅威について論じる。
論文参考訳（メタデータ） (2024-11-18T11:26:42Z)
Beyond Dataset Watermarking: Model-Level Copyright Protection for Code Summarization Models [37.817691840557984]
CSMは、許可されていないユーザによる搾取のリスクに直面します。伝統的な透かし法はトリガーと透かしの特徴を別々に設計する必要がある。モデルレベルの新しい電子透かし埋め込み方式であるModMarkを提案する。
論文参考訳（メタデータ） (2024-10-18T00:48:00Z)
Certifiably Robust Image Watermark [57.546016845801134]
ジェネレーティブAIは、偽情報やプロパガンダキャンペーンの促進など、多くの社会的懸念を提起する。ウォーターマークAI生成コンテンツは、これらの懸念に対処するための重要な技術である。本報告では, 除去・偽造攻撃に対するロバスト性保証を保証した最初の画像透かしを提案する。
論文参考訳（メタデータ） (2024-07-04T17:56:04Z)
Uncovering LLM-Generated Code: A Zero-Shot Synthetic Code Detector via Code Rewriting [78.48355455324688]
原符号とLLM書き換え版との類似性に基づく新しいゼロショット合成符号検出器を提案する。以上の結果から,既存のSOTA合成コンテンツ検出装置よりも顕著な改善が得られた。
論文参考訳（メタデータ） (2024-05-25T08:57:28Z)
CodeIP: A Grammar-Guided Multi-Bit Watermark for Large Language Models of Code [56.019447113206006]
大規模言語モデル(LLM)はコード生成において顕著な進歩を遂げた。 CodeIPは、新しいマルチビット透かし技術で、出所の詳細を保存するために追加情報を埋め込む。 5つのプログラミング言語にまたがる実世界のデータセットで実施された実験は、CodeIPの有効性を実証している。
論文参考訳（メタデータ） (2024-04-24T04:25:04Z)
Is The Watermarking Of LLM-Generated Code Robust? [5.48277165801539]
コードベースのコンテキストでは、ウォーターマーキングのテクニックがはるかに脆弱であることを示します。具体的には、変数リネームやデッドコード挿入といった単純なセマンティック保存変換が、ウォーターマークを効果的に消去できることを示す。
論文参考訳（メタデータ） (2024-03-24T21:41:29Z)
No Free Lunch in LLM Watermarking: Trade-offs in Watermarking Design Choices [20.20770405297239]
LLM透かし方式における一般的な設計選択は、結果のシステムが驚くほど攻撃を受けやすいことを示す。本稿では, LLM透かしのガイドラインと防御について述べる。
論文参考訳（メタデータ） (2024-02-25T20:24:07Z)
WatME: Towards Lossless Watermarking Through Lexical Redundancy [58.61972059246715]
本研究では,認知科学レンズを用いた大規模言語モデル(LLM)の異なる機能に対する透かしの効果を評価する。透かしをシームレスに統合するための相互排他型透かし(WatME)を導入する。
論文参考訳（メタデータ） (2023-11-16T11:58:31Z)
A Robust Semantics-based Watermark for Large Language Model against Paraphrasing [50.84892876636013]
大規模言語モデル(LLM)は、様々な自然言語処理において優れた能力を示している。 LLMは不適切にも違法にも使用できるという懸念がある。本稿ではセマンティクスに基づく透かしフレームワークSemaMarkを提案する。
論文参考訳（メタデータ） (2023-11-15T06:19:02Z)
An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文参考訳（メタデータ） (2023-07-30T13:43:27Z)
Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳（メタデータ） (2023-05-24T11:49:52Z)
Evading Watermark based Detection of AI-Generated Content [45.47476727209842]
生成AIモデルは、非常に現実的なコンテンツを生成することができる。 WatermarkはAI生成コンテンツの検出に活用されている。類似の透かしをデコードできれば、コンテンツはAI生成として検出される。
論文参考訳（メタデータ） (2023-05-05T19:20:29Z)
Generation Probabilities Are Not Enough: Uncertainty Highlighting in AI Code Completions [54.55334589363247]
本研究では,不確実性に関する情報を伝達することで,プログラマがより迅速かつ正確にコードを生成することができるかどうかを検討する。トークンのハイライトは、編集される可能性が最も高いので、タスクの完了が早くなり、よりターゲットを絞った編集が可能になることがわかりました。
論文参考訳（メタデータ） (2023-02-14T18:43:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。