Fugu-MT 論文翻訳(概要): Is Watermarking LLM-Generated Code Robust?

関連論文リスト

Disappearing Ink: Obfuscation Breaks N-gram Code Watermarks in Theory and Practice [23.788321123219244]
人間が書いたコードからAI生成コードを識別することは、著者の帰属、コンテンツ追跡、誤用検出に不可欠である。 N-gramベースの透かしは、世代中に検出される秘密の透かしを注入する顕著な方法として出現している。ほとんどのクレームは、攻撃のシミュレーションとして単純なコード変換やコードの最適化に対する防御にのみ依存しています。
論文参考訳（メタデータ） (2025-07-07T22:18:19Z)
Marking Code Without Breaking It: Code Watermarking for Detecting LLM-Generated Code [4.608510640547953]
コードウォーターマーキングは、生成中にパターンをコードに埋め込むことで、AI生成コードを特定する。既存のメソッドは、条件式中のキーワードなど、プログラムロジックにとって重要なトークンを修正することが多い。本稿では,非構文トークンにのみ透かしを選択的に挿入することで,機能的整合性を維持するSTONEを提案する。
論文参考訳（メタデータ） (2025-02-26T05:46:13Z)
Revisiting the Robustness of Watermarking to Paraphrasing Attacks [10.68370011459729]
多くの最近の透かし技術は、後に検出できる出力に信号を埋め込むためにLMの出力確率を変更する。ブラックボックス型透かしモデルから限られた世代にしかアクセスできないため,パラフレーズ攻撃による透かし検出の回避効果を大幅に向上させることができる。
論文参考訳（メタデータ） (2024-11-08T02:22:30Z)
Beyond Dataset Watermarking: Model-Level Copyright Protection for Code Summarization Models [37.817691840557984]
CSMは、許可されていないユーザによる搾取のリスクに直面します。伝統的な透かし法はトリガーと透かしの特徴を別々に設計する必要がある。モデルレベルの新しい電子透かし埋め込み方式であるModMarkを提案する。
論文参考訳（メタデータ） (2024-10-18T00:48:00Z)
De-mark: Watermark Removal in Large Language Models [59.00698153097887]
我々は、n-gramベースの透かしを効果的に除去するために設計された高度なフレームワークであるDe-markを紹介する。提案手法は,透かしの強度を評価するために,ランダム選択探索と呼ばれる新しいクエリ手法を利用する。
論文参考訳（メタデータ） (2024-10-17T17:42:10Z)
Can Watermarks Survive Translation? On the Cross-lingual Consistency of Text Watermark for Large Language Models [48.409979469683975]
テキスト透かしにおける言語間整合性の概念を紹介する。予備的な実証実験の結果、現在のテキスト透かし技術は、テキストが様々な言語に翻訳されるときに一貫性が欠如していることが判明した。透かしを回避するための言語横断型透かし除去攻撃(CWRA)を提案する。
論文参考訳（メタデータ） (2024-02-21T18:48:38Z)
Efficient and Universal Watermarking for LLM-Generated Code Detection [5.782554045290121]
大規模言語モデル(LLM)はAI生成コードのユーザビリティを大幅に向上させた。説明責任については、コードの一部がAI生成されているかどうかを検出することが不可欠である。本稿では,ACWと呼ばれるAI生成コード検出のためのプラグアンドプレイ型透かし手法を提案する。
論文参考訳（メタデータ） (2024-02-12T09:40:18Z)
On the Learnability of Watermarks for Language Models [80.97358663708592]
言語モデルが透かし付きテキストを生成するために直接学習できるかどうかを問う。本稿では,教師モデルとして振舞う学生モデルを訓練する透かし蒸留法を提案する。モデルは、高い検出性で透かし付きテキストを生成することができる。
論文参考訳（メタデータ） (2023-12-07T17:41:44Z)
A Robust Semantics-based Watermark for Large Language Model against Paraphrasing [50.84892876636013]
大規模言語モデル(LLM)は、様々な自然言語処理において優れた能力を示している。 LLMは不適切にも違法にも使用できるという懸念がある。本稿ではセマンティクスに基づく透かしフレームワークSemaMarkを提案する。
論文参考訳（メタデータ） (2023-11-15T06:19:02Z)
An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文参考訳（メタデータ） (2023-07-30T13:43:27Z)
Towards Codable Watermarking for Injecting Multi-bits Information to LLMs [86.86436777626959]
大規模言語モデル(LLM)は、流布とリアリズムを増大させるテキストを生成する。既存の透かし方式はエンコーディング非効率であり、多様な情報エンコーディングニーズに柔軟に対応できない。テキスト透かしを複数ビットでカスタマイズ可能な情報を運ぶことができるCTWL (Codable Text Watermarking for LLMs) を提案する。
論文参考訳（メタデータ） (2023-07-29T14:11:15Z)
On the Reliability of Watermarks for Large Language Models [95.87476978352659]
本研究では,人間による書き直し後の透かしテキストの堅牢性,非透かしLDMによる言い換え,あるいはより長い手書き文書への混在性について検討する。人や機械の言い回しをしても、透かしは検出可能である。また、大きな文書に埋め込まれた透かし付きテキストの短いスパンに敏感な新しい検出手法についても検討する。
論文参考訳（メタデータ） (2023-06-07T17:58:48Z)
Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳（メタデータ） (2023-05-24T11:49:52Z)
Towards Tracing Code Provenance with Code Watermarking [37.41260851333952]
我々は、ビット文字列を変数に隠蔽し、コードの自然的および操作的意味論を尊重する電子透かしシステムであるCodeMarkを提案する。自然性のために、我々は、グラフニューラルネットワーク上のコンテキストにおいてよりコヒーレントな透かし変数を生成するためのコンテキスト透かし方式を導入する。 CodeMarkは、透かし要求のバランスが良く、SOTA透かしシステムより優れていることを示す。
論文参考訳（メタデータ） (2023-05-21T13:53:12Z)
A Watermark for Large Language Models [84.95327142027183]
本稿では,プロプライエタリな言語モデルのための透かしフレームワークを提案する。透かしはテキストの品質に無視できない影響で埋め込むことができる。言語モデルAPIやパラメータにアクセスすることなく、効率的なオープンソースアルゴリズムを使って検出することができる。
論文参考訳（メタデータ） (2023-01-24T18:52:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

論文の概要: Is Watermarking LLM-Generated Code Robust?

関連論文リスト