Fugu-MT 論文翻訳(概要): Publicly Detectable Watermarking for Language Models

論文の概要: Publicly Detectable Watermarking for Language Models

arxiv url: http://arxiv.org/abs/2310.18491v1
Date: Fri, 27 Oct 2023 21:08:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-31 18:20:21.655476
Title: Publicly Detectable Watermarking for Language Models
Title（参考訳）: 言語モデルのためのパブリック検出可能な透かし
Authors: Jaiden Fairoze, Sanjam Garg, Somesh Jha, Saeed Mahloujifar, Mohammad Mahmoody and Mingyuan Wang
Abstract要約: パブリックな検出性や検証性を備えた言語モデルに対する最初の証明可能な透かし方式を構築した。我々のプロトコルは,生成したテキストに統計信号を埋め込まない最初の透かし方式である。
参考スコア（独自算出の注目度）: 48.024299441636245
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We construct the first provable watermarking scheme for language models with public detectability or verifiability: we use a private key for watermarking and a public key for watermark detection. Our protocol is the first watermarking scheme that does not embed a statistical signal in generated text. Rather, we directly embed a publicly-verifiable cryptographic signature using a form of rejection sampling. We show that our construction meets strong formal security guarantees and preserves many desirable properties found in schemes in the private-key watermarking setting. In particular, our watermarking scheme retains distortion-freeness and model agnosticity. We implement our scheme and make empirical measurements over open models in the 7B parameter range. Our experiments suggest that our watermarking scheme meets our formal claims while preserving text quality.
Abstract（参考訳）: 我々は,公的な検出性や検証性を備えた言語モデルに対する最初の証明可能な透かし方式を構築し,透かしの秘密鍵と透かし検出のための公開鍵を用いる。我々のプロトコルは,生成したテキストに統計信号を埋め込まない最初の透かし方式である。むしろ、リジェクションサンプリングの形式を用いて、公開検証可能な暗号署名を直接埋め込む。提案手法は,厳密な形式的セキュリティ保証を満たし,秘密鍵透かし設定のスキームに見られる多くの望ましいプロパティを保存できることを示す。特に,我々の透かし方式は歪み自由度とモデル非依存性を保っている。提案手法を実装し、7Bパラメータ範囲のオープンモデル上で実験的な測定を行う。我々の実験は,テキストの品質を維持しつつ,我々の公式な主張に合致することを示す。

関連論文リスト

Multi-use LLM Watermarking and the False Detection Problem [12.954387412283973]
デジタル透かしは、自動生成されたテキストの誤用に起因するリスクを軽減できる有望な解決策である。しかし,検出とユーザ識別の両方に同じ埋め込みを同時に使用すると,誤検出の問題が発生する。本稿では,検出と識別を共同で生成したテキストに符号化するDual Watermarkingを提案する。
論文参考訳（メタデータ） (2025-06-19T02:37:02Z)
LLM Watermarking Using Mixtures and Statistical-to-Computational Gaps [3.9287497907611875]
テキストが与えられたら、大きな言語モデル(LLM)が生成したのか、それとも人間が生成したのかを判断できますか? 閉鎖条件下では検出不能な透かし方式を提案する。また、敵がほとんどのモデルにアクセスできる厳しいオープン環境では、除去不能な透かし方式を提案する。
論文参考訳（メタデータ） (2025-05-02T16:36:43Z)
Provably Robust Watermarks for Open-Source Language Models [5.509756888700397]
オープンソースの言語モデルに対する最初の透かし方式を紹介する。我々のスキームはモデルのパラメータを変更することで機能するが、透かしはモデルの出力だけから検出できる。おそらく驚くべきことに、我々の透かしは敵の知識に関する特定の仮定の下では取り除けないことを証明している。
論文参考訳（メタデータ） (2024-10-24T15:44:34Z)
Command-line Obfuscation Detection using Small Language Models [0.7373617024876725]
敵はしばしば検出を避けるためにコマンドライン難読化を使用する。我々は、カスタムトレーニングされた小さなトランスフォーマー言語モデルを活用する、スケーラブルなNLPベースの検出手法を実装した。確立したマルウェアのシグネチャに対するモデルの優位性を示すとともに,本モデルが検出した未確認の難読化サンプルを示す。
論文参考訳（メタデータ） (2024-08-05T17:01:33Z)
Large Language Model Watermark Stealing With Mixed Integer Programming [51.336009662771396]
大きな言語モデル(LLM)の透かしは、著作権に対処し、AI生成したテキストを監視し、その誤用を防ぐことを約束している。近年の研究では、多数のキーを用いた透かし手法は、攻撃の除去に影響を受けやすいことが示されている。我々は,最先端のLLM透かしスキームに対する新たなグリーンリスト盗難攻撃を提案する。
論文参考訳（メタデータ） (2024-05-30T04:11:17Z)
Black-Box Detection of Language Model Watermarks [1.9374282535132377]
我々は,3つの人気のある透かしスキームファミリーのパラメータを検出し,推定するための厳密な統計試験を開発した。提案手法の有効性を,多種多様なオープンソースモデルを用いて実験的に検証した。以上の結果から,現在の透かし方式は従来考えられていたよりも検出可能であることが示唆された。
論文参考訳（メタデータ） (2024-05-28T08:41:30Z)
Watermarking Language Models for Many Adaptive Users [47.90822587139056]
証明可能な保証付き言語モデルの透かし方式について検討する。モデル生成テキストを個々のユーザに対してトレース可能なマルチユーザ透かしを導入する。検出不能なChrist, Gunn, Zamir (2024) のゼロビットスキームが適応的に堅牢であることを証明する。
論文参考訳（メタデータ） (2024-05-17T22:15:30Z)
Lazy Layers to Make Fine-Tuned Diffusion Models More Traceable [70.77600345240867]
新たな任意の任意配置(AIAO)戦略は、微調整による除去に耐性を持たせる。拡散モデルの入力/出力空間のバックドアを設計する既存の手法とは異なり,本手法では,サンプルサブパスの特徴空間にバックドアを埋め込む方法を提案する。 MS-COCO,AFHQ,LSUN,CUB-200,DreamBoothの各データセットに関する実証研究により,AIAOの堅牢性が確認された。
論文参考訳（メタデータ） (2024-05-01T12:03:39Z)
A Statistical Framework of Watermarks for Large Language Models: Pivot, Detection Efficiency and Optimal Rules [27.678152860666163]
我々は,透かしの統計的効率と強力な検出規則を推論するための枠組みを導入する。枠組みに基づく透かしの最適検出規則を導出する。
論文参考訳（メタデータ） (2024-04-01T17:03:41Z)
An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文参考訳（メタデータ） (2023-07-30T13:43:27Z)
Undetectable Watermarks for Language Models [1.347733333991357]
本稿では,言語モデルに対する検出不能な透かしの概念を紹介する。透かしは秘密鍵の知識でのみ検出できます一方向関数の存在に基づいて検出不能な透かしを構築する。
論文参考訳（メタデータ） (2023-05-25T02:57:16Z)
Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳（メタデータ） (2023-05-24T11:49:52Z)
Did You Train on My Dataset? Towards Public Dataset Protection with Clean-Label Backdoor Watermarking [54.40184736491652]
本稿では,公開データの保護のための一般的な枠組みとして機能するバックドアベースの透かし手法を提案する。データセットに少数の透かしサンプルを挿入することにより、我々のアプローチは、ディフェンダーが設定した秘密関数を暗黙的に学習することを可能にする。この隠れた機能は、データセットを違法に使用するサードパーティモデルを追跡するための透かしとして使用できる。
論文参考訳（メタデータ） (2023-03-20T21:54:30Z)
Can AI-Generated Text be Reliably Detected? [54.670136179857344]
LLMの規制されていない使用は、盗作、偽ニュースの生成、スパムなど、悪意のある結果をもたらす可能性がある。最近の研究は、生成されたテキスト出力に存在する特定のモデルシグネチャを使用するか、透かし技術を適用してこの問題に対処しようとしている。本稿では,これらの検出器は実用シナリオにおいて信頼性が低いことを示す。
論文参考訳（メタデータ） (2023-03-17T17:53:19Z)
Protecting Language Generation Models via Invisible Watermarking [41.532711376512744]
GINSEW(GINSEW)は,テキスト生成モデルが蒸留によって盗難されるのを防ぐ新しい方法である。 GINSEWは,保護されたAPIの生成品質に最小限の影響を伴って,IP侵害の事例を効果的に識別できることを示す。
論文参考訳（メタデータ） (2023-02-06T23:42:03Z)
A Watermark for Large Language Models [84.95327142027183]
本稿では,プロプライエタリな言語モデルのための透かしフレームワークを提案する。透かしはテキストの品質に無視できない影響で埋め込むことができる。言語モデルAPIやパラメータにアクセスすることなく、効率的なオープンソースアルゴリズムを使って検出することができる。
論文参考訳（メタデータ） (2023-01-24T18:52:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。