論文の概要: PVMark: Enabling Public Verifiability for LLM Watermarking Schemes
- arxiv url: http://arxiv.org/abs/2510.26274v1
- Date: Thu, 30 Oct 2025 08:58:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.720217
- Title: PVMark: Enabling Public Verifiability for LLM Watermarking Schemes
- Title(参考訳): PVMark: LLMウォーターマーキングスキームの公開検証性の実現
- Authors: Haohua Duan, Liyao Xiang, Xin Zhang,
- Abstract要約: ゼロ知識証明(ZKP)に基づくプラグインであるPVMarkを提案する。
PVMarkは、秘密鍵を開示することなく、第三者が透かし検出プロセスを公に検証できるようにする。
我々はPython、Rust、CircomでPVMarkの複数の変種を実装し、3つの透かしスキーム、3つのハッシュ関数、4つのZKPプロトコルの組み合わせをカバーしている。
- 参考スコア(独自算出の注目度): 12.082226177179187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Watermarking schemes for large language models (LLMs) have been proposed to identify the source of the generated text, mitigating the potential threats emerged from model theft. However, current watermarking solutions hardly resolve the trust issue: the non-public watermark detection cannot prove itself faithfully conducting the detection. We observe that it is attributed to the secret key mostly used in the watermark detection -- it cannot be public, or the adversary may launch removal attacks provided the key; nor can it be private, or the watermarking detection is opaque to the public. To resolve the dilemma, we propose PVMark, a plugin based on zero-knowledge proof (ZKP), enabling the watermark detection process to be publicly verifiable by third parties without disclosing any secret key. PVMark hinges upon the proof of `correct execution' of watermark detection on which a set of ZKP constraints are built, including mapping, random number generation, comparison, and summation. We implement multiple variants of PVMark in Python, Rust and Circom, covering combinations of three watermarking schemes, three hash functions, and four ZKP protocols, to show our approach effectively works under a variety of circumstances. By experimental results, PVMark efficiently enables public verifiability on the state-of-the-art LLM watermarking schemes yet without compromising the watermarking performance, promising to be deployed in practice.
- Abstract(参考訳): 大規模言語モデル(LLM)のための透かしスキームは、生成されたテキストのソースを特定するために提案され、モデル盗難から潜在的な脅威を軽減している。
しかし、現在の透かし法は信頼の問題をほとんど解決しない:非公的な透かし検出は、その検出を忠実に行うことを証明できない。
ウォーターマーク検出で主に使用される秘密鍵に起因している - 公開できない、あるいは敵がキーが提供された削除攻撃を開始する可能性がある、あるいは、プライベートでも、ウォーターマーク検出が一般に不透明である、といったことが観察されている。
このジレンマを解決するために,ゼロ知識証明(ZKP)に基づくプラグインであるPVMarkを提案する。
PVMarkは、マッピング、乱数生成、比較、和を含む一連のZKP制約が構築されている透かし検出の'正しい実行'の証明に基づいている。
我々はPython、Rust、CircomでPVMarkの複数の変種を実装し、3つの透かしスキーム、3つのハッシュ関数、4つのZKPプロトコルの組み合わせをカバーし、このアプローチが様々な状況下で効果的に動作することを示す。
実験結果により,PVMark は透かし性能を損なうことなく,最先端の LLM 透かし方式の公的な検証を効率よく実現し,実際に展開することを約束する。
関連論文リスト
- CLUE-MARK: Watermarking Diffusion Models using CLWE [8.429227679450433]
本稿では,拡散モデルに対する最初の検出不能な透かし方式であるCLUE-Markを紹介する。
CLUE-Markは、ウォーターマークされたモデルの変更を一切必要とせず、計算効率が良く、モデル出力の品質に影響を与えないことが保証されている。
CLUE-Markは、最近のステガノグラフィー攻撃では検出や除去ができない。
論文 参考訳(メタデータ) (2024-11-18T10:03:01Z) - Black-Box Detection of Language Model Watermarks [1.9374282535132377]
我々は,3つの人気のある透かしスキームファミリーのパラメータを検出し,推定するための厳密な統計試験を開発した。
提案手法の有効性を,多種多様なオープンソースモデルを用いて実験的に検証した。
以上の結果から,現在の透かし方式は従来考えられていたよりも検出可能であることが示唆された。
論文 参考訳(メタデータ) (2024-05-28T08:41:30Z) - Publicly-Detectable Watermarking for Language Models [45.32236917886154]
本稿では,LMの電子透かし方式について述べる。
我々は、リジェクションサンプリングを用いてLM出力に暗号署名を埋め込む。
我々は,この手法が不規則かつ歪みのないテキスト出力を生成することを証明した。
論文 参考訳(メタデータ) (2023-10-27T21:08:51Z) - Unbiased Watermark for Large Language Models [67.43415395591221]
本研究では, モデル生成出力の品質に及ぼす透かしの影響について検討した。
出力確率分布に影響を与えることなく、透かしを統合することができる。
ウォーターマークの存在は、下流タスクにおけるモデルの性能を損なうものではない。
論文 参考訳(メタデータ) (2023-09-22T12:46:38Z) - An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。
両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文 参考訳(メタデータ) (2023-07-30T13:43:27Z) - A Watermark for Large Language Models [84.95327142027183]
本稿では,プロプライエタリな言語モデルのための透かしフレームワークを提案する。
透かしはテキストの品質に無視できない影響で埋め込むことができる。
言語モデルAPIやパラメータにアクセスすることなく、効率的なオープンソースアルゴリズムを使って検出することができる。
論文 参考訳(メタデータ) (2023-01-24T18:52:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。