論文の概要: On Google's SynthID-Text LLM Watermarking System: Theoretical Analysis and Empirical Validation
- arxiv url: http://arxiv.org/abs/2603.03410v1
- Date: Tue, 03 Mar 2026 17:49:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.043747
- Title: On Google's SynthID-Text LLM Watermarking System: Theoretical Analysis and Empirical Validation
- Title(参考訳): GoogleのSynthID-Text LLM透かしシステムについて:理論的解析と実証的検証
- Authors: Romina Omidi, Yun Dong, Binghui Wang,
- Abstract要約: GoogleのSynthID-Textは、大規模な言語モデルのためのプロダクション対応のジェネレーティブな透かしシステムである。
本稿では,SynthID-Textに関する最初の理論的解析を行い,検出性能と透かしの堅牢性に着目した。
- 参考スコア(独自算出の注目度): 29.19181601635414
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Google's SynthID-Text, the first ever production-ready generative watermark system for large language model, designs a novel Tournament-based method that achieves the state-of-the-art detectability for identifying AI-generated texts. The system's innovation lies in: 1) a new Tournament sampling algorithm for watermarking embedding, 2) a detection strategy based on the introduced score function (e.g., Bayesian or mean score), and 3) a unified design that supports both distortionary and non-distortionary watermarking methods. This paper presents the first theoretical analysis of SynthID-Text, with a focus on its detection performance and watermark robustness, complemented by empirical validation. For example, we prove that the mean score is inherently vulnerable to increased tournament layers, and design a layer inflation attack to break SynthID-Text. We also prove the Bayesian score offers improved watermark robustness w.r.t. layers and further establish that the optimal Bernoulli distribution for watermark detection is achieved when the parameter is set to 0.5. Together, these theoretical and empirical insights not only deepen our understanding of SynthID-Text, but also open new avenues for analyzing effective watermark removal strategies and designing robust watermarking techniques. Source code is available at https: //github.com/romidi80/Synth-ID-Empirical-Analysis.
- Abstract(参考訳): GoogleのSynthID-Textは、大規模な言語モデルのための最初の生産可能な生成用透かしシステムであり、AI生成したテキストを識別するための最先端の検出性を実現するTournamentベースの新しいメソッドを設計している。
システムの革新は次のとおりである。
1)透かし埋め込みのための新しいトーナメントサンプリングアルゴリズム
2)導入したスコア関数(例えばベイズ平均スコア)に基づく検出戦略、及び
3)歪みおよび非歪な透かし法の両方をサポートする統一設計。
本稿では,SynthID-Textの最初の理論的解析を行い,その検出性能と透かしの堅牢性に着目し,実証検証によって補完する。
例えば、平均スコアが本質的にトーナメント層の増加に対して脆弱であることを証明し、SynthID-Textを破るためにレイヤーインフレーションアタックを設計する。
また,ベイジアンスコアが透かしの堅牢性を向上させることを証明し,パラメータが0.5に設定された場合,透かし検出のための最適なベルヌーイ分布が達成されることを確認した。
これらの理論的および実証的な洞察は、SynthID-Textの理解を深めるだけでなく、効果的な透かし除去戦略を分析し、堅牢な透かし技術を設計するための新たな道を開いた。
ソースコードはhttps: //github.com/romidi80/Synth-ID-Empirical-Analysisで公開されている。
関連論文リスト
- WaterSearch: A Quality-Aware Search-based Watermarking Framework for Large Language Models [17.137667672391725]
WaterSearchは文レベルの検索ベースの透かしフレームワークである。
WaterSearchは,1)分布の忠実度と2)透かし信号特性の2つの重要な側面を共同最適化することにより,テキスト品質を向上させる。
本手法は,最先端のベースラインに対して平均51.01%の性能向上を実現する。
論文 参考訳(メタデータ) (2025-11-30T11:11:21Z) - WISER: Segmenting watermarked region - an epidemic change-point perspective [0.0]
We propose WISER: a novel, computely efficient, watermark segmentation algorithm。
WISERは最先端のベースライン法よりも優れていることを示す。
また、古典的な統計問題からの洞察が理論的に有効で計算学的に効率的な解をもたらすことを示す。
論文 参考訳(メタデータ) (2025-09-25T13:44:34Z) - PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints [49.2373408329323]
大規模言語モデル(LLM)のための透かしレベル(SWM)に関する新しい理論フレームワークを提案する。
PMarkは単純だが強力なSWM手法であり、サンプリングチャネルを通して中央値の次文を動的に推定する。
実験結果から,PMarkはテキスト品質とパラフレージングの両方において,既存のSWMベースラインを一貫して上回ることがわかった。
論文 参考訳(メタデータ) (2025-09-25T12:08:31Z) - Robustness Assessment and Enhancement of Text Watermarking for Google's SynthID [12.477209114987376]
SynGuardは、語彙レベルと意味レベルの両方に透かしを埋め込むハイブリッドフレームワークである。
SynthID-Text と比較して,SynGuard は F1 スコアの平均 11.1% で透かしの回復を改善する。
論文 参考訳(メタデータ) (2025-08-27T19:17:09Z) - From Trade-off to Synergy: A Versatile Symbiotic Watermarking Framework for Large Language Models [16.89823786392689]
本稿では, シリアル, パラレル, ハイブリッドの3つの戦略を持つ多種多様な共生型透かしフレームワークを提案する。
このハイブリッドフレームワークはトークンエントロピーとセマンティックエントロピーを使用して透かしを適応的に埋め込み、検出可能性、堅牢性、テキスト品質、セキュリティのバランスを最適化する。
論文 参考訳(メタデータ) (2025-05-15T03:12:36Z) - Optimized Couplings for Watermarking Large Language Models [8.585779208433465]
大規模言語モデル(LLM)は、多くの場合、人間が生成したコンテンツと区別できないようなテキストを生成することができる。
本稿では,テキスト透かしをワンショットで解析する。
論文 参考訳(メタデータ) (2025-05-13T18:08:12Z) - GaussMark: A Practical Approach for Structural Watermarking of Language Models [61.84270985214254]
GaussMarkは、大規模な言語モデルを透かし出すためのシンプルで効率的で比較的堅牢なスキームである。
GaussMarkは信頼性が高く、効率的で、挿入、削除、置換、ラウンドトリップ翻訳などの汚職に対して比較的堅牢であることを示す。
論文 参考訳(メタデータ) (2025-01-17T22:30:08Z) - Theoretically Grounded Framework for LLM Watermarking: A Distribution-Adaptive Approach [53.32564762183639]
大規模言語モデル(LLM)の透かしのための新しい統一的理論フレームワークを導入する。
本研究の目的は,最悪の偽陽性率(FPR)の制御とテキスト品質の歪みを維持しつつ,検出性能を最大化することである。
モデル非依存と効率性に代えて代理モデルを利用する歪みのない分散適応型透かしアルゴリズム(DAWA)を提案する。
論文 参考訳(メタデータ) (2024-10-03T18:28:10Z) - Duwak: Dual Watermarks in Large Language Models [49.00264962860555]
トークン確率分布とサンプリングスキームの両方に二重秘密パターンを埋め込むことにより、透かしの効率と品質を向上させるために、Duwakを提案する。
Llama2でDuwakを4つの最先端透かし技術と組み合わせて評価した。
論文 参考訳(メタデータ) (2024-03-12T16:25:38Z) - SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。
局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。
実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-06T03:33:42Z) - An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。
両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文 参考訳(メタデータ) (2023-07-30T13:43:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。