論文の概要: Robustness Assessment and Enhancement of Text Watermarking for Google's SynthID
- arxiv url: http://arxiv.org/abs/2508.20228v1
- Date: Wed, 27 Aug 2025 19:17:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:01.74355
- Title: Robustness Assessment and Enhancement of Text Watermarking for Google's SynthID
- Title(参考訳): GoogleのSynthIDにおけるテキスト透かしのロバスト性評価と強化
- Authors: Xia Han, Qi Li, Jianbing Ni, Mohammad Zulkernine,
- Abstract要約: SynGuardは、語彙レベルと意味レベルの両方に透かしを埋め込むハイブリッドフレームワークである。
SynthID-Text と比較して,SynGuard は F1 スコアの平均 11.1% で透かしの回復を改善する。
- 参考スコア(独自算出の注目度): 12.477209114987376
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in LLM watermarking methods such as SynthID-Text by Google DeepMind offer promising solutions for tracing the provenance of AI-generated text. However, our robustness assessment reveals that SynthID-Text is vulnerable to meaning-preserving attacks, such as paraphrasing, copy-paste modifications, and back-translation, which can significantly degrade watermark detectability. To address these limitations, we propose SynGuard, a hybrid framework that combines the semantic alignment strength of Semantic Information Retrieval (SIR) with the probabilistic watermarking mechanism of SynthID-Text. Our approach jointly embeds watermarks at both lexical and semantic levels, enabling robust provenance tracking while preserving the original meaning. Experimental results across multiple attack scenarios show that SynGuard improves watermark recovery by an average of 11.1\% in F1 score compared to SynthID-Text. These findings demonstrate the effectiveness of semantic-aware watermarking in resisting real-world tampering. All code, datasets, and evaluation scripts are publicly available at: https://github.com/githshine/SynGuard.
- Abstract(参考訳): Google DeepMindによるSynthID-TextのようなLLM透かし手法の最近の進歩は、AI生成したテキストをトレースする有望なソリューションを提供する。
しかし,SynthID-Textは,パラフレージングやコピー・ペースト,バックトランスレーションなどの意味保存攻撃に対して脆弱であり,透かし検出性を著しく低下させる可能性がある。
このような制約に対処するため,SynGuardはセマンティック情報検索(SIR)とSynthID-Textの確率的透かし機構を組み合わせたハイブリッドフレームワークを提案する。
提案手法は語彙レベルと意味レベルの両方に透かしを埋め込んで,本来の意味を保ちながら頑健な前立腺追跡を可能にする。
複数の攻撃シナリオにまたがる実験の結果、SynGuardはSynthID-Textと比較して、F1スコアの平均11.1\%のウォーターマークリカバリを改善している。
以上の結果から,実世界の改ざんに対する意味認識型透かしの有効性が示唆された。
すべてのコード、データセット、評価スクリプトは、https://github.com/githshine/SynGuard.comで公開されている。
関連論文リスト
- From Trade-off to Synergy: A Versatile Symbiotic Watermarking Framework for Large Language Models [16.89823786392689]
本稿では, シリアル, パラレル, ハイブリッドの3つの戦略を持つ多種多様な共生型透かしフレームワークを提案する。
このハイブリッドフレームワークはトークンエントロピーとセマンティックエントロピーを使用して透かしを適応的に埋め込み、検出可能性、堅牢性、テキスト品質、セキュリティのバランスを最適化する。
論文 参考訳(メタデータ) (2025-05-15T03:12:36Z) - On Evaluating The Performance of Watermarked Machine-Generated Texts Under Adversarial Attacks [20.972194348901958]
まず、メインストリームのウォーターマーキングスキームと、機械生成テキストに対する削除攻撃を組み合わせます。
8つの透かし(5つのプレテキスト、3つのポストテキスト)と12のアタック(2つのプレテキスト、10のポストテキスト)を87のシナリオで評価した。
その結果、KGWとExponentialの透かしは高いテキスト品質と透かしの保持を提供するが、ほとんどの攻撃に対して脆弱であることが示唆された。
論文 参考訳(メタデータ) (2024-07-05T18:09:06Z) - Topic-Based Watermarks for Large Language Models [46.71493672772134]
本稿では,Large Language Model (LLM) 出力のための軽量なトピック誘導型透かし方式を提案する。
本手法は,Google の SynthID-Text など,業界をリードするシステムに匹敵する難易度を実現する。
論文 参考訳(メタデータ) (2024-04-02T17:49:40Z) - Token-Specific Watermarking with Enhanced Detectability and Semantic Coherence for Large Language Models [31.062753031312006]
大規模言語モデルは、潜在的な誤報を伴う高品質な応答を生成する。
ウォーターマーキングは、テキストに隠れたマーカーを埋め込むことによって、この文脈において重要な意味を持つ。
ウォーターマーキングのための新しい多目的最適化(MOO)手法を提案する。
本手法は,検出性と意味的整合性を同時に達成する。
論文 参考訳(メタデータ) (2024-02-28T05:43:22Z) - SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。
局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。
実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-06T03:33:42Z) - Watermarking Conditional Text Generation for AI Detection: Unveiling
Challenges and a Semantic-Aware Watermark Remedy [52.765898203824975]
本研究では,条件付きテキスト生成と入力コンテキストの特性を考慮した意味認識型透かしアルゴリズムを提案する。
実験結果から,提案手法は様々なテキスト生成モデルに対して大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2023-07-25T20:24:22Z) - On the Reliability of Watermarks for Large Language Models [95.87476978352659]
本研究では,人間による書き直し後の透かしテキストの堅牢性,非透かしLDMによる言い換え,あるいはより長い手書き文書への混在性について検討する。
人や機械の言い回しをしても、透かしは検出可能である。
また、大きな文書に埋め込まれた透かし付きテキストの短いスパンに敏感な新しい検出手法についても検討する。
論文 参考訳(メタデータ) (2023-06-07T17:58:48Z) - Tracing Text Provenance via Context-Aware Lexical Substitution [81.49359106648735]
文脈を考慮した語彙置換に基づく自然言語透かし方式を提案する。
主観的および主観的尺度の両面において,我々の透かし方式は原文の意味的整合性を十分に維持することができる。
論文 参考訳(メタデータ) (2021-12-15T04:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。