論文の概要: SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness
- arxiv url: http://arxiv.org/abs/2605.25796v1
- Date: Mon, 25 May 2026 12:46:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.04873
- Title: SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness
- Title(参考訳): SAMark: パラグラフレベルのパラフレーズロバストな自己認識型テキスト透かし
- Authors: Jiahao Huo, Wenjie Qu, Yibo Yan, Kening Zheng, Jiaheng Zhang, Xuming Hu, Philip S. Yu, Mingxun Zhou,
- Abstract要約: 段落レベルのパラフレーズに対するロバスト性は、このような攻撃が文順を変化させることで、世界規模で透かし信号を破壊するため、依然として困難である。
本稿では,意味空間内にステップ非依存のグリーン領域を確立することで文順依存を除去する自己認識型透かしフレームワークSAMarkを提案する。
実験の結果、SAMarkは通常の段落レベルのパラフレーズ攻撃で最大90.2%のTP@FP1%を達成することがわかった。
- 参考スコア(独自算出の注目度): 71.08096624551246
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic-level watermarking (SWM) improves robustness against text modifications by treating sentences as the basic unit. However, robustness to paragraph-level paraphrasing remains difficult because such attacks globally disrupt watermark signals by changing sentence order. In this work, we propose SAMark, a self-anchored watermarking framework that removes the dependency on sentence order by establishing a step-independent green region in semantic space. To improve detectability, we introduce a multi-channel hyperbolic scoring mechanism that amplifies watermark signals while suppressing noise from weakly aligned candidates. We further propose a diversity-aware filtering strategy that combines hard filtering with soft regularization, extending beyond simple n-gram repetition filters to address semantic redundancy. Experimental results show that SAMark achieves up to 90.2% TP@FP1% under typical paragraph-level paraphrasing attacks, outperforming the strongest prior baseline by more than 30% on average, while maintaining generation quality competitive with unwatermarked text and breaking the robustness-quality trade-off that limits prior methods.
- Abstract(参考訳): セマンティックレベルの透かし(SWM)は、文を基本単位として扱うことにより、テキスト修正に対する堅牢性を向上させる。
しかし, 段落レベルの言い回しに対する頑健性は, 文順を変化させることで, 世界的にウォーターマーク信号を破壊しているため, 依然として困難である。
本研究では,意味空間内にステップ非依存のグリーン領域を確立することで,文順への依存を除去する自己認識型透かしフレームワークであるSAMarkを提案する。
検出性を向上させるために,弱整列候補からの雑音を抑えつつ,透かし信号を増幅する多チャンネル双曲スコアリング機構を導入する。
さらに, ハードフィルタとソフト正規化を組み合わせた多様性を考慮したフィルタリング手法を提案し, 意味的冗長性に対応するため, 単純なn-gram繰り返しフィルタを超えて拡張する。
実験の結果、SAMarkは通常のパラフレーズ攻撃で最大90.2%のTP@FP1%を達成し、最強のベースラインを平均30%以上上回った。
関連論文リスト
- More Haste, Less Speed: Weaker Single-Layer Watermark Improves Distortion-Free Watermark Ensembles [58.941305935872265]
強い透かしがトークン分布のエントロピーを著しく減少させることを示す。
本稿では,より弱い単一層透かしを用いて,効率的なマルチ層アンサンブルに必要なエントロピーを保存するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-12T10:18:16Z) - An Ensemble Framework for Unbiased Language Model Watermarking [60.99969104552168]
本研究では,アンサンブル・フレームワークであるENSを提案する。
ENSは複数の独立した透かしインスタンスを順次構成し、それぞれ異なるキーによって管理され、透かし信号を増幅する。
実験的な評価では、ENSは信頼できる検出に必要なトークンの数を大幅に減らし、平滑化やパラフレージング攻撃に対する耐性を高めている。
論文 参考訳(メタデータ) (2025-09-28T19:37:44Z) - PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints [49.2373408329323]
大規模言語モデル(LLM)のための透かしレベル(SWM)に関する新しい理論フレームワークを提案する。
PMarkは単純だが強力なSWM手法であり、サンプリングチャネルを通して中央値の次文を動的に推定する。
実験結果から,PMarkはテキスト品質とパラフレージングの両方において,既存のSWMベースラインを一貫して上回ることがわかった。
論文 参考訳(メタデータ) (2025-09-25T12:08:31Z) - Defending LLM Watermarking Against Spoofing Attacks with Contrastive Representation Learning [34.76886510334969]
ピギーバック攻撃は、元々の透かしを保ったままのヘイトスピーチに変換する透かしテキストの意味を悪意的に変更することができる。
そこで本稿では,元来の意味を保ちつつ,与えられた目標テキストに透かしを埋め込む意味認識型透かしアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-09T04:38:17Z) - SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。
局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。
実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-06T03:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。