論文の概要: AliMark: Enhancing Robustness of Sentence-Level Watermarking Against Text Paraphrasing
- arxiv url: http://arxiv.org/abs/2605.29434v1
- Date: Thu, 28 May 2026 06:30:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 00:00:30.946576
- Title: AliMark: Enhancing Robustness of Sentence-Level Watermarking Against Text Paraphrasing
- Title(参考訳): AliMark: テキストパラフレーズに対する文レベル透かしのロバスト性を高める
- Authors: Yuexin Li, Wenjie Qu, Linyu Wu, Yulin Chen, Yufei He, Tri Cao, Bryan Hooi, Jiaheng Zhang,
- Abstract要約: AliMarkは、文レベルの透かしをビットシーケンスエンコーディングとアライメントの問題として再構成するフレームワークである。
AliMarkは様々なパラフレーズ攻撃で最先端のベースラインを大幅に上回ることを示す。
- 参考スコア(独自算出の注目度): 55.03371974830747
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing sentence-level watermarking methods enhance robustness to paraphrasing by anchoring watermarks in sentence semantics. However, their prefix-based designs remain vulnerable to structural perturbations, such as sentence splitting and merging, which commonly arise under strong paraphrasers like DIPPER and GPT-3.5. To mitigate this issue, we propose AliMark, a framework that reformulates sentence-level watermarking as a bit sequence encoding and alignment problem between a potentially watermarked text and a secret bit sequence. Notably, our approach adopts a two-stage detection strategy: we generate multiple restructured text variants and adaptively align their extracted bit sequences with the secret bit sequence to minimize alignment cost. This multi-candidate alignment design naturally improves robustness to sentence merges and splits. Extensive experiments demonstrate that AliMark substantially outperforms state-of-the-art baselines under diverse paraphrasing attacks.
- Abstract(参考訳): 既存の文レベルの透かし手法は、文意味論において、透かしをアンカーすることでパラフレーズ化に対する堅牢性を高める。
しかし、それらのプレフィックスベースの設計は、DIPPERやGPT-3.5のような強いパラフレーズの下で発生する文分割やマージのような構造的摂動に弱いままである。
この問題を軽減するために,AliMarkを提案する。AliMarkは,文レベルの透かしをビットシーケンスエンコーディングとして再構成し,潜在的透かしテキストと秘密ビットシーケンス間のアライメント問題を解消するフレームワークである。
特に,本手法では,複数の再構成テキスト変種を生成し,抽出したビット列を秘密ビット列に適応的に整列させてアライメントコストを最小化する2段階検出方式を採用する。
この多候補アライメント設計は、文のマージと分割に対する堅牢性を自然に改善する。
大規模な実験では、AliMarkは様々なパラフレーズ攻撃の下で最先端のベースラインを大幅に上回っている。
関連論文リスト
- SAMark: A Self-Anchored Text Watermarking with Paragraph-Level Paraphrase Robustness [71.08096624551246]
段落レベルのパラフレーズに対するロバスト性は、このような攻撃が文順を変化させることで、世界規模で透かし信号を破壊するため、依然として困難である。
本稿では,意味空間内にステップ非依存のグリーン領域を確立することで文順依存を除去する自己認識型透かしフレームワークSAMarkを提案する。
実験の結果、SAMarkは通常の段落レベルのパラフレーズ攻撃で最大90.2%のTP@FP1%を達成することがわかった。
論文 参考訳(メタデータ) (2026-05-25T12:46:15Z) - SWAN: Semantic Watermarking with Abstract Meaning Representation [61.15962841972814]
SWAN(Semantic Watermarking with Abstract Meaning Representation)は、文の意味構造に透かしシグネチャを埋め込む新しいフレームワークである。
シグネチャはセマンティック構造レベルでエンコードされるので、意味を保存するあらゆるパラフレーズはシグネチャを自動的に保存する。
論文 参考訳(メタデータ) (2026-05-05T21:13:30Z) - CoheMark: A Novel Sentence-Level Watermark for Enhanced Text Quality [15.40847234599879]
CoheMarkは、文間の密接な関係を利用して、より論理的な流布を改善する。
CoheMarkは、テキストの品質に最小限の影響を与えながら、強い透かし強度を達成する。
論文 参考訳(メタデータ) (2025-04-24T07:08:13Z) - DERMARK: A Dynamic, Efficient and Robust Multi-bit Watermark for Large Language Models [18.023143082876015]
テキストを各ウォーターマークビットに対して可変長セグメントに分割する動的で効率的で堅牢なマルチビット透かし法を提案する。
本手法は,埋め込みビット当たりのトークン数を25%削減し,透かし埋め込み時間を50%削減し,テキスト修正や透かし消去攻撃に対して高い堅牢性を維持する。
論文 参考訳(メタデータ) (2025-02-04T11:23:49Z) - SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。
局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。
実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-06T03:33:42Z) - Tracing Text Provenance via Context-Aware Lexical Substitution [81.49359106648735]
文脈を考慮した語彙置換に基づく自然言語透かし方式を提案する。
主観的および主観的尺度の両面において,我々の透かし方式は原文の意味的整合性を十分に維持することができる。
論文 参考訳(メタデータ) (2021-12-15T04:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。