論文の概要: SWAN: Semantic Watermarking with Abstract Meaning Representation
- arxiv url: http://arxiv.org/abs/2605.04305v1
- Date: Tue, 05 May 2026 21:13:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-07 18:41:07.548389
- Title: SWAN: Semantic Watermarking with Abstract Meaning Representation
- Title(参考訳): SWAN:抽象的意味表現による意味的透かし
- Authors: Ziping Ye, Gourab Dey, Christos Christodoulopoulos, Charith Peris, Anil Ramakrishna, Weitong Ruan, Aram Galstyan, Kai-Wei Chang, Rahul Gupta, Ninareh Mehrabi,
- Abstract要約: SWAN(Semantic Watermarking with Abstract Meaning Representation)は、文の意味構造に透かしシグネチャを埋め込む新しいフレームワークである。
シグネチャはセマンティック構造レベルでエンコードされるので、意味を保存するあらゆるパラフレーズはシグネチャを自動的に保存する。
- 参考スコア(独自算出の注目度): 61.15962841972814
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We introduce SWAN (Semantic Watermarking with Abstract Meaning Representation), a novel framework that embeds watermark signatures into the semantic structure of a sentence using Abstract Meaning Representation (AMR). In contrast to existing watermarking methods, which typically encode signatures by adjusting token selection preferences during text generation, SWAN embeds the signature directly in the sentence's semantic representation. As the signature is encoded at the semantic structure level, any paraphrase that preserves meaning automatically preserves the signature. SWAN is training-free: watermark injection is achieved by prompting an LLM to generate sentences guided by a selected AMR template while maintaining contextual coherence, and detection uses an off-the-shelf AMR parser followed by a simple one-proportion z-test. Empirical evaluation on the RealNews benchmark shows SWAN matches state-of-the-art detection performance on unaltered watermarked text, while significantly improving robustness against paraphrasing, increasing detection AUC by up to 13.9 percentage points compared to prior methods. These results demonstrate that SWAN's approach of anchoring watermarks in AMR semantic structures provides a simple, effective, and prompt-based method for robust text provenance verification under paraphrasing, opening new avenues for semantic-level watermarking research.
- Abstract(参考訳): SWAN(Semantic Watermarking with Abstract Meaning Representation)は,AMR(Abstract Meaning Representation)を用いた文の意味構造に透かしシグネチャを埋め込む新しいフレームワークである。
テキスト生成中にトークン選択の好みを調整することで署名を符号化する既存の透かし方式とは対照的に、SWANはその署名を文の意味表現に直接埋め込む。
シグネチャはセマンティック構造レベルでエンコードされるので、意味を保存するあらゆるパラフレーズはシグネチャを自動的に保存する。
SWANは、文脈的コヒーレンスを維持しつつ、LLMに選択されたAMRテンプレートでガイドされた文を生成するように促すことにより、トレーニングフリーである。
RealNewsベンチマークの実証評価では、SWANは未修正の透かしテキスト上での最先端の検出性能と一致し、パラフレージングに対する堅牢性を著しく改善し、AUCを以前の方法と比較して最大13.9ポイント向上した。
これらの結果は、SWANのAMRセマンティック構造における透かしをアンカーするアプローチが、パラフレーズによる堅牢なテキスト証明のためのシンプルで効果的で迅速な手法を提供し、セマンティックレベルの透かし研究のための新たな道を開くことを示している。
関連論文リスト
- Defending LLM Watermarking Against Spoofing Attacks with Contrastive Representation Learning [34.76886510334969]
ピギーバック攻撃は、元々の透かしを保ったままのヘイトスピーチに変換する透かしテキストの意味を悪意的に変更することができる。
そこで本稿では,元来の意味を保ちつつ,与えられた目標テキストに透かしを埋め込む意味認識型透かしアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-09T04:38:17Z) - Less is More: Sparse Watermarking in LLMs with Enhanced Text Quality [27.592486717044455]
テキストに分散した生成されたトークンの小さなサブセットに透かしを適用することで、このトレードオフを緩和することを目的とした新しいタイプの透かしであるスパース透かしを提案する。
提案手法は,従来の透かし手法よりも高い品質のテキストを生成しつつ,高い検出性を実現することを示す。
論文 参考訳(メタデータ) (2024-07-17T18:52:12Z) - Token-Specific Watermarking with Enhanced Detectability and Semantic Coherence for Large Language Models [31.062753031312006]
大規模言語モデルは、潜在的な誤報を伴う高品質な応答を生成する。
ウォーターマーキングは、テキストに隠れたマーカーを埋め込むことによって、この文脈において重要な意味を持つ。
ウォーターマーキングのための新しい多目的最適化(MOO)手法を提案する。
本手法は,検出性と意味的整合性を同時に達成する。
論文 参考訳(メタデータ) (2024-02-28T05:43:22Z) - A Robust Semantics-based Watermark for Large Language Model against Paraphrasing [50.84892876636013]
大規模言語モデル(LLM)は、様々な自然言語処理において優れた能力を示している。
LLMは不適切にも違法にも使用できるという懸念がある。
本稿ではセマンティクスに基づく透かしフレームワークSemaMarkを提案する。
論文 参考訳(メタデータ) (2023-11-15T06:19:02Z) - SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。
局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。
実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文 参考訳(メタデータ) (2023-10-06T03:33:42Z) - Tracing Text Provenance via Context-Aware Lexical Substitution [81.49359106648735]
文脈を考慮した語彙置換に基づく自然言語透かし方式を提案する。
主観的および主観的尺度の両面において,我々の透かし方式は原文の意味的整合性を十分に維持することができる。
論文 参考訳(メタデータ) (2021-12-15T04:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。