論文の概要: SimKey: A Semantically Aware Key Module for Watermarking Language Models
- arxiv url: http://arxiv.org/abs/2510.12828v1
- Date: Sat, 11 Oct 2025 20:07:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-16 20:13:28.337969
- Title: SimKey: A Semantically Aware Key Module for Watermarking Language Models
- Title(参考訳): SimKey: ウォーターマーキング言語モデルのためのセマンティックなキーモジュール
- Authors: Shingo Kodama, Haya Diwan, Lucas Rosenblatt, R. Teal Witter, Niv Cohen,
- Abstract要約: 透かしの堅牢性を強化するセマンティックキーモジュールであるSimKeyを紹介する。
SimKeyはセマンティック埋め込みよりも局所性に敏感なハッシュを使用して、パラフレーズ付きテキストが同じ透かしキーを生成する。
言い換えや翻訳に対する透かしの堅牢性を向上し、有害な内容が偽の帰属を防ぎます。
- 参考スコア(独自算出の注目度): 19.115617392855768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The rapid spread of text generated by large language models (LLMs) makes it increasingly difficult to distinguish authentic human writing from machine output. Watermarking offers a promising solution: model owners can embed an imperceptible signal into generated text, marking its origin. Most leading approaches seed an LLM's next-token sampling with a pseudo-random key that can later be recovered to identify the text as machine-generated, while only minimally altering the model's output distribution. However, these methods suffer from two related issues: (i) watermarks are brittle to simple surface-level edits such as paraphrasing or reordering; and (ii) adversaries can append unrelated, potentially harmful text that inherits the watermark, risking reputational damage to model owners. To address these issues, we introduce SimKey, a semantic key module that strengthens watermark robustness by tying key generation to the meaning of prior context. SimKey uses locality-sensitive hashing over semantic embeddings to ensure that paraphrased text yields the same watermark key, while unrelated or semantically shifted text produces a different one. Integrated with state-of-the-art watermarking schemes, SimKey improves watermark robustness to paraphrasing and translation while preventing harmful content from false attribution, establishing semantic-aware keying as a practical and extensible watermarking direction.
- Abstract(参考訳): 大規模言語モデル (LLM) が生成するテキストの急速な拡散により, 機械出力との区別がますます困難になっている。
モデル所有者は、認識できない信号を生成されたテキストに埋め込むことができ、その起源をマークすることができる。
ほとんどの主要なアプローチでは、LLMの次点サンプリングを擬似ランダムキーでシードし、後になってテキストをマシン生成として識別できるが、モデルの出力分布を最小限に変化させるだけである。
しかし、これらの手法は2つの問題に悩まされている。
(i)透かしは、言い換えや並べ替えなどの簡単な表面の編集に脆弱である。
(二 敵は、無関係で潜在的に有害なテキストを付加することができ、その透かしを継承し、モデル所有者に評判を損なうおそれがある。
これらの問題に対処するため、SimKeyというセマンティックキーモジュールを導入し、キー生成を事前のコンテキストの意味に結びつけることで、透かしの堅牢性を強化する。
SimKeyはセマンティック埋め込みよりも局所性に敏感なハッシュを使用して、パラフレーズ付きテキストが同じ透かしキーを出力することを保証する。
シムキーは最先端の透かし方式と統合され、言い換えや翻訳に対する透かしの堅牢性を改善しつつ、有害な内容を偽の帰属から防ぎ、意味認識キーを実用的で拡張可能な透かし方向として確立する。
関連論文リスト
- A Nested Watermark for Large Language Models [6.702383792532788]
大型言語モデル(LLM)は偽ニュースや誤情報を生成するために誤用されることがある。
本稿では、2つの異なる透かしを生成されたテキストに埋め込む新しいネスト付き透かし方式を提案する。
提案手法は,テキストの流速と全体的な品質を維持しつつ,両透かしの高精度な検出を実現する。
論文 参考訳(メタデータ) (2025-06-18T05:49:05Z) - SEAL: Semantic Aware Image Watermarking [26.606008778795193]
本稿では,生成した画像のセマンティック情報を透かしに直接埋め込む新しい透かし手法を提案する。
キーパターンは、局所性に敏感なハッシュを用いて画像のセマンティック埋め込みから推測することができる。
以上の結果から,画像生成モデルによるリスクを軽減できる可能性が示唆された。
論文 参考訳(メタデータ) (2025-03-15T15:29:05Z) - Large Language Model Watermark Stealing With Mixed Integer Programming [51.336009662771396]
大きな言語モデル(LLM)の透かしは、著作権に対処し、AI生成したテキストを監視し、その誤用を防ぐことを約束している。
近年の研究では、多数のキーを用いた透かし手法は、攻撃の除去に影響を受けやすいことが示されている。
我々は,最先端のLLM透かしスキームに対する新たなグリーンリスト盗難攻撃を提案する。
論文 参考訳(メタデータ) (2024-05-30T04:11:17Z) - Watermarking Language Models for Many Adaptive Users [47.90822587139056]
証明可能な保証付き言語モデルの透かし方式について検討する。
モデル生成テキストを個々のユーザに対してトレース可能なマルチユーザ透かしを導入する。
検出不能なChrist, Gunn, Zamir (2024) のゼロビットスキームが適応的に堅牢であることを証明する。
論文 参考訳(メタデータ) (2024-05-17T22:15:30Z) - Adaptive Text Watermark for Large Language Models [8.100123266517299]
プロンプトやモデルの知識を必要とせずに、強力なセキュリティ、堅牢性、および透かしを検出する能力を維持しつつ、高品質な透かしテキストを生成することは困難である。
本稿では,この問題に対処するための適応型透かし手法を提案する。
論文 参考訳(メタデータ) (2024-01-25T03:57:12Z) - Improving the Generation Quality of Watermarked Large Language Models
via Word Importance Scoring [81.62249424226084]
トークンレベルの透かしは、トークン確率分布を変更して生成されたテキストに透かしを挿入する。
この透かしアルゴリズムは、生成中のロジットを変化させ、劣化したテキストの品質につながる可能性がある。
We propose to improve the quality of texts generated by a watermarked language model by Watermarking with Importance Scoring (WIS)。
論文 参考訳(メタデータ) (2023-11-16T08:36:00Z) - A Watermark for Large Language Models [84.95327142027183]
本稿では,プロプライエタリな言語モデルのための透かしフレームワークを提案する。
透かしはテキストの品質に無視できない影響で埋め込むことができる。
言語モデルAPIやパラメータにアクセスすることなく、効率的なオープンソースアルゴリズムを使って検出することができる。
論文 参考訳(メタデータ) (2023-01-24T18:52:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。