論文の概要: Block-wise Codeword Embedding for Reliable Multi-bit Text Watermarking
- arxiv url: http://arxiv.org/abs/2605.00348v1
- Date: Fri, 01 May 2026 02:14:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:28.820283
- Title: Block-wise Codeword Embedding for Reliable Multi-bit Text Watermarking
- Title(参考訳): 信頼性のあるマルチビットテキスト透かしのためのブロックワード埋め込み
- Authors: Joeun Kim, HoEun Kim, Dongsup Jin, Young-Sik Kim,
- Abstract要約: 我々は,このパラダイムをEmphdesignated Validationにシフトさせるフレームワークである textbfBREW (Block-wise Reliable Embedding for Watermarking) を提案する。
我々のフレームワークはモデルに依存しない理論上基礎があり、信頼性の高い法医学的展開のためのスケーラブルなソリューションを提供する。
- 参考スコア(独自算出の注目度): 1.534847923698733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent multi-bit watermarking methods for large language models (LLMs) prioritize capacity over reliability, often conflating decoding with detection. Our analysis reveals that existing ECC-based extractors suffer from catastrophic false positive rates (FPR), and applying rejection thresholds merely collapses detection sensitivity (TPR) to random guessing. To resolve this structural limitation, we propose \textbf{BREW} (Block-wise Reliable Embedding for Watermarking), a framework shifting the paradigm to \emph{designated verification}. BREW employs a two-stage mechanism: (i) \textbf{blind message estimation} via independent block voting, followed by (ii) \textbf{window-shifting verification} that rigorously validates the payload against local edits. Experiments demonstrate that BREW achieves a TPR of 0.965 with an FPR of 0.02 under 10\% synonym substitution, demonstrating that the high-FPR issue is not an inherent trade-off of multi-bit watermarking, but a solvable structural flaw of prior decoding-centric designs. Our framework is model-agnostic and theoretically grounded, providing a scalable solution for reliable forensic deployment.
- Abstract(参考訳): 近年の大規模言語モデル(LLM)のマルチビット透かし手法は、信頼性よりもキャパシティを優先し、デコードと検出を混同することが多い。
分析の結果,既存のECCベースの抽出器は破滅的偽陽性率 (FPR) に悩まされており,検出感度 (TPR) をランダムな推定に当てはめるだけであることがわかった。
この構造的制限を解決するために,このパラダイムを 'emph{designated validation} にシフトさせるフレームワークである \textbf{BREW} (Block-wise Reliable Embedding for Watermarking) を提案する。
BREWは2段階のメカニズムを採用している。
(i)独立ブロック投票によるtextbf{blind message estimation}
(ii)ローカル編集に対してペイロードを厳格に検証するtextbf{window-shifting validation}。
実験により、BREW は 10 % の同義置換の下で 0.02 の FPR で 0.965 の TPR を達成することを示した。
我々のフレームワークはモデルに依存しない理論上基礎があり、信頼性の高い法医学的展開のためのスケーラブルなソリューションを提供する。
関連論文リスト
- VOW: Verifiable and Oblivious Watermark Detection for Large Language Models [4.920744236528847]
プライバシー保護と暗号的に検証可能な透かし検出の両方を実現する新しいプロトコルを提案する。
VOWは短いテキストに対して実用的であり、現代のパラフレーズ攻撃に対する透かしの堅牢性の重要な再評価を提供する。
論文 参考訳(メタデータ) (2026-04-30T10:02:18Z) - Rethinking LLM Watermark Detection in Black-Box Settings: A Non-Intrusive Third-Party Framework [16.430415006488865]
TTP-Detectは、非侵襲的なサードパーティによる透かし検証のために設計された、先駆的なブラックボックスフレームワークである。
プロキシモデルを用いて、透かし関連信号を増幅し、補完的な相対的な測定を行い、透かし付き分布とクエリテキストのアライメントを評価する。
多様な攻撃に対して優れた検出性能と堅牢性を実現する。
論文 参考訳(メタデータ) (2026-03-16T08:28:48Z) - CORE: Context-Robust Remasking for Diffusion Language Models [51.59514489363897]
我々は、推論時リビジョンのためのトレーニング不要フレームワークであるContext-Robust Remasking (CORE)を提案する。
静的トークンの確率を信頼するのではなく、COREは、ターゲットとなるマスク付きコンテキストの摂動に対する感受性を示すことによって、コンテキスト不安定なトークンを識別する。
LLaDA-8B-Baseでは、COREは推論とコードベンチマークの間で一貫した改善を行い、計算に適合したベースラインを上回り、MBPPを最大9.2%改善した。
論文 参考訳(メタデータ) (2026-02-04T00:12:30Z) - Optimal Detection for Language Watermarks with Pseudorandom Collision [28.84134119819056]
階層的な2層分割によって構造を捉える統計的枠組みを導入する。
その中核は最小単位の概念であり、単位間の独立として扱うことができる最小の群は、単位内部への依存を許容する。
Gumbel-maxおよび逆変換透かしの適用により、我々のフレームワークはクローズドフォーム最適規則を生成する。
論文 参考訳(メタデータ) (2025-10-24T20:21:52Z) - Do LLMs Know They Are Being Tested? Evaluation Awareness and Incentive-Sensitive Failures in GPT-OSS-20B [1.948261185683419]
本研究では,「評価香り」がコンメンシュレート能力を得ることなく測定性能を膨らませるかどうかを考察する。
6つのペアのA/Bシナリオを実行し、タスク内容を保持し、フレーミングの異なる状態でデコードします。
再現可能なA/Bフレームワーク(バンキング、バリデータ、ラン毎のスコア、スクリプト)と実践的なガイダンスを提供する。
論文 参考訳(メタデータ) (2025-10-08T09:49:05Z) - An Ensemble Framework for Unbiased Language Model Watermarking [60.99969104552168]
本研究では,アンサンブル・フレームワークであるENSを提案する。
ENSは複数の独立した透かしインスタンスを順次構成し、それぞれ異なるキーによって管理され、透かし信号を増幅する。
実験的な評価では、ENSは信頼できる検出に必要なトークンの数を大幅に減らし、平滑化やパラフレージング攻撃に対する耐性を高めている。
論文 参考訳(メタデータ) (2025-09-28T19:37:44Z) - PMark: Towards Robust and Distortion-free Semantic-level Watermarking with Channel Constraints [49.2373408329323]
大規模言語モデル(LLM)のための透かしレベル(SWM)に関する新しい理論フレームワークを提案する。
PMarkは単純だが強力なSWM手法であり、サンプリングチャネルを通して中央値の次文を動的に推定する。
実験結果から,PMarkはテキスト品質とパラフレージングの両方において,既存のSWMベースラインを一貫して上回ることがわかった。
論文 参考訳(メタデータ) (2025-09-25T12:08:31Z) - StableGuard: Towards Unified Copyright Protection and Tamper Localization in Latent Diffusion Models [55.05404953041403]
拡散生成プロセスにバイナリ透かしをシームレスに統合する新しいフレームワークを提案する。
画像の忠実さ、透かしの検証、ローカライゼーションの改ざんにおいて、StableGuardは一貫して最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-09-22T16:35:19Z) - Theoretically Grounded Framework for LLM Watermarking: A Distribution-Adaptive Approach [53.32564762183639]
大規模言語モデル(LLM)の透かしのための新しい統一的理論フレームワークを導入する。
本研究の目的は,最悪の偽陽性率(FPR)の制御とテキスト品質の歪みを維持しつつ,検出性能を最大化することである。
モデル非依存と効率性に代えて代理モデルを利用する歪みのない分散適応型透かしアルゴリズム(DAWA)を提案する。
論文 参考訳(メタデータ) (2024-10-03T18:28:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。