論文の概要: ArcMark: Multi-bit LLM Watermark via Optimal Transport
- arxiv url: http://arxiv.org/abs/2602.07235v1
- Date: Fri, 06 Feb 2026 22:28:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.521522
- Title: ArcMark: Multi-bit LLM Watermark via Optimal Transport
- Title(参考訳): ArcMark: 最適輸送によるマルチビットLCM透かし
- Authors: Atefeh Gilani, Carol Xuan Long, Sajani Vithana, Oliver Kosut, Lalitha Sankar, Flavio P. Calmon,
- Abstract要約: マルチビット透かしの最初のキャパシティ特性を示す。
ArcMarkはトークン当たりのビットレートと検出精度で競合するマルチビット透かしよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 20.227686719113134
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Watermarking is an important tool for promoting the responsible use of language models (LMs). Existing watermarks insert a signal into generated tokens that either flags LM-generated text (zero-bit watermarking) or encodes more complex messages (multi-bit watermarking). Though a number of recent multi-bit watermarks insert several bits into text without perturbing average next-token predictions, they largely extend design principles from the zero-bit setting, such as encoding a single bit per token. Notably, the information-theoretic capacity of multi-bit watermarking -- the maximum number of bits per token that can be inserted and detected without changing average next-token predictions -- has remained unknown. We address this gap by deriving the first capacity characterization of multi-bit watermarks. Our results inform the design of ArcMark: a new watermark construction based on coding-theoretic principles that, under certain assumptions, achieves the capacity of the multi-bit watermark channel. In practice, ArcMark outperforms competing multi-bit watermarks in terms of bit rate per token and detection accuracy. Our work demonstrates that LM watermarking is fundamentally a channel coding problem, paving the way for principled coding-theoretic approaches to watermark design.
- Abstract(参考訳): ウォーターマーキングは、言語モデル(LM)の責任ある使用を促進する重要なツールである。
既存の透かしは、LM生成したテキスト(ゼロビット透かし)にフラグを付けるか、より複雑なメッセージ(マルチビット透かし)をエンコードするトークンに信号を挿入する。
最近の複数のマルチビット透かしは、平均的な次点予測を邪魔することなくテキストにいくつかのビットを挿入するが、ゼロビット設定からトークンごとに1ビットを符号化するといった設計原則を大きく拡張した。
特に、マルチビット透かし(トークンごとの最大ビット数)の情報理論能力は、平均的な次の予測を変えることなく挿入され、検出できる。
マルチビット透かしの最初のキャパシティ特性を導出することにより,このギャップに対処する。
符号化理論に基づく新しい透かし構造であるArcMarkの設計は、特定の仮定の下では、マルチビット透かしチャネルのキャパシティを実現する。
実際にArcMarkは、トークン当たりのビットレートと検出精度で競合するマルチビット透かしよりも優れています。
我々の研究は、LM透かしが基本的にチャネルコーディングの問題であり、透かし設計の原理的コーディング理論アプローチの道を開くことを実証している。
関連論文リスト
- Majority Bit-Aware Watermarking For Large Language Models [7.200910949076064]
MajorMarkは、多数ビット認識エンコーディングによるこのトレードオフを改善する新しい透かし手法である。
トークン周波数分析を利用した復号化手法とは対照的に、MajorMarkはクラスタリングベースの復号化戦略を採用している。
我々の手法は復号精度とテキスト生成品質の両方を著しく向上させる。
論文 参考訳(メタデータ) (2025-08-05T18:19:00Z) - DERMARK: A Dynamic, Efficient and Robust Multi-bit Watermark for Large Language Models [18.023143082876015]
テキストを各ウォーターマークビットに対して可変長セグメントに分割する動的で効率的で堅牢なマルチビット透かし法を提案する。
本手法は,埋め込みビット当たりのトークン数を25%削減し,透かし埋め込み時間を50%削減し,テキスト修正や透かし消去攻撃に対して高い堅牢性を維持する。
論文 参考訳(メタデータ) (2025-02-04T11:23:49Z) - Less is More: Sparse Watermarking in LLMs with Enhanced Text Quality [27.592486717044455]
テキストに分散した生成されたトークンの小さなサブセットに透かしを適用することで、このトレードオフを緩和することを目的とした新しいタイプの透かしであるスパース透かしを提案する。
提案手法は,従来の透かし手法よりも高い品質のテキストを生成しつつ,高い検出性を実現することを示す。
論文 参考訳(メタデータ) (2024-07-17T18:52:12Z) - Mark My Words: Analyzing and Evaluating Language Model Watermarks [8.025719866615333]
この研究は、画像やモデル透かしとは対照的に、出力透かし技術に焦点を当てている。
品質、サイズ(透かしを検出するのに必要となるトークンの数)、抵抗の改ざんという3つの主要な指標に注目します。
論文 参考訳(メタデータ) (2023-12-01T01:22:46Z) - An Unforgeable Publicly Verifiable Watermark for Large Language Models [84.2805275589553]
現在の透かし検出アルゴリズムは、透かし生成プロセスで使用される秘密鍵を必要としており、公開検出中にセキュリティ違反や偽造の影響を受ける。
両段階で同じキーを使用するのではなく、2つの異なるニューラルネットワークを用いて透かしの生成と検出を行う。
論文 参考訳(メタデータ) (2023-07-30T13:43:27Z) - A Watermark for Large Language Models [84.95327142027183]
本稿では,プロプライエタリな言語モデルのための透かしフレームワークを提案する。
透かしはテキストの品質に無視できない影響で埋め込むことができる。
言語モデルAPIやパラメータにアクセスすることなく、効率的なオープンソースアルゴリズムを使って検出することができる。
論文 参考訳(メタデータ) (2023-01-24T18:52:59Z) - Watermarking Images in Self-Supervised Latent Spaces [75.99287942537138]
我々は,自己教師型アプローチに照らして,事前学習した深層ネットワークに基づく透かし手法を再検討する。
我々は、マーク時間におけるデータの増大を利用して、マークとバイナリのメッセージをその潜在空間に埋め込む方法を提案する。
論文 参考訳(メタデータ) (2021-12-17T15:52:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。