論文の概要: Every Bit, Everywhere, All at Once: A Binomial Multibit LLM Watermark
- arxiv url: http://arxiv.org/abs/2605.11653v1
- Date: Tue, 12 May 2026 07:14:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.657568
- Title: Every Bit, Everywhere, All at Once: A Binomial Multibit LLM Watermark
- Title(参考訳): バイノミカルなマルチビットLCMのウォーターマーク
- Authors: Thibaud Gloaguen, Robin Staab, Mark Vero, Martin Vechev,
- Abstract要約: トークン位置毎にペイロードのすべてのビットをエンコードするために二項符号化を導入する。
我々は、エンコーディングの圧力を未符号化ビットに動的にリダイレクトするステートフルエンコーダを用いて、我々のアプローチを補完する。
提案手法は,メッセージの精度とロバスト性を向上し,ベースライン手法とのギャップを拡大する。
- 参考スコア(独自算出の注目度): 16.543554028816477
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With LLM watermarking already being deployed commercially, practical applications increasingly require multibit watermarks that encode more complex payloads, such as user IDs or timestamps, into the generated text. In this work, we propose a fundamentally new approach for multibit watermarking: introducing binomial encoding to directly encode every bit of the payload at every token position. We complement our approach with a stateful encoder that during generation dynamically redirects encoding pressure toward underencoded bits. Our evaluation against 8 baselines on up to 64-bit payloads shows that our scheme achieves superior message accuracy and robustness, with the gap to baseline methods widening in more relevant settings (i.e., large payloads and low-distortion regimes). At the same time, we challenge prior works' evaluation metrics, highlighting their lack of practical insights, and introduce per-bit confidence scoring as a practically relevant metric for evaluating multibit LLM watermarks.
- Abstract(参考訳): LLMの透かしは既に商用化されているため、実際のアプリケーションは、ユーザIDやタイムスタンプといったより複雑なペイロードを生成されたテキストにエンコードするマルチビットの透かしを必要としている。
本研究では,各トークン位置におけるペイロードのすべてのビットを直接エンコードするために二項符号化を導入するという,マルチビット透かしの基本的なアプローチを提案する。
提案手法をステートフルなエンコーダで補完し、生成中のエンコード圧力をアンダーエンコードビットに動的にリダイレクトする。
最大64ビットのペイロード上での8つのベースラインに対する評価は,提案手法がより適切な設定(大容量ペイロードと低歪みレギュレーション)で拡張されたベースライン手法とのギャップにより,メッセージの精度とロバスト性を向上することを示す。
同時に、先行研究の評価基準に挑戦し、実用的洞察の欠如を強調し、マルチビットLCM透かしを評価するための実用的な指標として、ビットごとの信頼度スコアを導入する。
関連論文リスト
- ArcMark: Multi-bit LLM Watermark via Optimal Transport [20.227686719113134]
マルチビット透かしの最初のキャパシティ特性を示す。
ArcMarkはトークン当たりのビットレートと検出精度で競合するマルチビット透かしよりも優れていることを示す。
論文 参考訳(メタデータ) (2026-02-06T22:28:03Z) - From Bits to Rounds: Parallel Decoding with Exploration for Diffusion Language Models [19.97248408121574]
Diffusion Language Models (DLMs) は並列デコードにより高速な推論速度で同等の精度を提供する。
高信頼トークンは無視可能な情報を持ち、それらに厳密に依存することで、各デコードラウンドにおける効果的な進捗を制限する。
本研究では,情報スループットと復号効率を最大化する学習自由復号法であるExplore-Then-Exploit (ETE)を提案する。
論文 参考訳(メタデータ) (2025-11-26T06:38:37Z) - Majority Bit-Aware Watermarking For Large Language Models [7.200910949076064]
MajorMarkは、多数ビット認識エンコーディングによるこのトレードオフを改善する新しい透かし手法である。
トークン周波数分析を利用した復号化手法とは対照的に、MajorMarkはクラスタリングベースの復号化戦略を採用している。
我々の手法は復号精度とテキスト生成品質の両方を著しく向上させる。
論文 参考訳(メタデータ) (2025-08-05T18:19:00Z) - METEOR: Multi-Encoder Collaborative Token Pruning for Efficient Vision Language Models [92.37117312251755]
プログレッシブプルーニングフレームワークであるMulti-Encoder collaboraTivE tOken pRuning (METEOR)を提案する。
マルチビジョン符号化では,各エンコーダ内の冗長トークンをランク誘導型協調トークン代入戦略により破棄する。
マルチビジョン融合では、異なるエンコーダの視覚的特徴を組み合わせながら、コラボレーティブプルーニングによるクロスエンコーダ冗長性を低減させる。
論文 参考訳(メタデータ) (2025-07-28T13:50:53Z) - Robust Multi-bit Text Watermark with LLM-based Paraphrasers [19.785484664254916]
LLMでパラフレーズを埋め込んだ、知覚不能なマルチビットテキスト透かしを提案する。
透かしを埋め込むために、2つのパラフレーズを使って文レベルで定義済みのバイナリコードをエンコードします。
我々の透かしは、小さな(1.1B)テキストパラフレーズでAUCを99.99%以上検出できることを示す。
論文 参考訳(メタデータ) (2024-12-04T08:43:12Z) - Let the Code LLM Edit Itself When You Edit the Code [50.46536185784169]
underlinetextbfPositional textbfIntegrity textbfEncoding (PIE)
PIEは、標準的な完全再計算手法に比べて計算オーバーヘッドを85%以上削減する。
その結果、PIEは計算オーバーヘッドを標準の完全再計算手法に比べて85%以上削減することを示した。
論文 参考訳(メタデータ) (2024-07-03T14:34:03Z) - CodeIP: A Grammar-Guided Multi-Bit Watermark for Large Language Models of Code [56.019447113206006]
大規模言語モデル(LLM)はコード生成において顕著な進歩を遂げた。
CodeIPは、新しいマルチビット透かし技術で、出所の詳細を保持するために追加情報を挿入する。
5つのプログラミング言語にまたがる実世界のデータセットで実施された実験は、CodeIPの有効性を実証している。
論文 参考訳(メタデータ) (2024-04-24T04:25:04Z) - Parallel Decoding via Hidden Transfer for Lossless Large Language Model Acceleration [54.897493351694195]
本稿では,複数連続するトークンを1つのフォワードパスで同時に復号する,新しい並列復号法,すなわちthithidden Transferを提案する。
加速度測定では,Medusa や Self-Speculative decoding など,単モデル加速技術よりも優れています。
論文 参考訳(メタデータ) (2024-04-18T09:17:06Z) - Advancing Beyond Identification: Multi-bit Watermark for Large Language Models [31.066140913513035]
機械生成テキストの識別を超えて,大規模言語モデルの誤用に対処する可能性を示す。
言語モデル生成中にトレーサブルなマルチビット情報を埋め込んだ位置アロケーションによるマルチビット透かしを提案する。
論文 参考訳(メタデータ) (2023-08-01T01:27:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。