論文の概要: Towards Anytime-Valid Statistical Watermarking
- arxiv url: http://arxiv.org/abs/2602.17608v1
- Date: Thu, 19 Feb 2026 18:32:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:29.310453
- Title: Towards Anytime-Valid Statistical Watermarking
- Title(参考訳): 随時統計的透かしをめざして
- Authors: Baihe Huang, Eric Xu, Kannan Ramchandran, Jiantao Jiao, Michael I. Jordan,
- Abstract要約: 我々は、任意の時間価推論で最適なサンプリングを統一する、最初のe-value-based watermarking frameworkであるAnchored E-Watermarkingを開発した。
本フレームワークはサンプル効率を大幅に向上させ,最先端のベースラインに対して,検出に必要な平均トークン予算を13~15%削減する。
- 参考スコア(独自算出の注目度): 63.02116925616554
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The proliferation of Large Language Models (LLMs) necessitates efficient mechanisms to distinguish machine-generated content from human text. While statistical watermarking has emerged as a promising solution, existing methods suffer from two critical limitations: the lack of a principled approach for selecting sampling distributions and the reliance on fixed-horizon hypothesis testing, which precludes valid early stopping. In this paper, we bridge this gap by developing the first e-value-based watermarking framework, Anchored E-Watermarking, that unifies optimal sampling with anytime-valid inference. Unlike traditional approaches where optional stopping invalidates Type-I error guarantees, our framework enables valid, anytime-inference by constructing a test supermartingale for the detection process. By leveraging an anchor distribution to approximate the target model, we characterize the optimal e-value with respect to the worst-case log-growth rate and derive the optimal expected stopping time. Our theoretical claims are substantiated by simulations and evaluations on established benchmarks, showing that our framework can significantly enhance sample efficiency, reducing the average token budget required for detection by 13-15% relative to state-of-the-art baselines.
- Abstract(参考訳): LLM(Large Language Models)の拡散は、機械生成コンテンツと人間のテキストを区別する効率的なメカニズムを必要とする。
統計的透かしは有望な解として現れてきたが、既存の手法はサンプリング分布を選択するための原則的アプローチの欠如と、早期停止を防いでいる固定水平仮説テストへの依存の2つの限界に悩まされている。
本稿では,このギャップを補うために,電子値に基づく最初の電子透かしフレームワークAnchored E-Watermarkingを開発した。
オプションでType-Iエラーの保証を無効にする従来のアプローチとは異なり、我々のフレームワークは検出プロセス用のテストスーパーマーチンゲールを構築することで、有効な、任意の時間推論を可能にします。
ターゲットモデルに近似するためにアンカー分布を利用することにより、最悪の対数成長率に対して最適なe-値を特徴付けるとともに、最適な停止時間を導出する。
我々の理論的な主張は、確立されたベンチマークのシミュレーションと評価によって裏付けられ、我々のフレームワークはサンプル効率を大幅に向上し、最先端のベースラインに対して13~15%の検知に要する平均トークン予算を削減できることを示す。
関連論文リスト
- Improve the Trade-off Between Watermark Strength and Speculative Sampling Efficiency for Language Models [18.988823703120865]
投機的サンプリングは推論を加速し、受容率が増加するにつれて効率が向上する。
高い透かし強度は受け入れを減らし、同時に達成するのを防ぐ。
本稿では,トークンが擬似乱数の決定論的関数である場合に最大化される統計的検出可能性を管理する透かし強度の測定手法を提案する。
論文 参考訳(メタデータ) (2026-02-01T20:30:59Z) - Conformal Prediction Algorithms for Time Series Forecasting: Methods and Benchmarking [0.0]
時系列の時間的依存関係は、データ交換可能性のコア前提に反する。
本稿では,この対立に対処するために設計されたアルゴリズム解の主要なカテゴリについて批判的に検討する。
当社はAutoARIMAを、大規模な月次販売データセットのベース予測ツールとして使用しています。
論文 参考訳(メタデータ) (2026-01-26T14:15:08Z) - Optimal Detection for Language Watermarks with Pseudorandom Collision [28.84134119819056]
階層的な2層分割によって構造を捉える統計的枠組みを導入する。
その中核は最小単位の概念であり、単位間の独立として扱うことができる最小の群は、単位内部への依存を許容する。
Gumbel-maxおよび逆変換透かしの適用により、我々のフレームワークはクローズドフォーム最適規則を生成する。
論文 参考訳(メタデータ) (2025-10-24T20:21:52Z) - Analyzing and Evaluating Unbiased Language Model Watermark [62.982950935139534]
UWbenchは、偏りのない透かし手法の原理的評価を専門とする、最初のオープンソースベンチマークである。
我々の枠組みは理論的な貢献と経験的な貢献を組み合わせている。
我々は,非バイアス性,検出性,堅牢性という3軸評価プロトコルを確立し,トークン改質攻撃がパラフレーズベースの手法よりも安定したロバストネス評価を提供することを示す。
論文 参考訳(メタデータ) (2025-09-28T19:46:01Z) - Principled Input-Output-Conditioned Post-Hoc Uncertainty Estimation for Regression Networks [1.4671424999873808]
不確実性は安全性に敏感なアプリケーションでは重要であるが、予測性能に悪影響を及ぼすため、市販のニューラルネットワークから排除されることが多い。
本稿では,従来の入力と凍結モデルの両方に補助モデルを適用することにより,回帰タスクにおけるポストホック不確実性推定のための理論的基盤となるフレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-01T09:13:27Z) - Theoretically Grounded Framework for LLM Watermarking: A Distribution-Adaptive Approach [53.32564762183639]
大規模言語モデル(LLM)の透かしのための新しい統一的理論フレームワークを導入する。
本研究の目的は,最悪の偽陽性率(FPR)の制御とテキスト品質の歪みを維持しつつ,検出性能を最大化することである。
モデル非依存と効率性に代えて代理モデルを利用する歪みのない分散適応型透かしアルゴリズム(DAWA)を提案する。
論文 参考訳(メタデータ) (2024-10-03T18:28:10Z) - Conformal Generative Modeling with Improved Sample Efficiency through Sequential Greedy Filtering [55.15192437680943]
生成モデルは出力に対する厳密な統計的保証を欠いている。
厳密な統計的保証を満たす予測セットを生成する逐次共形予測法を提案する。
このことは、高い確率で予測セットが少なくとも1つの許容可能な(または有効な)例を含むことを保証している。
論文 参考訳(メタデータ) (2024-10-02T15:26:52Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - A Distributionally Robust Approach to Fair Classification [17.759493152879013]
本研究では、性別や民族などのセンシティブな属性に対する差別を防止する不公平なペナルティを持つロジスティックなロジスティック回帰モデルを提案する。
このモデルは、トレーニングデータ上の経験的分布を中心とするワッサーシュタイン球が分布の不確かさのモデル化に使用される場合、トラクタブル凸最適化問題と等価である。
得られた分類器は, 合成データセットと実データセットの両方において, 予測精度の限界損失による公平性の向上を実証する。
論文 参考訳(メタデータ) (2020-07-18T22:34:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。