Fugu-MT 論文翻訳(概要): Towards Optimal Statistical Watermarking

論文の概要: Towards Optimal Statistical Watermarking

arxiv url: http://arxiv.org/abs/2312.07930v1
Date: Wed, 13 Dec 2023 06:57:00 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-14 16:21:37.084419
Title: Towards Optimal Statistical Watermarking
Title（参考訳）: 最適統計透かしに向けて
Authors: Baihe Huang and Banghua Zhu and Hanlin Zhu and Jason D. Lee and Jiantao Jiao and Michael I. Jordan
Abstract要約: 仮説テスト問題として定式化して統計的透かしを研究する。この文脈でUMP(Uniformly Most Powerful)の透かしを特徴付ける。これは、i.d.設定におけるほぼ最適率の透かし問題に関する最初の体系的な統計処理である。
参考スコア（独自算出の注目度）: 97.1563423838916
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We study statistical watermarking by formulating it as a hypothesis testing problem, a general framework which subsumes all previous statistical watermarking methods. Key to our formulation is a coupling of the output tokens and the rejection region, realized by pseudo-random generators in practice, that allows non-trivial trade-off between the Type I error and Type II error. We characterize the Uniformly Most Powerful (UMP) watermark in this context. In the most common scenario where the output is a sequence of $n$ tokens, we establish matching upper and lower bounds on the number of i.i.d. tokens required to guarantee small Type I and Type II errors. Our rate scales as $\Theta(h^{-1} \log (1/h))$ with respect to the average entropy per token $h$ and thus greatly improves the $O(h^{-2})$ rate in the previous works. For scenarios where the detector lacks knowledge of the model's distribution, we introduce the concept of model-agnostic watermarking and establish the minimax bounds for the resultant increase in Type II error. Moreover, we formulate the robust watermarking problem where user is allowed to perform a class of perturbation on the generated texts, and characterize the optimal type II error of robust UMP tests via a linear programming problem. To the best of our knowledge, this is the first systematic statistical treatment on the watermarking problem with near-optimal rates in the i.i.d. setting, and might be of interest for future works.
Abstract（参考訳）: 統計的ウォーターマーキングを仮説検定問題として定式化し,従来のすべての統計ウォーターマーキング法を仮定した。我々の定式化の鍵は出力トークンと拒否領域の結合であり、実際には擬似ランダム生成器によって実現され、I型エラーとII型エラーの非自明なトレードオフを可能にする。この文脈でUMP(Uniformly Most Powerful)の透かしを特徴付ける。出力が$n$トークンのシーケンスである最も一般的なシナリオでは、小さなタイプIとタイプIIのエラーを保証するために必要なi.d.トークンの数に一致する上下境界を確立する。我々のレートは、トークン当たりの平均エントロピーに対して$\Theta(h^{-1} \log (1/h))$としてスケールし、従って以前の作品の$O(h^{-2})$レートを大幅に改善する。検出器がモデル分布の知識を欠くシナリオでは,モデル非依存な透かしの概念を導入し,タイプiiの誤差を増加させるためのミニマックス境界を確立する。さらに、ユーザが生成したテキストに対して摂動のクラスを実行することを許されるロバストな透かし問題を定式化し、線形プログラミング問題を通じてロバストなUMPテストの最適なタイプIIエラーを特徴付ける。我々の知る限りでは、これはウォーターマーキング問題に関する最初の体系的な統計処理であり、すなわち、最適に近い確率で、将来の研究への関心があるかもしれない。

関連論文リスト

Towards Anytime-Valid Statistical Watermarking [63.02116925616554]
我々は、任意の時間価推論で最適なサンプリングを統一する、最初のe-value-based watermarking frameworkであるAnchored E-Watermarkingを開発した。本フレームワークはサンプル効率を大幅に向上させ,最先端のベースラインに対して,検出に必要な平均トークン予算を13～15%削減する。
論文参考訳（メタデータ） (2026-02-19T18:32:26Z)
Novelty detection on path space [13.042396048879242]
我々は,署名に基づくテスト統計を用いた仮説テスト問題として,経路空間の新規性検出を行う。条件付きリスク(CVaR)のスムーズなサロゲートの正確な式を期待シグネチャの観点から導出する。我々は,数値的に-$mathrmI$エラーとシグネチャベースのテスト統計量の統計的パワーを評価する。
論文参考訳（メタデータ） (2025-12-02T21:25:03Z)
Optimal Detection for Language Watermarks with Pseudorandom Collision [28.84134119819056]
階層的な2層分割によって構造を捉える統計的枠組みを導入する。その中核は最小単位の概念であり、単位間の独立として扱うことができる最小の群は、単位内部への依存を許容する。 Gumbel-maxおよび逆変換透かしの適用により、我々のフレームワークはクローズドフォーム最適規則を生成する。
論文参考訳（メタデータ） (2025-10-24T20:21:52Z)
CarBoN: Calibrated Best-of-N Sampling Improves Test-time Reasoning [62.56541355300587]
本稿では,高逆推論経路に向けてモデルを適応的に修正する一般的なテスト時間校正フレームワークを提案する。本フレームワークでは,まず解空間を探索し,次にロジットの校正を学習する二相法であるCarBoNを提案する。 MATH-500とAIME-2024の実験では、CarBoNは効率を向上し、同じ精度に達するために最大4倍のロールアウトが可能である。
論文参考訳（メタデータ） (2025-10-17T14:04:37Z)
Reinforcement Learning with Verifiable yet Noisy Rewards under Imperfect Verifiers [90.50039419576807]
RLVR(Reinforcement Learning with Verifiable Rewards)は、人為的なラベル付けを避けるために、自動検証に対するポリシーを訓練する。認証ハッキングの脆弱性を軽減するため、多くのRLVRシステムはトレーニング中にバイナリ$0,1$の報酬を破棄する。この選択にはコストがかかる:textitfalse negatives(正しい回答、FNを拒絶)とtextitfalse positives(間違った回答、FPを受け入れる)を導入する。
論文参考訳（メタデータ） (2025-10-01T13:56:44Z)
Reliability, Embeddedness, and Agency: A Utility-Driven Mathematical Framework for Agent-Centric AI Adoption [0.0]
我々は,マルチステップタスクを実行するエージェント中心のAIシステムの採用を継続するための3つの公理を定式化する。我々は、崩壊するノベルティ用語と成長するユーティリティ用語の和として、採用をモデル化する。
論文参考訳（メタデータ） (2025-08-18T12:53:38Z)
Fast Convergence for High-Order ODE Solvers in Diffusion Probabilistic Models [5.939858158928473]
拡散確率モデルは、データをノイズに変換するノイズ注入プロセスの逆転を学ぶことでサンプルを生成する。この逆過程を決定論的確率フロー常微分方程式(ODE)として再構成することで、高次解法を用いた効率的なサンプリングが可能になる。スコア関数は一般的にニューラルネットワークによって近似されるため、全体のサンプリング精度を理解する上では、その正則性、近似誤差、数値積分誤差の相互作用を分析することが重要である。
論文参考訳（メタデータ） (2025-06-16T03:09:25Z)
Computational-Statistical Tradeoffs at the Next-Token Prediction Barrier: Autoregressive and Imitation Learning under Misspecification [50.717692060500696]
対数損失を伴う次のトーケン予測は自己回帰シーケンスモデリングの基盤となる。次トーケン予測は、適度な誤差増幅を表す$C=tilde O(H)$を達成するために堅牢にすることができる。 C=e(log H)1-Omega(1)$。
論文参考訳（メタデータ） (2025-02-18T02:52:00Z)
Point Prediction for Streaming Data [27.938266762930994]
本稿では,ストリーミングデータを用いた2つの新しい点予測手法を提案する。 1つはCount-Minスケッチ(CMS)に基づいており、もう1つはランダムなバイアスを持つガウス過程の先行に基づく。
論文参考訳（メタデータ） (2024-08-02T15:12:52Z)
Dirichlet-Based Prediction Calibration for Learning with Noisy Labels [40.78497779769083]
雑音ラベルによる学習はディープニューラルネットワーク(DNN)の一般化性能を著しく損なう既存のアプローチでは、損失補正やサンプル選択手法によってこの問題に対処している。そこで我々は,textitDirichlet-based Prediction (DPC) 法を解法として提案する。
論文参考訳（メタデータ） (2024-01-13T12:33:04Z)
Selective Generation for Controllable Language Models [19.909671258499184]
生成言語モデル(GLM)の信頼性は、重要な意思決定システムへの展開において不可欠である。テキストエンタテインメント関係(FDR-E)に関して、偽発見率を制御する2つの選択的生成アルゴリズムを提案する。選択予測を直接修正した$textttSGentextttSup$は、人間によって注釈付けされたエンテーメントラベル付きデータを悪用する。人間のアノテーションはコストがかかるので、unを完全に活用した半教師付きバージョンである$textttSGentexttSemi$を提案します。
論文参考訳（メタデータ） (2023-07-18T13:36:24Z)
Improved Convergence of Score-Based Diffusion Models via Prediction-Correction [15.772322871598085]
スコアベース生成モデル(SGM)は、複雑なデータ分布からサンプリングする強力なツールである。本稿では,一般的な予測器・相関器方式のバージョンを考慮し,この問題に対処する。まず、不正確なランゲヴィン力学を用いて最終分布を推定し、次にその過程を逆転する。
論文参考訳（メタデータ） (2023-05-23T15:29:09Z)
Transformers meet Stochastic Block Models: Attention with Data-Adaptive Sparsity and Cost [53.746169882193456]
最近の研究は、自己注意の二次的コストを克服するために、様々なスパークアテンションモジュールを提案している。本稿では,それぞれの注意を混合メンバーシップブロックモデルで表現することで,両方の問題を解決するモデルを提案する。我々のモデルは、以前の効率的な変種とオリジナルのトランスフォーマーより優れており、十分に注目されています。
論文参考訳（メタデータ） (2022-10-27T15:30:52Z)
DenseHybrid: Hybrid Anomaly Detection for Dense Open-set Recognition [1.278093617645299]
異常検出は、正規トレーニングデータの生成的モデリングや、負のトレーニングデータに対する識別によって行うことができる。本稿では,大きな自然画像に対して密集した開集合認識が可能なハイブリッド異常スコアを提案する。実験では, 標準密度異常検出ベンチマークと, オープンセット性能の新たな指標であるopen-mIoUについて評価した。
論文参考訳（メタデータ） (2022-07-06T11:48:50Z)
A Conditional Randomization Test for Sparse Logistic Regression in High-Dimension [36.00360315353985]
emphCRT-logitは、変数蒸留ステップとデコレーションステップを組み合わせたアルゴリズムである。本手法の理論的解析を行い,大規模な脳画像とゲノムデータセットの実験とともにシミュレーションにおける有効性を示す。
論文参考訳（メタデータ） (2022-05-29T09:37:16Z)
A Universal Error Measure for Input Predictions Applied to Online Graph Problems [57.58926849872494]
本稿では,入力予測における誤差の定量化のための新しい尺度を提案する。この尺度は、予測されていない要求と予測されていない実際の要求によるエラーをキャプチャする。
論文参考訳（メタデータ） (2022-05-25T15:24:03Z)
SLOE: A Faster Method for Statistical Inference in High-Dimensional Logistic Regression [68.66245730450915]
実用データセットに対する予測の偏見を回避し、頻繁な不確実性を推定する改善された手法を開発している。私たちの主な貢献は、推定と推論の計算時間をマグニチュードの順序で短縮する収束保証付き信号強度の推定器SLOEです。
論文参考訳（メタデータ） (2021-03-23T17:48:56Z)
Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model [50.38446482252857]
本稿では、生成モデル(シミュレータ)へのアクセスを想定して、強化学習のサンプル効率について検討する。最初に$gamma$-discounted infinite-horizon Markov decision process (MDPs) with state space $mathcalS$ and action space $mathcalA$を考える。対象の精度を考慮すれば,モデルに基づく計画アルゴリズムが最小限のサンプルの複雑さを実現するのに十分であることを示す。
論文参考訳（メタデータ） (2020-05-26T17:53:18Z)
Pre-training Is (Almost) All You Need: An Application to Commonsense Reasoning [61.32992639292889]
事前学習されたトランスモデルの微調整は、一般的なNLPタスクを解決するための標準的なアプローチとなっている。そこで本研究では,可視性ランキングタスクをフルテキスト形式でキャストする新たなスコアリング手法を提案する。提案手法は, ランダム再起動にまたがって, より安定した学習段階を提供することを示す。
論文参考訳（メタデータ） (2020-04-29T10:54:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。