Fugu-MT 論文翻訳(概要): Permute-and-Flip: An optimally stable and watermarkable decoder for LLMs

論文の概要: Permute-and-Flip: An optimally stable and watermarkable decoder for LLMs

arxiv url: http://arxiv.org/abs/2402.05864v3
Date: Sat, 15 Mar 2025 04:11:55 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-18 14:56:56.899882
Title: Permute-and-Flip: An optimally stable and watermarkable decoder for LLMs
Title（参考訳）: Permute-and-Flip:LLMのための最適安定かつ透かし可能なデコーダ
Authors: Xuandong Zhao, Lei Li, Yu-Xiang Wang,
Abstract要約: 本稿では,Permute-and-Flip(PF)デコーダと呼ばれる新しいデコーダを提案する。 PFデコーダは標準サンプリングデコーダと同様の安定性を有する。サンプリングよりも品質と安定性のトレードオフが最大で2倍向上している。
参考スコア（独自算出の注目度）: 38.01871178228369
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, we propose a new decoding method called Permute-and-Flip (PF) decoder. It enjoys stability properties similar to the standard sampling decoder, but is provably up to 2x better in its quality-stability tradeoff than sampling and never worse than any other decoder. We also design a cryptographic watermarking scheme analogous to Aaronson (2023)'s Gumbel watermark, but naturally tailored for PF decoder. The watermarking scheme does not change the distribution to sample, while allowing arbitrarily low false positive rate and high recall whenever the generated text has high entropy. Our experiments show that the PF decoder (and its watermarked counterpart) significantly outperform(s) naive sampling (and its Gumbel watermarked counterpart) in terms of perplexity, while retaining the same stability (and detectability), hence making it a promising new approach for LLM decoding. The code is available at https://github.com/XuandongZhao/pf-decoding
Abstract（参考訳）: 本稿では,Permute-and-Flip(PF)デコーダと呼ばれる新しいデコーダを提案する。標準サンプリングデコーダと同様の安定性を保っているが、サンプリングよりも品質と安定性のトレードオフが最大2倍に向上し、他のデコーダよりも悪いことはない。また、Aaronson (2023) の Gumbel 透かしと同様の暗号透かし方式を設計するが、自然にPFデコーダに適合する。透かし方式は、サンプルに分布を変更せず、生成したテキストのエントロピーが高い場合、任意に低い偽陽性率と高いリコールを可能にする。実験の結果, PFデコーダ(および透かし付き)は, 同じ安定性(および検出性)を維持しつつ, 難読性(およびガムベル透かし付き透かし)において有意に優れたサンプリング性能を示し, LLMデコーダの新たなアプローチとして期待できることがわかった。コードはhttps://github.com/XuandongZhao/pf-decodingで入手できる。

関連論文リスト

Optimized Couplings for Watermarking Large Language Models [8.585779208433465]
大規模言語モデル(LLM)は、多くの場合、人間が生成したコンテンツと区別できないようなテキストを生成することができる。本稿では,テキスト透かしをワンショットで解析する。
論文参考訳（メタデータ） (2025-05-13T18:08:12Z)
Robust Multi-bit Text Watermark with LLM-based Paraphrasers [19.785484664254916]
LLMでパラフレーズを埋め込んだ、知覚不能なマルチビットテキスト透かしを提案する。透かしを埋め込むために、2つのパラフレーズを使って文レベルで定義済みのバイナリコードをエンコードします。我々の透かしは、小さな(1.1B)テキストパラフレーズでAUCを99.99%以上検出できることを示す。
論文参考訳（メタデータ） (2024-12-04T08:43:12Z)
$\mathbb{USCD}$: Improving Code Generation of LLMs by Uncertainty-Aware Selective Contrastive Decoding [64.00025564372095]
大規模言語モデル(LLM)は、コード生成において顕著な能力を示している。幻覚の影響(例えば出力ノイズ)は、LLMが1パスで高品質なコードを生成するのを難しくする。単純かつ効果的なtextbfuncertainty-aware textbf select textbfcontrastive textbfdecodingを提案する。
論文参考訳（メタデータ） (2024-09-09T02:07:41Z)
Hold Me Tight: Stable Encoder-Decoder Design for Speech Enhancement [1.4037575966075835]
生のオーディオの1Dフィルターは訓練が困難で、しばしば不安定に悩まされる。これらの問題は、理論駆動とデータ駆動のアプローチを組み合わせたハイブリッドソリューションによって解決される。
論文参考訳（メタデータ） (2024-08-30T15:49:31Z)
Assured LLM-Based Software Engineering [51.003878077888686]
この記事では,2024年4月15日にポルトガルのリスボンで開催された International Workshop on Interpretability, Robustness, and Benchmarking in Neural Software Engineering で,Mark Harman 氏による基調講演の内容の概要を紹介する。
論文参考訳（メタデータ） (2024-02-06T20:38:46Z)
Bit-flipping Decoder Failure Rate Estimation for (v,w)-regular Codes [84.0257274213152]
並列ビットフリップデコーダのDFRを高精度に推定する手法を提案する。本研究は,本症候群のモデル化およびシミュレーションによる重み比較,第1イテレーション終了時の誤りビット分布の誤検出,復号化復号化率(DFR)について検証した。
論文参考訳（メタデータ） (2024-01-30T11:40:24Z)
SemStamp: A Semantic Watermark with Paraphrastic Robustness for Text Generation [72.10931780019297]
既存の透かしアルゴリズムはトークンレベルの設計のため、パラフレーズ攻撃に弱い。局所性に敏感なハッシュ(LSH)に基づく頑健な文レベルのセマンティック透かしアルゴリズムSemStampを提案する。実験結果から,本アルゴリズムは従来手法に比べて,従来手法よりも頑健であるだけでなく,生成品質の維持にも有効であることが示唆された。
論文参考訳（メタデータ） (2023-10-06T03:33:42Z)
Who Wrote this Code? Watermarking for Code Generation [53.24895162874416]
本稿では,機械生成テキストを検出するために,Entropy Thresholding (SWEET) を用いたSelective WatErmarkingを提案する。実験の結果,SWEETはコード品質を著しく向上し,すべてのベースラインを上回ります。
論文参考訳（メタデータ） (2023-05-24T11:49:52Z)
Machine Learning-Aided Efficient Decoding of Reed-Muller Subcodes [59.55193427277134]
Reed-Muller (RM) 符号は、一般的なバイナリインプットメモリレス対称チャネルの容量を達成する。 RM符号は制限されたレートのみを許容する。効率的なデコーダは、RM符号に対して有限長で利用可能である。
論文参考訳（メタデータ） (2023-01-16T04:11:14Z)
Diffsound: Discrete Diffusion Model for Text-to-sound Generation [78.4128796899781]
本稿では,テキストエンコーダ,ベクトル量子化変分自動符号化(VQ-VAE),デコーダ,ボコーダからなる新しいテキスト音声生成フレームワークを提案する。フレームワークは、まず、デコーダを使用して、テキストエンコーダから抽出したテキスト特徴をVQ-VAEの助けを借りてメルスペクトルに転送し、次いで、ボコーダを使用して生成されたメルスペクトルを波形に変換する。
論文参考訳（メタデータ） (2022-07-20T15:41:47Z)
End to End Lip Synchronization with a Temporal AutoEncoder [95.94432031144716]
ビデオ中の唇の動きをオーディオストリームと同期させる問題について検討する。両領域再帰型ニューラルネットワークを用いて最適アライメントを求める。アプリケーションとして、既存のビデオストリームとテキストから音声までの音声を強力にアライメントする能力を実証する。
論文参考訳（メタデータ） (2022-03-30T12:00:18Z)
General tensor network decoding of 2D Pauli codes [0.0]
パウリ雑音を受ける2次元安定化器とサブシステム符号の最大確率復号を近似した復号器を提案する。 3つのノイズモデルの下で4つの符号のクラスを研究することにより,このデコーダのパワーを数値的に実証する。我々はデコーダによって得られる閾値が最先端であり、利用可能な最適しきい値と数値的に一致していることを示す。
論文参考訳（メタデータ） (2021-01-11T19:00:03Z)
Combining hard and soft decoders for hypergraph product codes [0.3326320568999944]
ハイパーグラフ製品コードは、スモールセットフリップ (SSF) と呼ばれる線形時間デコーダを備えた定数レート量子低密度パリティチェック (LDPC) 符号である。このデコーダは、実際には準最適性能を示し、非常に大きなエラー訂正符号を必要とする。本稿では,信念伝搬(BP)アルゴリズムとSFデコーダを組み合わせたハイブリッドデコーダを提案する。
論文参考訳（メタデータ） (2020-04-23T14:48:05Z)
Deep Q-learning decoder for depolarizing noise on the toric code [0.0]
トーリック符号上の非分極雑音の量子誤差補正のためのAIベースの復号化エージェントを提案する。エージェントは、深層強化学習(DRL)を使用してトレーニングされ、人工知能ニューラルネットワークは、エラー修正のための$X$、$Y$、および$Z$ Pauli操作の状態をQ値にエンコードする。 DRL型デコーダは,将来的なトポロジカル符号の誤り訂正のためのフレームワークとして期待できる。
論文参考訳（メタデータ） (2019-12-30T13:27:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。