Fugu-MT 論文翻訳(概要): Controlled LLM Decoding via Discrete Auto-regressive Biasing

論文の概要: Controlled LLM Decoding via Discrete Auto-regressive Biasing

arxiv url: http://arxiv.org/abs/2502.03685v1
Date: Thu, 06 Feb 2025 00:14:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-07 15:30:40.576294
Title: Controlled LLM Decoding via Discrete Auto-regressive Biasing
Title（参考訳）: 離散自己回帰バイアスによるLLM復号制御
Authors: Patrick Pynadath, Ruqi Zhang,
Abstract要約: 制御されたテキスト生成は、大きな言語モデルの出力に対してユーザ定義の制約を強制することができる。離散テキスト領域で完全に動作しながら勾配を利用する制御復号アルゴリズムである離散自己回帰バイアス法を提案する。提案手法は,計算コストの低減を図るとともに,制約満足度を著しく向上させる。
参考スコア（独自算出の注目度）: 9.843359827321194
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Controlled text generation allows for enforcing user-defined constraints on large language model outputs, an increasingly important field as LLMs become more prevalent in everyday life. One common approach uses energy-based decoding, which defines a target distribution through an energy function that combines multiple constraints into a weighted average. However, these methods often struggle to balance fluency with constraint satisfaction, even with extensive tuning of the energy function's coefficients. In this paper, we identify that this suboptimal balance arises from sampling in continuous space rather than the natural discrete space of text tokens. To address this, we propose Discrete Auto-regressive Biasing, a controlled decoding algorithm that leverages gradients while operating entirely in the discrete text domain. Specifically, we introduce a new formulation for controlled text generation by defining a joint distribution over the generated sequence and an auxiliary bias sequence. To efficiently sample from this joint distribution, we propose a Langevin-within-Gibbs sampling algorithm using gradient-based discrete MCMC. Our method significantly improves constraint satisfaction while maintaining comparable or better fluency, all with even lower computational costs. We demonstrate the advantages of our controlled decoding method on sentiment control, language detoxification, and keyword-guided generation.
Abstract（参考訳）: 制御されたテキスト生成は、LLMが日常的に普及するにつれて、大きな言語モデル出力に対するユーザ定義の制約を強制することができる。 1つの一般的なアプローチはエネルギーベースの復号法であり、複数の制約を重み付き平均に組み合わせたエネルギー関数による目標分布を定義する。しかしながら、これらの手法は、エネルギー関数の係数を広範囲に調整しても、フラエンシと制約満足度のバランスをとるのにしばしば苦労する。本稿では,テキストトークンの自然な離散空間ではなく,連続空間におけるサンプリングから,この準最適バランスが生じることを確かめる。これを解決するために、離散テキスト領域で完全に動作しながら勾配を利用する制御された復号アルゴリズムである離散自己回帰バイアス法を提案する。具体的には、生成シーケンス上の結合分布と補助バイアスシーケンスを定義することによって、制御されたテキスト生成のための新しい定式化を導入する。この共同分布を効率的にサンプリングするために,勾配に基づく離散MCMCを用いたLangevin-within-Gibbsサンプリングアルゴリズムを提案する。提案手法は,計算コストの低減を図るとともに,制約満足度を著しく向上させる。我々は,感情制御,言語デトキシ化,キーワード誘導生成における制御された復号化手法の利点を実証する。

関連論文リスト

Fast Controlled Generation from Language Models with Adaptive Weighted Rejection Sampling [90.86991492288487]
トークンの制約を評価するのは違法にコストがかかる LCDは文字列上のグローバル分布を歪め、ローカル情報のみに基づいてトークンをサンプリングすることができる。我々のアプローチは最先端のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2025-04-07T18:30:18Z)
Style Quantization for Data-Efficient GAN Training [18.40243591024141]
限られたデータ設定の下では、GANは入力潜在空間をナビゲートし効果的に活用するのに苦労することが多い。一貫性の整合性を高める新しいアプローチである textitSQ-GAN を提案する。実験は判別器の堅牢性と生成品質の両方において顕著な改善を示した。
論文参考訳（メタデータ） (2025-03-31T16:28:44Z)
Constrained Language Generation with Discrete Diffusion Models [61.81569616239755]
本稿では,離散拡散モデルと微分可能最適化を統合し,自然言語に制約を課す新しい手法であるConstrained Discrete Diffusion (CDD)を提案する。本手法は, 有害な内容の出現防止による毒性軽減, (ii) 形質および配列レベルの語彙的制約, (iii) 特定の性質に順応した新規分子配列生成など, 様々な自然言語制約を満たすために適用可能であることを示す。
論文参考訳（メタデータ） (2025-03-12T19:48:12Z)
Following the Autoregressive Nature of LLM Embeddings via Compression and Alignment [69.67015515485349]
本稿では,条件付き確率分布を埋め込んだコントラスト学習手法であるAutoRegEmbedを提案する。本手法は従来のコントラスト学習手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-02-17T03:36:25Z)
Not all tokens are created equal: Perplexity Attention Weighted Networks for AI generated text detection [49.15148871877941]
大規模言語モデル(LLM)の検出に理論的に魅力的なアプローチを提供する次点分布出力本稿では,LLMの最後の隠蔽状態を用いて,列長の次トーケン分布のメトリクスに基づく一連の特徴量の重み付けを行うパープレキシティ注意重み付けネットワーク(PAWN)を提案する。 PAWNは、トレーニング可能なパラメータのごく一部を持つ最強のベースラインよりも、競争力があり、より優れた分散性能を示している。
論文参考訳（メタデータ） (2025-01-07T17:00:49Z)
OD-Stega: LLM-Based Near-Imperceptible Steganography via Optimized Distributions [7.611860976107124]
本研究では,Large Language Modelが算術符号デコーダを駆動してステゴテキストを生成する,隠蔽型ステガノグラフィについて考察する。効率的な方法は、秘密のメッセージビットをできるだけ少数の言語トークンに埋め込む必要がある。
論文参考訳（メタデータ） (2024-10-06T01:30:45Z)
Amortizing intractable inference in large language models [56.92471123778389]
難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文参考訳（メタデータ） (2023-10-06T16:36:08Z)
Controllable Text Generation via Probability Density Estimation in the Latent Space [16.962510129437558]
本稿では,潜在空間における確率密度推定を用いた新しい制御フレームワークを提案する。本手法では,非可逆変換関数である正規化フローを用いて,潜在空間の複素分布を先行空間の単純ガウス分布にマッピングする。単一属性制御と多属性制御の実験により,本手法は属性関連性やテキスト品質の強いベースラインよりも優れていることがわかった。
論文参考訳（メタデータ） (2022-12-16T07:11:18Z)
Diffusion-LM Improves Controllable Text Generation [80.50044830018442]
言語モデル(LM)の振る舞いを再学習せずに制御することは、自然言語生成において大きな問題である。拡散-LMと呼ばれる連続拡散に基づく非自己回帰型言語モデルを開発した。本研究では,6つのきめ細粒度制御タスクに対してDiffusion-LMの制御に成功したことを実証した。
論文参考訳（メタデータ） (2022-05-27T20:12:09Z)
Constrained Sampling from Language Models via Langevin Dynamics in Embedding Spaces [34.375537557235724]
本稿では,言語モデルのログ類似度を任意の微分可能な制約と組み合わせて1つのエネルギー関数にサンプリングする手法を提案する。我々は,テキスト生成タスクのソフトな制約とハードな制約と,有害性回避,感情制御,キーワード誘導生成の競合する結果との組合せに対するアプローチを評価した。
論文参考訳（メタデータ） (2022-05-25T08:09:03Z)
Improve Variational Autoencoder for Text Generationwith Discrete Latent Bottleneck [52.08901549360262]
変分オートエンコーダ(VAE)は、エンドツーエンドの表現学習において必須のツールである。 VAEは強い自己回帰デコーダで潜伏変数を無視する傾向がある。よりコンパクトな潜在空間において暗黙的な潜在特徴マッチングを強制する原理的アプローチを提案する。
論文参考訳（メタデータ） (2020-04-22T14:41:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。