論文の概要: Primal-Dual Guided Decoding for Constrained Discrete Diffusion
- arxiv url: http://arxiv.org/abs/2605.09749v1
- Date: Sun, 10 May 2026 20:55:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.402361
- Title: Primal-Dual Guided Decoding for Constrained Discrete Diffusion
- Title(参考訳): 離散拡散の最小次元誘導復号法
- Authors: Federico Tomasi, Dmitrii Moor, Alice Wang, Mounia Lalmas,
- Abstract要約: KL正規化最適化問題として制約付き生成を定式化する推定時間法であるプリマル・デュアルガイド付き復号法を提案する。
各復調ステップでは、制約違反に基づくミラー降下により乗算器が更新され、付加的制約依存バイアスによりトークンロジットを修飾する。
ドメイン固有のスコアリング機能によってインスタンス化された1つのアルゴリズムは、関連するドメイン固有の品質指標を保存しながら制約満足度を向上することを示す。
- 参考スコア(独自算出の注目度): 5.219025684249083
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discrete diffusion models generate structured sequences by progressively unmasking tokens, but enforcing global property constraints during generation remains an open challenge. We propose primal-dual guided decoding, an inference-time method that formulates constrained generation as a KL-regularised optimisation problem and solves it online via adaptive Lagrangian multipliers. At each denoising step, the method modifies token logits through an additive, constraint-dependent bias, with multipliers updated by mirror descent based on constraint violation. The bias arises as the optimal KL-regularised projection of the constraint, so the constrained distribution remains as close as possible to the model's unconstrained distribution while still satisfying the constraint. The method requires no retraining and no additional model evaluations beyond standard sampling, supports multiple simultaneous constraints, and provides formal bounds on constraint violation. We evaluate our approach on topical text generation, molecular design, and music playlist generation, showing that a single algorithm instantiated via domain-specific scoring functions improves constraint satisfaction while preserving relevant domain-specific quality metrics.
- Abstract(参考訳): 離散拡散モデルは、トークンを徐々に解き放つことによって構造化シーケンスを生成するが、生成時のグローバルなプロパティ制約を強制することは、未解決の課題である。
我々は、KL正規化最適化問題として制約付き生成を定式化し、適応ラグランジアン乗算器を介してオンラインに解決する推定時法である原始双対ガイド付き復号法を提案する。
各復調ステップでは、制約違反に基づくミラー降下により乗算器が更新され、付加的制約依存バイアスによりトークンロジットを修飾する。
バイアスは制約の最適KL正規化射影として生じるので、制約された分布は制約を満たす一方でモデルの制約のない分布に可能な限り近いままである。
この手法では、リトレーニングを必要とせず、標準サンプリング以外の追加モデル評価も必要とせず、複数の同時制約をサポートし、制約違反に関する公式な境界を提供する。
ドメイン固有のスコアリング機能によってインスタンス化された1つのアルゴリズムは、関連するドメイン固有の品質指標を保存しながら制約満足度を向上することを示す。
関連論文リスト
- Randomized multi-class classification under system constraints: a unified approach via post-processing [8.354034992258482]
ランダム化分類器上での線形汎関数として表現可能なシステムレベルの制約下でのマルチクラス分類の問題について検討する。
本稿では,与えられたベース分類器を調整し,再学習せずに一般制約を満たすポストプロセッシング手法を提案する。
論文 参考訳(メタデータ) (2025-12-16T09:53:22Z) - Adaptive Neighborhood-Constrained Q Learning for Offline Reinforcement Learning [52.03884701766989]
オフライン強化学習(RL)アルゴリズムは、通常、アクション選択に制約を課す。
本稿では,Bellmanターゲットにおける行動選択を,データセットアクションの近傍の結合に制限する新しい地区制約を提案する。
我々は,この制約を満たす目標動作を用いてQ学習を行うための,単純で効果的なアルゴリズムであるAdaptive Neighborhood-Constrained Q Learning(ANQ)を開発した。
論文 参考訳(メタデータ) (2025-11-04T13:42:05Z) - Constraint-Guided Prediction Refinement via Deterministic Diffusion Trajectories [7.279433512595361]
本稿では,拡散拡散DDIMを誘導する制約認識のための汎用フレームワークを提案する。
本手法は,事前学習による拡散軌道を反復的に改良し,制約補正により拡張する。
論文 参考訳(メタデータ) (2025-06-15T17:02:07Z) - Optimization over Sparse Support-Preserving Sets: Two-Step Projection with Global Optimality Guarantees [34.164821598251315]
スパース最適化では、$ell_$ pseudo-normを使ってハード制約を強制することは、制御されたスパーシリティのような利点を提供する。
多くの現実世界のアプリケーションは、余分な制約だけでなく、余分な制約も要求します。
本稿では,これらの制約をカスタマイズした2ステップのプロジェクション演算子を備えた,保存困難な反復アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-06-10T08:27:01Z) - Single-loop Algorithms for Stochastic Non-convex Optimization with Weakly-Convex Constraints [49.76332265680669]
本稿では、目的関数と制約関数の両方が弱凸である問題の重要な部分集合について検討する。
既存の手法では、収束速度の遅さや二重ループ設計への依存など、しばしば制限に直面している。
これらの課題を克服するために,新しい単一ループペナルティに基づくアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-21T17:15:48Z) - Constrained Discrete Diffusion [61.81569616239755]
本稿では,拡散過程における微分可能制約最適化の新たな統合であるCDD(Constrained Discrete Diffusion)を紹介する。
CDDは直接、離散拡散サンプリングプロセスに制約を課し、トレーニング不要で効果的なアプローチをもたらす。
論文 参考訳(メタデータ) (2025-03-12T19:48:12Z) - An Accelerated Alternating Partial Bregman Algorithm for ReLU-based Matrix Decomposition [0.0]
本稿では,非負行列上に補正されたスパース低ランク特性について検討する。
本稿では,クラスタリングと圧縮タスクに有用な構造を取り入れた新しい正規化項を提案する。
我々は、任意の$Lge 1$に対して常に持つ$L$-smoothプロパティを維持しながら、対応する閉形式解を導出する。
論文 参考訳(メタデータ) (2025-03-04T08:20:34Z) - On Regularization and Inference with Label Constraints [62.60903248392479]
機械学習パイプラインにおけるラベル制約を符号化するための2つの戦略、制約付き正規化、制約付き推論を比較した。
正規化については、制約に不整合なモデルを前置することで一般化ギャップを狭めることを示す。
制約付き推論では、モデルの違反を訂正することで人口リスクを低減し、それによってその違反を有利にすることを示す。
論文 参考訳(メタデータ) (2023-07-08T03:39:22Z) - A Variational Inference Approach to Inverse Problems with Gamma
Hyperpriors [60.489902135153415]
本稿では,ガンマハイパープライヤを用いた階層的逆問題に対する変分反復交替方式を提案する。
提案した変分推論手法は正確な再構成を行い、意味のある不確実な定量化を提供し、実装が容易である。
論文 参考訳(メタデータ) (2021-11-26T06:33:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。