Fugu-MT 論文翻訳(概要): Fast Sampling via Discrete Non-Markov Diffusion Models with Predetermined Transition Time

論文の概要: Fast Sampling via Discrete Non-Markov Diffusion Models with Predetermined Transition Time

arxiv url: http://arxiv.org/abs/2312.09193v3
Date: Fri, 06 Dec 2024 03:52:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-09 22:41:40.703646
Title: Fast Sampling via Discrete Non-Markov Diffusion Models with Predetermined Transition Time
Title（参考訳）: 予め決定された遷移時間をもつ離散非マルコフ拡散モデルによる高速サンプリング
Authors: Zixiang Chen, Huizhuo Yuan, Yongqian Li, Yiwen Kou, Junkai Zhang, Quanquan Gu,
Abstract要約: 離散非マルコフ拡散モデル(DNDM)を提案する。これにより、トレーニング不要なサンプリングアルゴリズムにより、関数評価の数を大幅に削減できる。有限ステップサンプリングから無限ステップサンプリングへの移行について検討し、離散プロセスと連続プロセスのギャップを埋めるための新たな洞察を提供する。
参考スコア（独自算出の注目度）: 49.598085130313514
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Discrete diffusion models have emerged as powerful tools for high-quality data generation. Despite their success in discrete spaces, such as text generation tasks, the acceleration of discrete diffusion models remains under-explored. In this paper, we propose discrete non-Markov diffusion models (DNDM), which naturally induce the predetermined transition time set. This enables a training-free sampling algorithm that significantly reduces the number of function evaluations (i.e., calls to the neural network), making the sampling process much faster. Furthermore, we study the transition from finite to infinite step sampling, offering new insights into bridging the gap between discrete and continuous-time processes for discrete diffusion models. Extensive experiments on natural language generation and machine translation tasks demonstrate the superior performance of our method in terms of both generation speed and sample quality compared to existing methods for discrete diffusion models.
Abstract（参考訳）: 離散拡散モデルは、高品質なデータ生成のための強力なツールとして登場した。テキスト生成タスクのような離散空間での成功にもかかわらず、離散拡散モデルの加速は未探索のままである。本稿では, 離散非マルコフ拡散モデル (DNDM) を提案する。これにより、トレーニング不要なサンプリングアルゴリズムにより、機能評価(すなわちニューラルネットワークへの呼び出し)の数を著しく削減し、サンプリングプロセスがより高速になる。さらに,有限ステップサンプリングから無限ステップサンプリングへの移行について検討し,離散拡散モデルに対する離散過程と連続過程のギャップを埋めるための新たな洞察を提供する。自然言語生成および機械翻訳タスクに関する大規模な実験は,従来の離散拡散モデルの手法と比較して,生成速度とサンプル品質の両方の観点から,本手法の優れた性能を示す。

関連論文リスト

Pretrained Diffusion Models Are Inherently Skipped-Step Samplers [4.858858247064974]
繰り返し生成プロセスにおいて,複数の中間演示ステップをバイパスする機構であるスキップステップサンプリングを導入する。我々は,このスキップステップサンプリング機構が標準拡散モデルと同じ学習目標から導出されることを実証した。本稿では,加速サンプリング技術とDDIMを統合した改良型生成法を提案する。
論文参考訳（メタデータ） (2025-08-21T04:45:13Z)
Inference-Time Scaling of Diffusion Language Models with Particle Gibbs Sampling [62.640128548633946]
離散拡散モデルに対する粒子ギブズサンプリングに基づく新しい推論時間スケーリング手法を提案する。提案手法は,報酬誘導テキスト生成タスクにおける事前推定時間戦略を常に上回る。
論文参考訳（メタデータ） (2025-07-11T08:00:47Z)
Adaptive Destruction Processes for Diffusion Samplers [12.446080077998834]
本稿では,拡散サンプリング装置におけるトレーニング可能な破壊プロセスの課題とメリットについて考察する。ステップ数に制限がある場合、生成過程と破壊過程の両方を訓練することで、より高速な収束とサンプリング品質の向上が期待できる。
論文参考訳（メタデータ） (2025-06-02T11:07:27Z)
Accelerated Diffusion Models via Speculative Sampling [89.43940130493233]
投機的サンプリングは、大規模言語モデルにおける推論を加速する一般的な手法である。我々は投機的サンプリングを拡散モデルに拡張し、連続したベクトル値のマルコフ連鎖を介してサンプルを生成する。本稿では,ドラフトモデルをトレーニングする必要のない,シンプルで効果的なアプローチを含む,さまざまなドラフト戦略を提案する。
論文参考訳（メタデータ） (2025-01-09T16:50:16Z)
Adaptive Non-Uniform Timestep Sampling for Diffusion Model Training [4.760537994346813]
データ分布が複雑化するにつれて、収束のためのトレーニング拡散モデルがますます複雑になる。より重要な時間ステップを優先する一様でない時間ステップサンプリング手法を提案する。提案手法は, 各種データセット, スケジューリング戦略, 拡散アーキテクチャにまたがるロバストな性能を示す。
論文参考訳（メタデータ） (2024-11-15T07:12:18Z)
Energy-Based Diffusion Language Models for Text Generation [126.23425882687195]
エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文参考訳（メタデータ） (2024-10-28T17:25:56Z)
Provable Statistical Rates for Consistency Diffusion Models [87.28777947976573]
最先端の性能にもかかわらず、拡散モデルは、多くのステップが伴うため、遅いサンプル生成で知られている。本稿では, 整合性モデルに関する最初の統計理論に寄与し, 分散不整合最小化問題としてトレーニングを定式化している。
論文参考訳（メタデータ） (2024-06-23T20:34:18Z)
New algorithms for sampling and diffusion models [0.0]
本稿では,未知分布を持つ拡散生成モデルのための新しいサンプリング手法と新しいアルゴリズムを提案する。我々のアプローチは、拡散生成モデルにおいて広く採用されている逆拡散過程の概念に着想を得たものである。
論文参考訳（メタデータ） (2024-06-14T02:30:04Z)
MG-TSD: Multi-Granularity Time Series Diffusion Models with Guided Learning Process [26.661721555671626]
本稿では,最先端の予測性能を実現する新しい多粒度時系列(MG-TSD)モデルを提案する。われわれのアプローチは外部データに頼らず、様々な領域にまたがって汎用的で適用可能である。
論文参考訳（メタデータ） (2024-03-09T01:15:03Z)
Convergence Analysis of Discrete Diffusion Model: Exact Implementation through Uniformization [17.535229185525353]
連続マルコフ連鎖の均一化を利用したアルゴリズムを導入し、ランダムな時間点の遷移を実装した。我々の結果は、$mathbbRd$における拡散モデルの最先端の成果と一致し、さらに$mathbbRd$設定と比較して離散拡散モデルの利点を浮き彫りにする。
論文参考訳（メタデータ） (2024-02-12T22:26:52Z)
DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for Accelerated Seq2Seq Diffusion Models [58.450152413700586]
ガウス空間に基づく離散突然変異を再構成する学習において拡散モデルを容易にする軟吸収状態を導入する。我々は、サンプリングプロセスの高速化のために、連続空間内で最先端のODEソルバを用いている。提案手法は, トレーニング収束率を4倍に向上させ, 類似品質のサンプルを800倍高速に生成する。
論文参考訳（メタデータ） (2023-10-09T15:29:10Z)
Semi-Implicit Denoising Diffusion Models (SIDDMs) [50.30163684539586]
Denoising Diffusion Probabilistic Models (DDPM)のような既存のモデルは、高品質で多様なサンプルを提供するが、本質的に多くの反復的なステップによって遅くなる。暗黙的要因と明示的要因を一致させることにより、この問題に対処する新しいアプローチを導入する。提案手法は拡散モデルに匹敵する生成性能と,少数のサンプリングステップを持つモデルに比較して非常に優れた結果が得られることを示す。
論文参考訳（メタデータ） (2023-06-21T18:49:22Z)
A Reparameterized Discrete Diffusion Model for Text Generation [39.0145272152805]
本研究は, 離散拡散確率モデルと自然言語生成への応用に関する研究である。離散拡散過程からサンプリングの代替的かつ等価な定式化を導出する。本研究では,既存の拡散モデルに対して,テキスト生成能力を評価するための広範囲な実験を行った。
論文参考訳（メタデータ） (2023-02-11T16:26:57Z)
Fast Inference in Denoising Diffusion Models via MMD Finetuning [23.779985842891705]
拡散モデルの高速サンプリング法であるMDD-DDMを提案する。我々のアプローチは、学習した分布を所定の予算のタイムステップで微調整するために、最大平均離散性(MMD)を使用するという考え方に基づいている。提案手法は,広範に普及した拡散モデルで要求されるわずかな時間で高品質なサンプルを生成できることが示唆された。
論文参考訳（メタデータ） (2023-01-19T09:48:07Z)
Diffusion Glancing Transformer for Parallel Sequence to Sequence Learning [52.72369034247396]
モーダリティ拡散プロセスと残差グランシングサンプリングを併用した拡散グランシング変換器を提案する。 DIFFGLATは、自己回帰モデルと非自己回帰モデルの両方と比較して、高速な復号速度を維持しながら、より優れた生成精度を実現する。
論文参考訳（メタデータ） (2022-12-20T13:36:25Z)
Denoising Diffusion Implicit Models [117.03720513930335]
DDPMと同様の訓練手順を施した反復的暗黙的確率モデルに対して,拡散暗黙モデル(DDIM)を提案する。 DDIMsは、DDPMsと比較して、壁面時間で10倍から50倍高速な高品質のサンプルを作成できる。
論文参考訳（メタデータ） (2020-10-06T06:15:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。