論文の概要: Warm-Start Flow Matching for Guaranteed Fast Text/Image Generation
- arxiv url: http://arxiv.org/abs/2603.19360v1
- Date: Thu, 19 Mar 2026 18:00:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 19:48:38.826753
- Title: Warm-Start Flow Matching for Guaranteed Fast Text/Image Generation
- Title(参考訳): 高速テキスト/画像生成のためのワームスタートフローマッチング
- Authors: Minyoung Kim,
- Abstract要約: 本稿では,フローマッチングアルゴリズムのサンプル生成時間を保証されたスピードアップ係数により削減する新しい手法を提案する。
私たちのアイデアは、基本的には、低品質のドラフトサンプルから高品質のサンプルまで、学習から再定義する生成モデルとして見ることができます。
- 参考スコア(独自算出の注目度): 7.945670209718052
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current auto-regressive (AR) LLMs, diffusion-based text/image generative models, and recent flow matching (FM) algorithms are capable of generating premium quality text/image samples. However, the inference or sample generation in these models is often very time-consuming and computationally demanding, mainly due to large numbers of function evaluations corresponding to the lengths of tokens or the numbers of diffusion steps. This also necessitates heavy GPU resources, time, and electricity. In this work we propose a novel solution to reduce the sample generation time of flow matching algorithms by a guaranteed speed-up factor, without sacrificing the quality of the generated samples. Our key idea is to utilize computationally lightweight generative models whose generation time is negligible compared to that of the target AR/FM models. The draft samples from a lightweight model, whose quality is not satisfactory but fast to generate, are regarded as an initial distribution for a FM algorithm. Unlike conventional usage of FM that takes a pure noise (e.g., Gaussian or uniform) initial distribution, the draft samples are already of decent quality, so we can set the starting time to be closer to the end time rather than 0 in the pure noise FM case. This will significantly reduce the number of time steps to reach the target data distribution, and the speed-up factor is guaranteed. Our idea, dubbed {\em Warm-Start FM} or WS-FM, can essentially be seen as a {\em learning-to-refine} generative model from low-quality draft samples to high-quality samples. As a proof of concept, we demonstrate the idea on some synthetic toy data as well as real-world text and image generation tasks, illustrating that our idea offers guaranteed speed-up in sample generation without sacrificing the quality of the generated samples.
- Abstract(参考訳): 現在の自己回帰(AR)LLM、拡散ベースのテキスト/画像生成モデル、および最近のフローマッチング(FM)アルゴリズムは高品質なテキスト/画像サンプルを生成することができる。
しかしながら、これらのモデルにおける推論やサンプル生成は、主にトークンの長さや拡散ステップの数に対応する多数の関数評価のために、非常に時間がかかり、計算的に要求されることが多い。
また、重いGPUリソース、時間、電気も必要です。
本研究では,フローマッチングアルゴリズムのサンプル生成時間を,生成したサンプルの品質を犠牲にすることなく,保証されたスピードアップ係数によって削減する新しい手法を提案する。
我々のキーとなる考え方は、ターゲットのAR/FMモデルと比べて生成時間が無視できる計算軽量な生成モデルを利用することである。
FMアルゴリズムの初期分布として,品質が満足できないが高速に生成できる軽量モデルからのドラフトサンプルが検討されている。
純雑音(例えばガウスあるいは一様)を初期分布に用いた従来のFMとは違って、ドラフトサンプルは良好な品質であり、純粋なノイズFMの場合では0よりも0に近いタイミングで開始時間を設定できる。
これにより、ターゲットデータ分布に到達するための時間ステップが大幅に削減され、スピードアップ係数が保証される。
我々のアイデアは、基本的には、低品質のドラフトサンプルから高品質のサンプルまで、学習から精製までの生成モデルと見なすことができる。
概念実証として,合成玩具データと実世界のテキストおよび画像生成タスクのアイデアを実証し,本アイデアが生成したサンプルの品質を犠牲にすることなく,サンプル生成における保証されたスピードアップを提供することを示した。
関連論文リスト
- Warm Starts Accelerate Conditional Diffusion [20.22808227772002]
拡散や流れマッチングのような生成モデルは、ノイズを徐々に精製することで高忠実度サンプルを生成する。
本稿では、簡単な決定論的モデルを用いて条件生成を劇的に高速化するWarm-Start Diffusion(WSD)を紹介する。
WSDは効率的なサンプリング方式において標準拡散を著しく上回る。
論文 参考訳(メタデータ) (2025-07-12T09:07:05Z) - Geodesic Diffusion Models for Efficient Medical Image Enhancement [6.689992048758046]
確率空間における最短経路に対応する測地線ノイズスケジュールをフィッシャー・ラオ計量の下で提案する。
これらのスケジュールに基づいて、トレーニングとサンプリング効率を大幅に改善する測地拡散モデル(GDM)を提案する。
医用画像強調作業におけるGDMの評価を行った。
論文 参考訳(メタデータ) (2025-03-02T05:57:51Z) - Distributional Diffusion Models with Scoring Rules [83.38210785728994]
拡散モデルは高品質な合成データを生成する。
高品質な出力を生成するには、多くの離散化ステップが必要です。
クリーンデータサンプルの後部エム分布を学習し,サンプル生成を実現することを提案する。
論文 参考訳(メタデータ) (2025-02-04T16:59:03Z) - Fast constrained sampling in pre-trained diffusion models [80.99262780028015]
任意の制約下で高速で高品質な生成を可能にするアルゴリズムを提案する。
我々の手法は、最先端のトレーニングフリー推論手法に匹敵するか、超越した結果をもたらす。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - A Simple Early Exiting Framework for Accelerated Sampling in Diffusion Models [14.859580045688487]
拡散モデルの現実的なボトルネックはサンプリング速度である。
スコア推定に必要な計算を適応的に割り当てる新しいフレームワークを提案する。
本研究では,画像品質を損なうことなく,拡散モデルのサンプリングスループットを大幅に向上できることを示す。
論文 参考訳(メタデータ) (2024-08-12T05:33:45Z) - Fast Sampling via Discrete Non-Markov Diffusion Models with Predetermined Transition Time [49.598085130313514]
離散非マルコフ拡散モデル(DNDM)を提案する。
これにより、トレーニング不要なサンプリングアルゴリズムにより、関数評価の数を大幅に削減できる。
有限ステップサンプリングから無限ステップサンプリングへの移行について検討し、離散プロセスと連続プロセスのギャップを埋めるための新たな洞察を提供する。
論文 参考訳(メタデータ) (2023-12-14T18:14:11Z) - Fast Inference in Denoising Diffusion Models via MMD Finetuning [23.779985842891705]
拡散モデルの高速サンプリング法であるMDD-DDMを提案する。
我々のアプローチは、学習した分布を所定の予算のタイムステップで微調整するために、最大平均離散性(MMD)を使用するという考え方に基づいている。
提案手法は,広範に普及した拡散モデルで要求されるわずかな時間で高品質なサンプルを生成できることが示唆された。
論文 参考訳(メタデータ) (2023-01-19T09:48:07Z) - Anytime Sampling for Autoregressive Models via Ordered Autoencoding [88.01906682843618]
自動回帰モデルは画像生成や音声生成などのタスクに広く使われている。
これらのモデルのサンプリングプロセスは割り込みを許さず、リアルタイムの計算資源に適応できない。
いつでもサンプリングできる新しい自動回帰モデルファミリーを提案します。
論文 参考訳(メタデータ) (2021-02-23T05:13:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。