論文の概要: ArcFlow: Unleashing 2-Step Text-to-Image Generation via High-Precision Non-Linear Flow Distillation
- arxiv url: http://arxiv.org/abs/2602.09014v1
- Date: Mon, 09 Feb 2026 18:56:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:25.439934
- Title: ArcFlow: Unleashing 2-Step Text-to-Image Generation via High-Precision Non-Linear Flow Distillation
- Title(参考訳): ArcFlow: 高精度非線形蒸留による2段階のテキスト・ツー・イメージ生成
- Authors: Zihan Yang, Shuyuan Tu, Licheng Zhang, Qi Dai, Yu-Gang Jiang, Zuxuan Wu,
- Abstract要約: 拡散モデルは、シーケンシャルなデノナイジングステップに依存するため、かなりの推論コストに悩まされる。
ArcFlowは数段階の蒸留フレームワークであり、事前訓練された教師の軌跡を近似するために、非線形フロー軌跡を明示的に用いている。
2つのNFEで40倍のスピードアップを実現している。
- 参考スコア(独自算出の注目度): 87.54456066636811
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models have achieved remarkable generation quality, but they suffer from significant inference cost due to their reliance on multiple sequential denoising steps, motivating recent efforts to distill this inference process into a few-step regime. However, existing distillation methods typically approximate the teacher trajectory by using linear shortcuts, which makes it difficult to match its constantly changing tangent directions as velocities evolve across timesteps, thereby leading to quality degradation. To address this limitation, we propose ArcFlow, a few-step distillation framework that explicitly employs non-linear flow trajectories to approximate pre-trained teacher trajectories. Concretely, ArcFlow parameterizes the velocity field underlying the inference trajectory as a mixture of continuous momentum processes. This enables ArcFlow to capture velocity evolution and extrapolate coherent velocities to form a continuous non-linear trajectory within each denoising step. Importantly, this parameterization admits an analytical integration of this non-linear trajectory, which circumvents numerical discretization errors and results in high-precision approximation of the teacher trajectory. To train this parameterization into a few-step generator, we implement ArcFlow via trajectory distillation on pre-trained teacher models using lightweight adapters. This strategy ensures fast, stable convergence while preserving generative diversity and quality. Built on large-scale models (Qwen-Image-20B and FLUX.1-dev), ArcFlow only fine-tunes on less than 5% of original parameters and achieves a 40x speedup with 2 NFEs over the original multi-step teachers without significant quality degradation. Experiments on benchmarks show the effectiveness of ArcFlow both qualitatively and quantitatively.
- Abstract(参考訳): 拡散モデルは、顕著な生成品質を達成したが、複数の逐次的デノナイジングステップに依存しているため、かなりの推論コストに悩まされ、この推論プロセスを数段階の体制に蒸留する最近の取り組みを動機付けている。
しかし, 従来の蒸留法では, 線形ショートカットを用いて教師の軌跡を近似することが一般的であり, 経時的に速度が変化するにつれて, 常に変化する接する方向の一致が困難になり, 品質が低下する。
この制限に対処するために,非線形流路を明示的に用いて事前学習した教師軌道を近似した数ステップの蒸留フレームワークであるArcFlowを提案する。
具体的には、ArcFlowは、推論軌道の下の速度場を連続運動量過程の混合としてパラメータ化する。
これにより、ArcFlowは速度の進化を捉え、コヒーレントな速度を外挿し、各デノナイジングステップ内で連続的な非線形軌道を形成することができる。
重要なことに、このパラメータ化は、数値的な離散化誤差を回避し、教師の軌跡の高精度な近似をもたらす非線形軌道の分析的な統合を許容する。
このパラメータ化を数ステップのジェネレータにトレーニングするために、我々は軽量アダプターを用いて事前学習した教師モデル上で、軌跡蒸留によるArcFlowを実装した。
この戦略は、生成的多様性と品質を維持しながら、高速で安定した収束を保証する。
大規模モデル(Qwen-Image-20B と FLUX.1-dev)をベースとして開発されたArcFlowは、オリジナルのパラメータの5%未満で微調整しか行わず、品質を著しく劣化させることなく、2つのNFEで40倍のスピードアップを実現している。
ベンチマーク実験は、ArcFlowの有効性を質的にも定量的にも示している。
関連論文リスト
- FlowConsist: Make Your Flow Consistent with Real Trajectory [99.22869983378062]
現在の高速フロートレーニングパラダイムには,2つの根本的な問題がある,と我々は主張する。
ランダムにペアリングされたノイズデータサンプルから構築された条件付き速度は、系統的な軌跡ドリフトを導入する。
本研究では,高速フローにおける軌道整合性を実現するためのトレーニングフレームワークであるFlowConsistを提案する。
論文 参考訳(メタデータ) (2026-02-06T03:24:23Z) - Flow Straighter and Faster: Efficient One-Step Generative Modeling via MeanFlow on Rectified Trajectories [14.36205662558203]
Rectified MeanFlowは、単一のリフローステップのみを使用して、修正された軌道に沿った平均速度場をモデル化するフレームワークである。
64、256、および512の解像度でのImageNetの実験では、Re-MeanFlowは、サンプルの品質とトレーニング効率の両方で、一段階の蒸留法とRectified Flow法を一貫して上回っている。
論文 参考訳(メタデータ) (2025-11-28T16:50:08Z) - FlowSteer: Guiding Few-Step Image Synthesis with Authentic Trajectories [82.90132015584359]
ReFlowはフローマッチングと理論的に整合性があるが、現実的なシナリオでは最適ではない。
本研究では,ReFlowをベースとした蒸留手法であるFlowSteerを提案する。
論文 参考訳(メタデータ) (2025-11-24T07:13:23Z) - Nesterov Method for Asynchronous Pipeline Parallel Optimization [59.79227116582264]
パイプライン並列処理における非同期最適化のために,Nesterov Accelerated Gradient (NAG) の変種を導入する。
具体的には、NAGのルックアヘッドステップを変更して、勾配の安定性を効果的に解決する。
我々は、勾配の固定遅延の存在下で、我々のアプローチがサブ線形速度で収束することを理論的に証明する。
論文 参考訳(メタデータ) (2025-05-02T08:23:29Z) - RayFlow: Instance-Aware Diffusion Acceleration via Adaptive Flow Trajectories [17.934379261227388]
既存のアクセラレーション手法では、サンプルの品質、可制御性、あるいはトレーニングの複雑さを損なう。
これらの制限に対処する新しい拡散フレームワークであるRayFlowを提案する。
大規模な実験は、スピード、制御、トレーニング効率を改善した高品質な画像の生成におけるRayFlowの優位性を実証している。
論文 参考訳(メタデータ) (2025-03-10T17:20:52Z) - SCoT: Unifying Consistency Models and Rectified Flows via Straight-Consistent Trajectories [31.60548236936739]
本研究では,事前学習した拡散モデルに対する直線一貫性軌道(SCoT)モデルを提案する。
SCoTは、高速サンプリングのための両方のアプローチの利点を享受し、一貫した特性と直線的な性質のトラジェクトリを同時に生成する。
論文 参考訳(メタデータ) (2025-02-24T08:57:19Z) - Optimal Flow Matching: Learning Straight Trajectories in Just One Step [89.37027530300617]
我々は,新しいtextbf Optimal Flow Matching (OFM) アプローチを開発し,理論的に正当化する。
これは2次輸送のための直列のOT変位をFMの1ステップで回復することを可能にする。
提案手法の主な考え方は,凸関数によってパラメータ化されるFMのベクトル場の利用である。
論文 参考訳(メタデータ) (2024-03-19T19:44:54Z) - Deep Equilibrium Optical Flow Estimation [80.80992684796566]
最近のSOTA(State-of-the-art)光フローモデルでは、従来のアルゴリズムをエミュレートするために有限ステップの更新操作を使用する。
これらのRNNは大きな計算とメモリオーバーヘッドを課し、そのような安定した推定をモデル化するために直接訓練されていない。
暗黙的層の無限レベル固定点として直接流れを解く手法として,Deep equilibrium Flow estimatorを提案する。
論文 参考訳(メタデータ) (2022-04-18T17:53:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。