論文の概要: Curvature-Adaptive Consistency Flow Matching: Autonomous Trajectory Optimization via Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2606.22394v1
- Date: Sun, 21 Jun 2026 08:49:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 18:27:18.006698
- Title: Curvature-Adaptive Consistency Flow Matching: Autonomous Trajectory Optimization via Reinforcement Learning
- Title(参考訳): 曲率適応整合流マッチング:強化学習による自律軌道最適化
- Authors: Songtao Tian, Guhan Chen, Bohan Li, Jingyi Ma, Zixiong Yu,
- Abstract要約: 連続蒸留は拡散モデルの推論を 著しく加速させました
本稿では,静的サンプリングの限界に対処するため,曲率適応整合フローマッチングを提案する。
提案手法は,FLUXやSDXLといった大規模モデルに対して,最新の結果を実現する。
- 参考スコア(独自算出の注目度): 8.422673935994451
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consistency distillation has significantly accelerated the inference of diffusion models. In this work, we reveal an intriguing asymmetry: while Logit-Normal sampling priors are highly efficacious for standard iterative generation, consistency distillation exhibits a distinctly different difficulty profile (e.g., U-shaped). We identify that the primary optimization bottlenecks reside at the boundary stages (initialization or final refinement) rather than the intermediate steps. To address the limitations of static sampling in accommodating evolving learning requirements, we propose Curvature-Adaptive Consistency Flow Matching (CACFM). By formulating distillation as a dynamic decision process, CACFM employs a lightweight Reinforcement Learning agent to actively probe Probability Flow ODE trajectories, automatically constructing an efficiency-oriented curriculum that prioritizes critical regions without manual scheduling. Integrated with a novel Flow Distribution Matching Distillation (DMD) objective, our approach achieves new state-of-the-art results on large-scale models such as FLUX and SDXL. It effectively mitigates structural deformities and preserves high-frequency details in extreme few-step regimes, achieving unprecedented visual fidelity.
- Abstract(参考訳): 連続蒸留は拡散モデルの推算を著しく加速した。
本研究は,ロジット-ノルマルサンプリング先行値が標準反復生成に極めて有効であるのに対して,一貫性蒸留は明らかに異なる難易度プロファイル(例えば,U字型)を示す。
最適化のボトルネックは中間段階ではなく境界段階(初期化や最終改良)にある。
進化する学習要件を調節する静的サンプリングの限界に対処するため,CACFM(Curvature-Adaptive Consistency Flow Matching)を提案する。
蒸留を動的決定プロセスとして定式化することにより、CACFMは軽量な強化学習エージェントを用いて確率フローODE軌道を積極的に探索し、手作業によるスケジューリングなしに重要な領域を優先順位付けする効率指向のカリキュラムを自動構築する。
そこで本研究では, FLUX や SDXL などの大規模モデルにおいて, 新規なフロー分布マッチング蒸留 (DMD) の目的と統合し, 最新の結果を得る。
構造的変形を効果的に軽減し、極端に数段階の状況下で高周波の詳細を保存し、前例のない視覚的忠実性を達成する。
関連論文リスト
- Mean Flow Distillation: Robust and Stable Distillation for Flow Matching Models [34.59515048908997]
Mean Flow Distillation (MFD) はフローマッチングモデルに適した新しい蒸留フレームワークである。
MFDは時間的低域通過フィルタとして機能し、高周波最適化ノイズを効果的に抑制する。
平均流整合定理を証明し、一致した平均速度が厳密な分布アライメントに十分であることを示す。
論文 参考訳(メタデータ) (2026-06-09T17:39:19Z) - InjectFlow: Weak Guides Strong via Orthogonal Injection for Flow Matching [1.974921946982281]
フローマッチング (FM) は高忠実度視覚生成の先駆的アプローチとして浮上している。
FMモデルはデータセットバイアスに敏感であり、アウト・オブ・ディストリビューションやマイノリティ・クラスのサンプルを生成する際に深刻な意味劣化を引き起こす。
InjectFlowは、初期速度場中に意味論を注入することで、新しいトレーニング不要な手法である。
論文 参考訳(メタデータ) (2026-03-19T11:07:14Z) - Active Flow Matching [14.437387789022354]
アクティブフローマッチング(AFM)は、フローに沿った条件付きエンドポイント分布を操作するための変動目的を再構成する。
我々は、自己正規化重要度サンプリングを用いて、前方および逆のKullback-Leibler(KL)変異を導出する。
論文 参考訳(メタデータ) (2026-03-01T02:50:07Z) - Formalizing the Sampling Design Space of Diffusion-Based Generative Models via Adaptive Solvers and Wasserstein-Bounded Timesteps [4.397130429878499]
拡散に基づく生成モデルは、様々な領域で顕著な性能を達成してきたが、その実践的展開は、しばしば高いサンプリングコストによって制限されている。
本稿では,数値解法を拡散軌道の固有特性と整合する原理的枠組みであるSDMを提案する。
ODE のダイナミクスを解析することにより,低次解法は初期高雑音で十分であり,高次解法は後段の非線形性の増加に対応するために段階的に展開可能であることを示す。
論文 参考訳(メタデータ) (2026-02-13T05:02:07Z) - Euphonium: Steering Video Flow Matching via Process Reward Gradient Guided Stochastic Dynamics [49.242224984144904]
本稿では,プロセス報酬勾配誘導ダイナミクスによる生成を支援する新しいフレームワークであるEuphoniumを提案する。
我々の重要な洞察は、プロセス・リワード・モデルの勾配を明示的に組み込んだ理論的に原理化されたアルゴリズムとしてサンプリング・プロセスを定式化することである。
我々は,誘導信号をフローネットワークに内部化する蒸留目標を導出し,報奨モデルへの推論時間依存性を排除した。
論文 参考訳(メタデータ) (2026-02-04T08:59:57Z) - RAAG: Ratio Aware Adaptive Guidance [9.525432706814675]
フローベースの生成モデルは驚くべき進歩を遂げた。
推論全体を通じて強力な、固定されたガイダンススケールを適用することは、現代的なアプリケーションに必要な、迅速な、数ステップのサンプリングには適していない。
本稿では,進化率に基づいて早期段階の指導尺度を自動的に減衰させる,シンプルな,理論的に基礎付けられた適応型指導スケジュールを提案する。
論文 参考訳(メタデータ) (2025-08-05T13:41:05Z) - Divergence Minimization Preference Optimization for Diffusion Model Alignment [66.31417479052774]
Divergence Minimization Preference Optimization (DMPO) は、逆KL分散を最小化して拡散モデルを整列する原理的手法である。
DMPOは、異なるベースモデルとテストセットで既存のテクニックを一貫して上回り、適合させることができる。
論文 参考訳(メタデータ) (2025-07-10T07:57:30Z) - Denoising Score Distillation: From Noisy Diffusion Pretraining to One-Step High-Quality Generation [82.39763984380625]
低品質データから高品質な生成モデルをトレーニングするための驚くほど効果的で斬新なアプローチであるDSD(Denoising score distillation)を導入する。
DSDはノイズの多い劣化したサンプルにのみ拡散モデルを事前訓練し、精製されたクリーンな出力を生成することができる1ステップの発電機に蒸留する。
論文 参考訳(メタデータ) (2025-03-10T17:44:46Z) - Adding Additional Control to One-Step Diffusion with Joint Distribution Matching [58.37264951734603]
JDMは、画像-条件関節分布間の逆KL分散を最小化する新しいアプローチである。
トラクタブルな上限を導出することにより、JDMは条件学習から忠実度学習を分離する。
この非対称蒸留方式により,一段階の生徒が教師モデルに未知の制御を処理できるようになる。
論文 参考訳(メタデータ) (2025-03-09T15:06:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。