論文の概要: Rectified-CFG++ for Flow Based Models
- arxiv url: http://arxiv.org/abs/2510.07631v1
- Date: Thu, 09 Oct 2025 00:00:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.783751
- Title: Rectified-CFG++ for Flow Based Models
- Title(参考訳): フローベースモデルのためのrectified-CFG++
- Authors: Shreshth Saini, Shashank Gupta, Alan C. Bovik,
- Abstract要約: 本稿では,修正フローの決定論的効率を幾何学的条件付きルールと組み合わせた適応型予測器・補正器ガイダンスであるRectified-C++を提案する。
大規模なテキスト・ツー・イメージモデル(Flux, Stable Diffusion 3/3.5, Lumina)の実験では、Rectified-C++がベンチマークデータセットの標準CFGを一貫して上回っていることが示されている。
- 参考スコア(独自算出の注目度): 26.896426878221718
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classifier-free guidance (CFG) is the workhorse for steering large diffusion models toward text-conditioned targets, yet its native application to rectified flow (RF) based models provokes severe off-manifold drift, yielding visual artifacts, text misalignment, and brittle behaviour. We present Rectified-CFG++, an adaptive predictor-corrector guidance that couples the deterministic efficiency of rectified flows with a geometry-aware conditioning rule. Each inference step first executes a conditional RF update that anchors the sample near the learned transport path, then applies a weighted conditional correction that interpolates between conditional and unconditional velocity fields. We prove that the resulting velocity field is marginally consistent and that its trajectories remain within a bounded tubular neighbourhood of the data manifold, ensuring stability across a wide range of guidance strengths. Extensive experiments on large-scale text-to-image models (Flux, Stable Diffusion 3/3.5, Lumina) show that Rectified-CFG++ consistently outperforms standard CFG on benchmark datasets such as MS-COCO, LAION-Aesthetic, and T2I-CompBench. Project page: https://rectified-cfgpp.github.io/
- Abstract(参考訳): クラシファイアフリーガイダンス(CFG)は、大きな拡散モデルをテキスト条件のターゲットに向けて操る作業場であるが、その修正フロー(RF)ベースのモデルへのネイティブな適用は、深刻なオフマンドフローを引き起こし、視覚的アーティファクト、テキストの修正、不安定な振る舞いを引き起こす。
本稿では,修正フローの決定論的効率を幾何学的条件付きルールと組み合わせた適応型予測器・補正器であるRectified-CFG++を提案する。
各推論ステップは、まず、学習された輸送経路付近でサンプルをアンカーする条件RF更新を実行し、次いで、条件付条件補正を適用して、条件付速度場と非条件付速度場を補間する。
得られた速度場は限界的に一貫しており、その軌道はデータ多様体の有界管状近傍に留まり、幅広い誘導強度の安定性が保証される。
大規模テキスト・ツー・イメージモデル(Flux, Stable Diffusion 3/3.5, Lumina)の大規模な実験により、Rectified-CFG++はMS-COCO、LAION-Aesthetic、T2I-CompBenchといったベンチマークデータセット上で標準CFGよりも一貫して優れていた。
プロジェクトページ: https://rectified-cfgpp.github.io/
関連論文リスト
- Optimal Control Meets Flow Matching: A Principled Route to Multi-Subject Fidelity [35.95129874095729]
テキスト・トゥ・イメージ(T2I)モデルは単一エンタリティ・プロンプトに優れるが、多目的記述に苦慮する。
マルチオブジェクト忠実度に向けてサンプリングダイナミクスを操るための原理的最適化可能な目的を持った最初の理論的枠組みを導入する。
論文 参考訳(メタデータ) (2025-10-02T17:59:58Z) - CurveFlow: Curvature-Guided Flow Matching for Image Generation [11.836900973675297]
既存の整流流モデルは、データと雑音分布の間の線形軌跡に基づいている。
この線形性はゼロ曲率を強制し、データ多様体の低確率領域を通して画像生成プロセスを必然的に強制することができる。
フローパスに曲率誘導を組み込むことで、スムーズで非線形な軌道を学習するための新しいフローマッチングフレームワークであるCurveFlowを紹介した。
論文 参考訳(メタデータ) (2025-08-20T22:06:13Z) - Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。
本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - FLEX: A Backbone for Diffusion-Based Modeling of Spatio-temporal Physical Systems [51.15230303652732]
FLEX (F Low Expert) は、時間物理系の生成モデリングのためのバックボーンアーキテクチャである。
拡散モデルにおける速度場の分散を低減し、トレーニングの安定化に役立つ。
少数の特徴を2つの逆拡散ステップとして用いて、超解像および予測タスクの正確な予測を行う。
論文 参考訳(メタデータ) (2025-05-23T00:07:59Z) - Rectified Diffusion Guidance for Conditional Generation [94.83538269086613]
CFGの背後にある理論を再検討し、不適切な組合せ係数(textiti.e.)が生成分布を期待的にシフトさせることを厳密に確認する。
提案手法は, 強みを考慮すれば, textbftextitform ソリューションが有効であることを示す。
実世界のデータに関する実証的な証拠は、我々の設計と既存の最先端拡散モデルとの整合性を実証している。
論文 参考訳(メタデータ) (2024-10-24T13:41:32Z) - Aero-Nef: Neural Fields for Rapid Aircraft Aerodynamics Simulations [1.1932047172700866]
本稿では,メッシュ領域上での定常流体力学シミュレーションの代理モデルを学習する手法を提案する。
提案したモデルは, 異なる流れ条件に対して非構造領域に直接適用することができる。
顕著なことに、RANS超音速翼データセット上の高忠実度解法よりも5桁高速な推論を行うことができる。
論文 参考訳(メタデータ) (2024-07-29T11:48:44Z) - Consistency Flow Matching: Defining Straight Flows with Velocity Consistency [97.28511135503176]
本稿では,速度場の自己整合性を明示する新しいFM法であるConsistency Flow Matching(Consistency-FM)を紹介する。
予備実験により、一貫性FMは、一貫性モデルよりも4.4倍速く収束することにより、トレーニング効率を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-07-02T16:15:37Z) - GAFlow: Incorporating Gaussian Attention into Optical Flow [62.646389181507764]
我々はガウス的注意(GA)を光学フローモデルに押し込み、表現学習中に局所特性をアクセントする。
本稿では,既存の Transformer ブロックに簡単に接続可能な新しい Gaussian-Constrained Layer (GCL) を提案する。
動作解析のための新しいガウス誘導注意モジュール(GGAM)を提供する。
論文 参考訳(メタデータ) (2023-09-28T07:46:01Z) - Improving and generalizing flow-based generative models with minibatch
optimal transport [90.01613198337833]
連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文 参考訳(メタデータ) (2023-02-01T14:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。