論文の概要: CurveFlow: Curvature-Guided Flow Matching for Image Generation
- arxiv url: http://arxiv.org/abs/2508.15093v2
- Date: Sun, 24 Aug 2025 04:41:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-26 12:26:22.561618
- Title: CurveFlow: Curvature-Guided Flow Matching for Image Generation
- Title(参考訳): CurveFlow: 画像生成のための曲率ガイドフローマッチング
- Authors: Yan Luo, Drake Du, Hao Huang, Yi Fang, Mengyu Wang,
- Abstract要約: 既存の整流流モデルは、データと雑音分布の間の線形軌跡に基づいている。
この線形性はゼロ曲率を強制し、データ多様体の低確率領域を通して画像生成プロセスを必然的に強制することができる。
フローパスに曲率誘導を組み込むことで、スムーズで非線形な軌道を学習するための新しいフローマッチングフレームワークであるCurveFlowを紹介した。
- 参考スコア(独自算出の注目度): 11.836900973675297
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Existing rectified flow models are based on linear trajectories between data and noise distributions. This linearity enforces zero curvature, which can inadvertently force the image generation process through low-probability regions of the data manifold. A key question remains underexplored: how does the curvature of these trajectories correlate with the semantic alignment between generated images and their corresponding captions, i.e., instructional compliance? To address this, we introduce CurveFlow, a novel flow matching framework designed to learn smooth, non-linear trajectories by directly incorporating curvature guidance into the flow path. Our method features a robust curvature regularization technique that penalizes abrupt changes in the trajectory's intrinsic dynamics.Extensive experiments on MS COCO 2014 and 2017 demonstrate that CurveFlow achieves state-of-the-art performance in text-to-image generation, significantly outperforming both standard rectified flow variants and other non-linear baselines like Rectified Diffusion. The improvements are especially evident in semantic consistency metrics such as BLEU, METEOR, ROUGE, and CLAIR. This confirms that our curvature-aware modeling substantially enhances the model's ability to faithfully follow complex instructions while simultaneously maintaining high image quality. The code is made publicly available at https://github.com/Harvard-AI-and-Robotics-Lab/CurveFlow.
- Abstract(参考訳): 既存の整流流モデルは、データと雑音分布の間の線形軌跡に基づいている。
この線形性はゼロ曲率を強制し、データ多様体の低確率領域を通して画像生成プロセスを必然的に強制することができる。
これらの軌跡の曲率と、生成された画像とその対応する字幕、すなわち命令順守とのセマンティックアライメントとの関係は、どのように相関するのか?
そこで本研究では,フローパスに曲率誘導を直接組み込むことで,スムーズで非線形な軌道を学習するための新しいフローマッチングフレームワークであるCurveFlowを紹介する。
提案手法は,トラジェクトリの内在力学の急激な変化をペナライズする頑健な曲率正規化手法を特徴とし,MS COCO 2014 と 2017 の総合的な実験により,CurveFlow がテキスト・画像生成における最先端性能を達成し,標準修正フロー変種と,Rectified Diffusion のような非線形ベースラインを著しく上回ることを示す。
この改善は、BLEU、METEOR、ROUGE、CLAIRといったセマンティック一貫性メトリクスで特に顕著である。
これにより、曲率認識モデリングは、高画質を同時に維持しつつ、複雑な命令を忠実に追従するモデルの能力を大幅に向上することを確認した。
コードはhttps://github.com/Harvard-AI-and-Robotics-Lab/CurveFlowで公開されている。
関連論文リスト
- ArcFlow: Unleashing 2-Step Text-to-Image Generation via High-Precision Non-Linear Flow Distillation [87.54456066636811]
拡散モデルは、シーケンシャルなデノナイジングステップに依存するため、かなりの推論コストに悩まされる。
ArcFlowは数段階の蒸留フレームワークであり、事前訓練された教師の軌跡を近似するために、非線形フロー軌跡を明示的に用いている。
2つのNFEで40倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2026-02-09T18:56:14Z) - SplineFlow: Flow Matching for Dynamical Systems with B-Spline Interpolants [14.711575625163045]
SplineFlow(スプラインフロー)は、B-スプラインを通して観測された条件付き経路を共同でモデル化する理論的基盤付きフローマッチングアルゴリズムである。
本研究では,B-スプライン基底の滑らかさと安定性をSplineFlowがいかに活用するかを示すとともに,マルチマージ要求を満たすことを保証する。
論文 参考訳(メタデータ) (2026-01-30T15:19:48Z) - FlowPath: Learning Data-Driven Manifolds with Invertible Flows for Robust Irregularly-sampled Time Series Classification [14.643457217551484]
本研究では,制御経路の幾何学を可逆的ニューラルフローで学習する新しいアプローチであるFlowPathを提案する。
FlowPathは、固定補間体や非可逆アーキテクチャを用いて、ベースライン上の分類精度の統計的に有意な向上を実現していることを示す。
論文 参考訳(メタデータ) (2025-11-13T22:59:26Z) - Rectified-CFG++ for Flow Based Models [26.896426878221718]
本稿では,修正フローの決定論的効率を幾何学的条件付きルールと組み合わせた適応型予測器・補正器ガイダンスであるRectified-C++を提案する。
大規模なテキスト・ツー・イメージモデル(Flux, Stable Diffusion 3/3.5, Lumina)の実験では、Rectified-C++がベンチマークデータセットの標準CFGを一貫して上回っていることが示されている。
論文 参考訳(メタデータ) (2025-10-09T00:00:47Z) - Bures-Wasserstein Flow Matching for Graph Generation [11.634569150774979]
グラフ生成は分子設計から薬物発見まで、分野において重要なタスクとして現れてきた。
グラフの基本的な幾何学を尊重するグラフ生成のためのフローマッチングフレームワークであるBWFlowを紹介する。
新たなフレームワークは、連続的および離散的なフローマッチングアルゴリズムの両方に適用できる。
論文 参考訳(メタデータ) (2025-06-16T21:36:56Z) - Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。
本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - FlowAlign: Trajectory-Regularized, Inversion-Free Flow-based Image Editing [47.908940130654535]
FlowAlignは、最適な制御ベースの軌道制御による一貫した画像編集のためのインバージョンフリーなフローベースフレームワークである。
我々の終点正規化は、編集プロンプトとのセマンティックアライメントのバランスと、軌道に沿ったソース画像との構造的整合性を示す。
FlowAlignは、ソース保存と編集の制御性の両方において、既存のメソッドよりも優れています。
論文 参考訳(メタデータ) (2025-05-29T06:33:16Z) - Steering Rectified Flow Models in the Vector Field for Controlled Image Generation [53.965218831845995]
拡散モデル(DM)は、フォトリアリズム、画像編集、逆問題解決に優れ、分類器なしのガイダンスと画像反転技術によって支援される。
既存のDMベースの手法は、しばしば追加のトレーニングを必要とし、事前訓練された潜在モデルへの一般化が欠如し、ODEソルバと反転プロセスによる広範なバックプロパゲーションにより、計算資源が要求される。
本研究では,ベクトル場を利用した画像生成タスクのデノイング軌道の制御を行うFlowChefを提案する。
FlowChefは、パフォーマンス、メモリ、時間要件の点でベースラインを大幅に上回り、新しい状態を達成する。
論文 参考訳(メタデータ) (2024-11-27T19:04:40Z) - FlowIE: Efficient Image Enhancement via Rectified Flow [71.6345505427213]
FlowIEはフローベースのフレームワークであり、基本的な分布から高品質な画像への直線パスを推定する。
私たちのコントリビューションは、合成および実世界のデータセットに関する包括的な実験を通じて、厳密に検証されています。
論文 参考訳(メタデータ) (2024-06-01T17:29:29Z) - D-Flow: Differentiating through Flows for Controlled Generation [37.80603174399585]
フローを微分することで生成プロセスを制御するフレームワークであるD-Flowを紹介する。
我々は、ガウス確率パスで訓練された拡散/FMモデルに対して、生成過程を微分することで、データ多様体の勾配を予測できるというキーとなる観察によって、この枠組みを動機付けている。
我々は,画像と音声の逆問題や条件分子生成など,線形および非線形に制御された生成問題に対する枠組みを検証する。
論文 参考訳(メタデータ) (2024-02-21T18:56:03Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - GAFlow: Incorporating Gaussian Attention into Optical Flow [62.646389181507764]
我々はガウス的注意(GA)を光学フローモデルに押し込み、表現学習中に局所特性をアクセントする。
本稿では,既存の Transformer ブロックに簡単に接続可能な新しい Gaussian-Constrained Layer (GCL) を提案する。
動作解析のための新しいガウス誘導注意モジュール(GGAM)を提供する。
論文 参考訳(メタデータ) (2023-09-28T07:46:01Z) - Flow Straight and Fast: Learning to Generate and Transfer Data with
Rectified Flow [32.459587479351846]
我々は、(神経)常微分方程式(ODE)モデルを学ぶための驚くほど単純なアプローチである整流流を提示する。
補正フローは画像生成,画像から画像への変換,ドメイン適応に優しく作用することを示す。
論文 参考訳(メタデータ) (2022-09-07T08:59:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。