論文の概要: InjectFlow: Weak Guides Strong via Orthogonal Injection for Flow Matching
- arxiv url: http://arxiv.org/abs/2603.20303v1
- Date: Thu, 19 Mar 2026 11:07:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.822261
- Title: InjectFlow: Weak Guides Strong via Orthogonal Injection for Flow Matching
- Title(参考訳): インジェクションFlow:フローマッチングのための直交注入による弱みガイド
- Authors: Dayu Wang, Jiaye Yang, Weikang Li, Jiahui Liang, Yang Li,
- Abstract要約: フローマッチング (FM) は高忠実度視覚生成の先駆的アプローチとして浮上している。
FMモデルはデータセットバイアスに敏感であり、アウト・オブ・ディストリビューションやマイノリティ・クラスのサンプルを生成する際に深刻な意味劣化を引き起こす。
InjectFlowは、初期速度場中に意味論を注入することで、新しいトレーニング不要な手法である。
- 参考スコア(独自算出の注目度): 1.974921946982281
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flow Matching (FM) has recently emerged as a leading approach for high-fidelity visual generation, offering a robust continuous-time alternative to ordinary differential equation (ODE) based models. However, despite their success, FM models are highly sensitive to dataset biases, which cause severe semantic degradation when generating out-of-distribution or minority-class samples. In this paper, we provide a rigorous mathematical formalization of the ``Bias Manifold'' within the FM framework. We identify that this performance drop is driven by conditional expectation smoothing, a mechanism that inevitably leads to trajectory lock-in during inference. To resolve this, we introduce InjectFlow, a novel, training-free method by injecting orthogonal semantics during the initial velocity field computation, without requiring any changes to the random seeds. This design effectively prevents the latent drift toward majority modes while maintaining high generative quality. Extensive experiments demonstrate the effectiveness of our approach. Notably, on the GenEval dataset, InjectFlow successfully fixes 75% of the prompts that standard flow matching models fail to generate correctly. Ultimately, our theoretical analysis and algorithm provide a ready-to-use solution for building more fair and robust visual foundation models.
- Abstract(参考訳): フローマッチング(FM)は、最近、通常の微分方程式(ODE)モデルに代わる堅牢な連続時間を提供する、高忠実度視覚生成の先駆的なアプローチとして登場した。
しかし、その成功にもかかわらず、FMモデルはデータセットバイアスに非常に敏感であり、アウト・オブ・ディストリビューションやマイノリティ・クラスのサンプルを生成する際に深刻な意味劣化を引き起こす。
本稿では,FMフレームワーク内での 'Bias Manifold'' の厳密な数学的形式化について述べる。
この性能低下は、必然的に推論中に軌道ロックインにつながるメカニズムである条件付き期待平滑化によって引き起こされる。
そこで本研究では,初期速度場計算中に直交意味論を注入することで,ランダムな種子の変更を必要とせず,新しいトレーニング不要なInjectFlowを提案する。
この設計は、高い生成品質を維持しつつ、潜伏する多数決モードへのドリフトを効果的に防止する。
大規模な実験は、我々のアプローチの有効性を実証する。
特に、GenEvalデータセットでは、InjectFlowが標準フローマッチングモデルが正しく生成できないというプロンプトの75%をうまく修正している。
究極的には、我々の理論的分析とアルゴリズムは、より公平で堅牢な視覚基盤モデルを構築するのに使えるソリューションを提供する。
関連論文リスト
- Modular MeanFlow: Towards Stable and Scalable One-Step Generative Modeling [0.07646713951724012]
一段階生成モデリングは、単一関数評価において高品質なデータサンプルを生成することを目指している。
本研究では、時間平均速度場を学習するための柔軟で理論的に基礎付けられたアプローチであるModular MeanFlowを紹介する。
論文 参考訳(メタデータ) (2025-08-24T16:00:08Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - Heavy-Tailed Diffusion Models [38.713884992630675]
従来の拡散・流れマッチングモデルでは, 重み付き挙動を捉えることができないことを示す。
ヘビーテール推定のための拡散フレームワークを再利用することで、この問題に対処する。
既存の拡散・流動モデルの拡張である t-EDM と t-Flow を導入する。
論文 参考訳(メタデータ) (2024-10-18T04:29:46Z) - Derivative-Free Guidance in Continuous and Discrete Diffusion Models with Soft Value-Based Decoding [84.3224556294803]
拡散モデルは、画像、分子、DNA、RNA、タンパク質配列の自然なデザイン空間を捉えるのに優れている。
これらの設計空間の自然性を保ちながら、下流の報酬関数を最適化することを目指している。
提案アルゴリズムは,中間雑音状態が将来高い報酬をもたらすことの先駆けとして,ソフトバリュー関数を統合する。
論文 参考訳(メタデータ) (2024-08-15T16:47:59Z) - Learning Diffusion Priors from Observations by Expectation Maximization [10.704978219090039]
不完全および雑音のみから拡散モデルをトレーニングするための新しい手法であるDEMを提案する。
以前の研究とは異なり、DEMは適切な拡散モデルをもたらし、下流のタスクに不可欠である。
論文 参考訳(メタデータ) (2024-05-22T15:04:06Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Improving and generalizing flow-based generative models with minibatch
optimal transport [90.01613198337833]
連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文 参考訳(メタデータ) (2023-02-01T14:47:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。