論文の概要: How to Guide Your Flow: Few-Step Alignment via Flow Map Reward Guidance
- arxiv url: http://arxiv.org/abs/2604.27147v1
- Date: Wed, 29 Apr 2026 19:56:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.781218
- Title: How to Guide Your Flow: Few-Step Alignment via Flow Map Reward Guidance
- Title(参考訳): フローをガイドする方法 - Flow Map Reward GuidanceによるFew-Step Alignment
- Authors: Jerry Y. Huang, Justin Lin, Sheel Shah, Kartik Nair, Nicholas M. Boffi,
- Abstract要約: Flow Map Reward Guidance(FMRG)は、フローマップを使用してフローの統合とガイドを行う、トレーニング不要の単一トラジェクトリフレームワークである。
テキスト・ツー・イメージのスケールでは、FMRGは3つのNFEで逆問題、スタイル転送、人間の好み、VLM報酬のベースラインをマッチまたはオーバーする。
- 参考スコア(独自算出の注目度): 2.2602594453321063
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In generative modeling, we often wish to produce samples that maximize a user-specified reward such as aesthetic quality or alignment with human preferences, a problem known as guidance. Despite their widespread use, existing guidance methods either require expensive multi-particle, many-step schemes or rely on poorly understood approximations. We reformulate guidance as a deterministic optimal control problem, yielding a hierarchy of algorithms that subsumes existing approaches at the coarsest level. We show that the flow map, an object of significant recent interest for its role in fast inference, arises naturally in the optimal solution. Based on this observation, we propose Flow Map Reward Guidance (FMRG): a training-free, single-trajectory framework that uses the flow map to both integrate and guide the flow. At text-to-image scale, FMRG matches or surpasses baselines across inverse problems, style transfer, human preferences, and VLM rewards with as few as 3 NFEs, giving at least an order-of-magnitude speedup in comparison to prior state of the art.
- Abstract(参考訳): ジェネレーティブ・モデリングでは、審美的品質や人間の嗜好との整合性など、ユーザが特定した報酬を最大化するサンプルを作成したい場合が多い。
広く使われているにもかかわらず、既存のガイダンス手法は高価な多粒子、多段階のスキームを必要とするか、よく理解されていない近似に依存している。
我々は、決定論的最適制御問題としてガイダンスを再構成し、より粗いレベルで既存のアプローチを仮定するアルゴリズムの階層を生成する。
高速推論におけるその役割に対する最近の重要な関心の対象であるフローマップが、最適解において自然に現れることを示す。
本研究では,フローマップを用いてフローを統合・誘導するトレーニングフリー単軌道フレームワークであるフローマップ・リワードガイダンス(FMRG)を提案する。
テキスト・ツー・イメージのスケールでは、FMRGは、逆問題、スタイル・トランスファー、人間の嗜好、VLM報酬を3 NFEで一致または上回る。
関連論文リスト
- Test-time scaling of diffusions with flow maps [68.79792714591564]
テスト時の拡散モデルを改善するための一般的なレシピは、報酬の勾配を拡散そのものの力学に導入することである。
フローマップを直接扱うことで,簡単な解を提案する。
本研究では, 流図と流速場の関係を利用して, 従来のテスト時間法よりも精度の高いフローマップトラジェクトリ・ティルティング (FMTT) アルゴリズムを構築した。
論文 参考訳(メタデータ) (2025-11-27T18:44:12Z) - Consistency Flow Matching: Defining Straight Flows with Velocity Consistency [97.28511135503176]
本稿では,速度場の自己整合性を明示する新しいFM法であるConsistency Flow Matching(Consistency-FM)を紹介する。
予備実験により、一貫性FMは、一貫性モデルよりも4.4倍速く収束することにより、トレーニング効率を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-07-02T16:15:37Z) - Flow Priors for Linear Inverse Problems via Iterative Corrupted Trajectory Matching [35.77769905072651]
本稿では,MAP推定器を効率的に近似する反復アルゴリズムを提案し,様々な線形逆問題の解法を提案する。
本アルゴリズムは,MAPの目的を局所MAP'の目的の和で近似できるという観測によって数学的に正当化される。
我々は,超解法,デブロアリング,インペイント,圧縮センシングなど,様々な線形逆問題に対するアプローチを検証する。
論文 参考訳(メタデータ) (2024-05-29T06:56:12Z) - Sparse Global Matching for Video Frame Interpolation with Large Motion [20.49084881829404]
大きな動きはビデオフレーム補間(VFI)タスクにおいて重要な課題となる。
既存の手法は、しばしば制限された受容場によって制約されるため、大きな動きを持つシナリオを扱う際の準最適性能をもたらす。
我々はVFIのための新しいパイプラインを導入し、グローバルレベルの情報を効果的に統合し、大きな動きに関連する問題を緩和する。
論文 参考訳(メタデータ) (2024-04-10T11:06:29Z) - Optimal Flow Matching: Learning Straight Trajectories in Just One Step [89.37027530300617]
我々は,新しいtextbf Optimal Flow Matching (OFM) アプローチを開発し,理論的に正当化する。
これは2次輸送のための直列のOT変位をFMの1ステップで回復することを可能にする。
提案手法の主な考え方は,凸関数によってパラメータ化されるFMのベクトル場の利用である。
論文 参考訳(メタデータ) (2024-03-19T19:44:54Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。