Fugu-MT 論文翻訳(概要): Follow the Mean: Reference-Guided Flow Matching

論文の概要: Follow the Mean: Reference-Guided Flow Matching

arxiv url: http://arxiv.org/abs/2605.10302v2
Date: Tue, 12 May 2026 09:36:29 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-13 18:21:07.120643
Title: Follow the Mean: Reference-Guided Flow Matching
Title（参考訳）: Follow the Mean: Reference-Guided Flow Matching
Authors: Pedro M. P. Curvo, Maksim Zhdanov, Floor Eijkelboom, Jan-Willem van de Meent,
Abstract要約: フローマッチングは異なる制御インターフェース(例による適応)を持つことを示す。決定論的補間子の場合、速度場は条件付き終端平均によってのみ支配される。これは制御可能な生成の単純な原理である:従う参照集合を変更して事前訓練されたモデルを操る。
参考スコア（独自算出の注目度）: 10.73543578064991
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Existing approaches to controllable generation typically rely on fine-tuning, auxiliary networks, or test-time search. We show that flow matching admits a different control interface: adaptation through examples. For deterministic interpolants, the velocity field is solely governed by a conditional endpoint mean; shifting this mean shifts the flow itself. This yields a simple principle for controllable generation: steer a pretrained model by changing the reference set it follows. We instantiate this idea in two forms. Reference-Mean Guidance is training-free: it computes a closed-form endpoint-mean correction from a reference bank and applies it to a frozen FLUX.2-klein (4B) model, enabling control of color, identity, style, and structure while keeping the prompt, seed, and weights fixed. Semi-Parametric Guidance amortizes the same idea through an explicit mean anchor and learned residual refiner, matching unconditional DiT-B/4 quality on AFHQv2 while allowing the reference set to be swapped at inference time. These results point to a broader direction: generative models that adapt through data, not parameter updates.
Abstract（参考訳）: 制御可能な生成への既存のアプローチは、通常、微調整、補助ネットワーク、テストタイムサーチに依存している。フローマッチングは異なる制御インターフェース(例による適応)を持つことを示す。決定論的補間子の場合、速度場は条件付き終端平均によってのみ支配される。これは制御可能な生成の単純な原理である:従う参照集合を変更して事前訓練されたモデルを操る。私たちはこのアイデアを2つの形でインスタンス化する。参照平均誘導(Reference-Mean Guidance)はトレーニングフリーで、参照バンクから閉じた形式のエンドポイント平均補正を計算し、凍結したFLUX.2-klein (4B)モデルに適用し、プロンプト、シード、ウェイトを固定しながら色、アイデンティティ、スタイル、構造を制御できる。 Semi-Parametric Guidance は明示的な平均アンカーを通じて同じアイデアを補正し、AFHQv2 の非条件の DiT-B/4 品質に適合し、参照セットを推論時にスワップすることができる。これらの結果は、パラメータ更新ではなく、データを通じて適応する生成モデルである。

関連論文リスト

Variational Bayesian Flow Network for Graph Generation [54.94088904387278]
グラフ生成のための変分ベイズフローネットワーク(VBFN)を提案する。 VBFNは、構造化精度で支配されるトラクタブルジョイントガウス変分信念ファミリーに対して変分リフトを行う。合成グラフと分子グラフのデータセットでは、VBFNは忠実度と多様性を改善し、ベースライン法を超えている。
論文参考訳（メタデータ） (2026-01-30T03:59:38Z)
Rectified-CFG++ for Flow Based Models [26.896426878221718]
本稿では,修正フローの決定論的効率を幾何学的条件付きルールと組み合わせた適応型予測器・補正器ガイダンスであるRectified-C++を提案する。大規模なテキスト・ツー・イメージモデル(Flux, Stable Diffusion 3/3.5, Lumina)の実験では、Rectified-C++がベンチマークデータセットの標準CFGを一貫して上回っていることが示されている。
論文参考訳（メタデータ） (2025-10-09T00:00:47Z)
Optimal Control Meets Flow Matching: A Principled Route to Multi-Subject Fidelity [35.95129874095729]
テキスト・トゥ・イメージ(T2I)モデルは単一エンタリティ・プロンプトに優れるが、多目的記述に苦慮する。マルチオブジェクト忠実度に向けてサンプリングダイナミクスを操るための原理的最適化可能な目的を持った最初の理論的枠組みを導入する。
論文参考訳（メタデータ） (2025-10-02T17:59:58Z)
CAPE: A CLIP-Aware Pointing Ensemble of Complementary Heatmap Cues for Embodied Reference Understanding [56.30142869506262]
身体的参照理解(Embodied Reference Understanding)は、シーンの人物が指し示すジェスチャーと言語の両方を通して参照しているオブジェクトを予測する。本稿では,2重モデルフレームワークを提案し,一方のモデルが頭指先方向から学習し,他方のモデルが手指先方向から学習する。我々は、ベンチマークYouRefItデータセットの広範な実験と分析を通じてアプローチを検証し、0.25IoU閾値で約4mAPの改善を実現した。
論文参考訳（メタデータ） (2025-07-29T15:00:21Z)
Controlled Generation with Equivariant Variational Flow Matching [36.83474113229796]
変動流マッチング(VFM)の枠組みにおける制御された生成目標を導出する。本研究では,(1)条件付き生成モデルのエンドツーエンドトレーニング,あるいは(2)ベイズ推論問題として,制御生成を実現する方法を示す。
論文参考訳（メタデータ） (2025-06-23T06:42:48Z)
Rectified Diffusion: Straightness Is Not Your Need in Rectified Flow [65.51671121528858]
拡散モデルは、視覚生成を大幅に改善したが、生成ODEを解くという計算集約的な性質のため、生成速度の遅さによって妨げられている。広く認識されている解である整流流は、ODEパスを直線化することで生成速度を向上させる。本稿では,より広範な拡散モデルのカテゴリをカバーするために,設計空間と修正の応用範囲を一般化するRectified Diffusionを提案する。
論文参考訳（メタデータ） (2024-10-09T17:43:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。