論文の概要: Posterior Augmented Flow Matching
- arxiv url: http://arxiv.org/abs/2605.00825v1
- Date: Fri, 01 May 2026 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 17:43:29.035609
- Title: Posterior Augmented Flow Matching
- Title(参考訳): 後部Augmented Flow Matching
- Authors: George Stoica, Sayak Paul, Matthew Wallingford, Vivek Ramanujan, Abhay Nori, Winson Han, Ali Farhadi, Ranjay Krishna, Judy Hoffman,
- Abstract要約: 後拡張フローマッチング(PAFM)はフローマッチング(FM)の一般化である
PAFMは、異なるモデルスケールで最大3.4FID50KでFMよりも改善されていることを示す。
- 参考スコア(独自算出の注目度): 64.1559809786948
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Flow matching (FM) trains a time-dependent vector field that transports samples from a simple prior to a complex data distribution. However, for high-dimensional images, each training sample supervises only a single trajectory and intermediate point, yielding an extremely sparse and high-variance training signal. This under-constrained supervision can cause flow collapse, where the learned dynamics memorize specific source-target pairings, mapping diverse inputs to overly similar outputs, failing to generalize. We introduce Posterior-Augmented Flow Matching (PAFM), a theoretically grounded generalization of FM that replaces single-target supervision with an expectation over an approximate posterior of valid target completions for a given intermediate state and condition. PAFM factorizes this intractable posterior into (i) the likelihood of the intermediate under a hypothesized endpoint and (ii) the prior probability of that endpoint under the condition, and uses an importance sampling scheme to construct a mixture over multiple candidate targets. We prove that PAFM yields an unbiased estimator of the original FM objective while substantially reducing gradient variance during training by aggregating information from many plausible continuation trajectories per intermediate. Finally, we show that PAFM improves over FM by up to 3.4 FID50K across different model scales (SiT-B/2 and SiT-XL/2), different architectures (SiT and MMDiT), and in both class and text conditioned benchmarks (ImageNet and CC12M), with a negligible increase in the compute overhead. Code: https://github.com/gstoica27/PAFM.git.
- Abstract(参考訳): フローマッチング(FM)は、複雑なデータ分布に先立って単純なデータからサンプルを輸送する時間依存ベクトル場を訓練する。
しかし、高次元画像の場合、各トレーニングサンプルは1つの軌跡と中間点のみを監督し、非常にスパースで高分散の訓練信号を生成する。
学習されたダイナミクスが特定のソースとターゲットのペアリングを記憶し、多様な入力を過度に類似した出力にマッピングし、一般化に失敗する。
提案手法は,理論上基礎を成したFMの一般化であり,任意の中間状態と条件に対する有効な目標完了のおよそ後部への期待に代えて,単一ターゲットの監視を置き換えるものである。
PAFMはこの難治性後肢を分解する
一 仮説上の終点及び中間点の確率
2) 条件下でのエンドポイントの事前確率は、重要サンプリングスキームを用いて、複数の候補対象にまたがる混合を構成する。
PAFMは, 従来のFM目標の偏りのない推定値を生成するとともに, 中間点当たりの多くの可算連続軌道からの情報を集約することにより, トレーニング中の勾配分散を著しく低減する。
最後に、PAFMは、異なるモデルスケール(SiT-B/2とSiT-XL/2)、異なるアーキテクチャ(SiTとMMDiT)、およびクラスおよびテキスト条件付きベンチマーク(ImageNetとCC12M)において最大3.4 FID50KでFM上で改善され、計算オーバーヘッドは無視できる。
コード:https://github.com/gstoica27/PAFM.git
関連論文リスト
- COT-FM: Cluster-wise Optimal Transport Flow Matching [5.771040439456201]
フローマッチングモデルは、しばしばランダムまたはバッチの結合による曲線軌道を生成する。
COT-FMは、ターゲットサンプルをクラスタ化し、各クラスタに専用のソースディストリビューションを割り当てることで、この問題を修正する。
プラグアンドプレイのアプローチとして、COT-FMは一貫してサンプリングを加速し、2Dデータセット、画像生成ベンチマーク、ロボット操作タスクにおける生成品質を改善する。
論文 参考訳(メタデータ) (2026-03-11T13:52:17Z) - Riemannian MeanFlow for One-Step Generation on Manifolds [54.09734511705173]
フローマッチングは、生成モデルのシミュレーション不要なトレーニングを可能にする。
平均フローは、位置依存接空間に速度が存在する多様体値生成に拡張することができる。
球面, トーリ, SO(3)における実験は, 品質・効率のトレードオフを改善し, サンプリングコストを大幅に削減して, 競争力のある一段階サンプリングを実証した。
論文 参考訳(メタデータ) (2026-03-11T12:41:46Z) - Risk-Entropic Flow Matching [0.0]
対数指数変換をベース損失に適用することで得られる(エントロピー的な)リスクは、統計学や機械学習において確立されたツールである。
本研究では, 標準リスク感度変換(log-exponential)を条件FM損失に適用し, 結果の傾きリスク損失が有意な条件FM目標上の自然上界であることを示す。
論文 参考訳(メタデータ) (2025-11-28T00:37:37Z) - How and Why: Taming Flow Matching for Unsupervised Anomaly Detection and Localization [15.283777345273089]
時間反転フローマッチングの概念をベクトル場回帰として定式化する。
線形確率経路を持つFMは本質的に非可逆であることを示す。
本研究は,非教師付き異常検出タスクに対するFMの最初の成功例を示す。
論文 参考訳(メタデータ) (2025-08-07T15:02:07Z) - DFM: Interpolant-free Dual Flow Matching [0.8192907805418583]
モデルベクトル場に関する明示的な仮定を伴わない補間自由二重流れマッチング(DFM)手法を提案する。
SMAPによる教師なし異常検出実験は、最大極度またはFM目標で訓練されたCNFと比較して、DFMの利点を示す。
論文 参考訳(メタデータ) (2024-10-11T20:46:04Z) - Stream-level flow matching with Gaussian processes [4.935875591615496]
条件付きフローマッチング(CFM)は、連続正規化フロー(CNF)を適合させる訓練アルゴリズムの一群である。
我々は、ストリームに沿った条件付き確率パス、ソースとターゲットのデータペアを接続する遅延パスのインスタンスを定義することで、CFMアルゴリズムを拡張した。
本研究では, CFMの一般化により, 推定限界ベクトル場の分散を適度な計算コストで効果的に低減できることを示す。
論文 参考訳(メタデータ) (2024-09-30T15:47:22Z) - Flow matching achieves almost minimax optimal convergence [50.38891696297888]
フローマッチング (FM) は, シミュレーションのない生成モデルとして注目されている。
本稿では,大試料径のFMの収束特性を$p$-Wasserstein 距離で論じる。
我々は、FMが1leq p leq 2$でほぼ最小の収束率を達成できることを確立し、FMが拡散モデルに匹敵する収束率に達するという最初の理論的証拠を示す。
論文 参考訳(メタデータ) (2024-05-31T14:54:51Z) - Diffusion Generative Flow Samplers: Improving learning signals through
partial trajectory optimization [87.21285093582446]
Diffusion Generative Flow Samplers (DGFS) はサンプルベースのフレームワークであり、学習プロセスを短い部分的軌道セグメントに分解することができる。
生成フローネットワーク(GFlowNets)のための理論から着想を得た。
論文 参考訳(メタデータ) (2023-10-04T09:39:05Z) - FPCR-Net: Feature Pyramidal Correlation and Residual Reconstruction for
Optical Flow Estimation [72.41370576242116]
フレーム対からの光フロー推定のための半教師付き特徴ピラミッド相関・残留再構成ネットワーク(FPCR-Net)を提案する。
ピラミッド相関マッピングと残留再構成の2つの主要なモジュールで構成されている。
実験結果から,提案手法は,平均終点誤差 (AEE) に対して0.80, 1.15, 0.10の改善を達成し,最先端性能を実現していることがわかった。
論文 参考訳(メタデータ) (2020-01-17T07:13:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。