論文の概要: Coreset-Induced Conditional Velocity Flow Matching
- arxiv url: http://arxiv.org/abs/2605.12951v1
- Date: Wed, 13 May 2026 03:34:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.788463
- Title: Coreset-Induced Conditional Velocity Flow Matching
- Title(参考訳): コアセットによる条件付き速度流マッチング
- Authors: Xiao Wang, Zihua She, Jianxi Su,
- Abstract要約: データインフォームドソース分布を用いて階層的整流を増大させる生成モデルを提案する。
鍵となる観測は、この内部のソースは、ターゲットのコアセットから構築されたクローズドフォームのサロゲートに置き換えられることである。
この正確なサロゲート源から訓練された軽量な補正流は、残りのサロゲートからターゲットへの残留物を洗練させる。
- 参考スコア(独自算出の注目度): 4.297295761793895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Coreset-Induced Conditional Velocity Flow Matching (CCVFM), a generative model that augments hierarchical rectified flow with a data-informed source distribution. Hierarchical flow matching models the full conditional velocity law in velocity space, but its inner flow is asked to transport isotropic Gaussian noise to a multimodal target velocity distribution from scratch. Our key observation is that this inner source can be replaced by a closed-form surrogate built from a coreset of the target. CCVFM first compresses the target into weighted atoms using an entropic Sinkhorn coreset and lifts them to a Gaussian mixture. The induced conditional velocity law is then a closed-form Gaussian mixture that can be sampled without a learned neural sampler. A lightweight correction flow, trained from this exact surrogate source, then refines the remaining surrogate-to-target residual rather than learning an entire noise-to-data map. We prove that the surrogate transport cost equals the target--surrogate Wasserstein gap under an explicit compression assumption, whereas the noise-source analogue has a dimension-scale lower bound. We further characterize the conditional second moment of the direct surrogate-source training target and show that its source-dependent excess is small when the surrogate conditional law is close to the true conditional velocity law in mean and covariance. Empirically, on MNIST, CIFAR-10, ImageNet-32, and CelebA-HQ, the proposed method reaches competitive few-step generation under matched architectures.
- Abstract(参考訳): データインフォームドソース分布を用いて階層的整流フローを増大させる生成モデルであるCoreset-induced Conditional Velocity Flow Matching (CCVFM)を提案する。
階層的な流れマッチングは、速度空間における全条件速度則をモデル化するが、内部の流れは、等方性ガウスノイズをスクラッチから多モーダル目標速度分布へ輸送するよう要求される。
私たちのキーとなる観察は、この内部のソースはターゲットのコアセットから構築されたクローズドフォームのサロゲートに置き換えられるということです。
CCVFMはまずエントロピックシンクホーンコアセットを用いてターゲットを重み付き原子に圧縮し、それをガウス混合物に持ち上げる。
誘導された条件速度則は、学習されたニューラルサンプリングなしでサンプリングできる閉形式のガウス混合である。
この正確なサロゲート源から訓練された軽量な補正フローは、ノイズ・トゥ・データ・マップ全体を学ぶのではなく、残りのサロゲート・トゥ・ターゲット残差を洗練する。
本研究では,サロゲート輸送コストが目標のワッセルシュタインギャップと等しいことを明示的な圧縮仮定で証明し,ノイズ源アナログは次元スケールの低い境界を持つことを示した。
さらに, 直接補助源訓練目標の条件2次モーメントを特徴付けるとともに, 震源依存性の余剰量は, 震源条件法則が平均および共分散の真の条件速度法則に近接している場合に小さくなることを示す。
MNIST, CIFAR-10, ImageNet-32, CelebA-HQ において,提案手法は一致したアーキテクチャ下での競合的な数ステップ生成に到達した。
関連論文リスト
- Tilt Matching for Scalable Sampling and Fine-Tuning [4.14348726233299]
本研究では,非正規化密度のサンプルや微調整生成モデルに補間剤を用いるスケーラブルなアルゴリズムを提案する。
ティルトマッチング(Tilt Matching)という手法は、流れのマッチング速度と、報酬によって傾いた同じ分布をターゲットにした力学方程式から生じる。
我々は,この手法が効率的かつ高度に拡張可能であることを実証的に検証し,レナード・ジョーンズポテンシャルの下でのサンプリングにおける最先端の結果を提供し,微調整安定拡散に競争力を持つことを示した。
論文 参考訳(メタデータ) (2025-12-26T02:12:10Z) - Score Distillation of Flow Matching Models [67.86066177182046]
我々は、Score Identity Distillation (SiD) を事前訓練されたテキスト対画像フローマッチングモデルに拡張する。
SiDは、データフリーとデータアシストの両方の設定で、これらのモデルですぐに使える。
これは、スコア蒸留がテキストと画像のフローマッチングモデルに広く適用されるという最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2025-09-29T17:45:48Z) - Flow Matching in the Low-Noise Regime: Pathologies and a Contrastive Remedy [19.64681328133978]
フローマッチングは、生成モデリングと表現学習のための連続時間定式化を提供する。
この枠組みは低雑音体制における根本的な不安定性に悩まされていることを示す。
直接速度回帰を小さな雑音レベルにおける対照的な特徴アライメントに置き換えるハイブリッドトレーニングプロトコルであるLocal Contrastive Flow (LCF)を提案する。
論文 参考訳(メタデータ) (2025-09-25T09:36:41Z) - On the Wasserstein Convergence and Straightness of Rectified Flow [54.580605276017096]
Rectified Flow (RF) は、ノイズからデータへの直流軌跡の学習を目的とした生成モデルである。
RFのサンプリング分布とターゲット分布とのワッサーシュタイン距離に関する理論的解析を行った。
本稿では,従来の経験的知見と一致した1-RFの特異性と直線性を保証する一般的な条件について述べる。
論文 参考訳(メタデータ) (2024-10-19T02:36:11Z) - Improving Consistency Models with Generator-Augmented Flows [16.049476783301724]
一貫性モデルは、ニューラルネットワークの単一前方通過におけるスコアベース拡散の多段階サンプリングを模倣する。
それらは、一貫性の蒸留と一貫性のトレーニングの2つの方法を学ぶことができる。
本稿では,一貫性モデルから得られたノイズデータを対応する出力へ転送する新しい流れを提案する。
論文 参考訳(メタデータ) (2024-06-13T20:22:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。