論文の概要: Carré du champ flow matching: better quality-generalisation tradeoff in generative models
- arxiv url: http://arxiv.org/abs/2510.05930v1
- Date: Tue, 07 Oct 2025 13:41:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-08 17:57:08.272598
- Title: Carré du champ flow matching: better quality-generalisation tradeoff in generative models
- Title(参考訳): カルレ・デュ・シャン・フローマッチング : 生成モデルにおけるより良い品質一般化トレードオフ
- Authors: Jacob Bamberger, Iolo Jones, Dennis Duncan, Michael M. Bronstein, Pierre Vandergheynst, Adam Gosztolai,
- Abstract要約: Carr'e du champ flow matching (CDC-FM) はフローマッチング(FM)の一般化である
CDC-FMは品質全般的なトレードオフを継続的に提供しています。
我々の研究は、生成モデルにおけるデータ幾何学、一般化、記憶の相互作用を研究する数学的枠組みを提供する。
- 参考スコア(独自算出の注目度): 24.078205139029546
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep generative models often face a fundamental tradeoff: high sample quality can come at the cost of memorisation, where the model reproduces training data rather than generalising across the underlying data geometry. We introduce Carr\'e du champ flow matching (CDC-FM), a generalisation of flow matching (FM), that improves the quality-generalisation tradeoff by regularising the probability path with a geometry-aware noise. Our method replaces the homogeneous, isotropic noise in FM with a spatially varying, anisotropic Gaussian noise whose covariance captures the local geometry of the latent data manifold. We prove that this geometric noise can be optimally estimated from the data and is scalable to large data. Further, we provide an extensive experimental evaluation on diverse datasets (synthetic manifolds, point clouds, single-cell genomics, animal motion capture, and images) as well as various neural network architectures (MLPs, CNNs, and transformers). We demonstrate that CDC-FM consistently offers a better quality-generalisation tradeoff. We observe significant improvements over standard FM in data-scarce regimes and in highly non-uniformly sampled datasets, which are often encountered in AI for science applications. Our work provides a mathematical framework for studying the interplay between data geometry, generalisation and memorisation in generative models, as well as a robust and scalable algorithm that can be readily integrated into existing flow matching pipelines.
- Abstract(参考訳): 深い生成モデルは、しばしば根本的なトレードオフに直面している: 高いサンプル品質は記憶のコストで得られ、モデルが基礎となるデータ幾何学を一般化するのではなく、トレーニングデータを再現する。
本稿では,フローマッチング(FM)の一般化であるCarr\'e du champ flow matching (CDC-FM)を紹介する。
提案手法は, FMにおける同次等方性雑音を, 共分散が潜在データ多様体の局所的幾何を捉えるような空間的に変化する異方性ガウス雑音に置き換える。
この幾何学的ノイズはデータから最適に推定でき、大規模データに対してスケーラブルであることを示す。
さらに, 多様なデータセット(合成多様体, 点雲, 単一セルゲノミクス, 動物のモーションキャプチャ, 画像)と, さまざまなニューラルネットワークアーキテクチャ(MLP, CNN, トランスフォーマー)について, 広範囲にわたる実験的評価を行った。
CDC-FMは、常により良い品質の汎用トレードオフを提供していることを実証する。
我々は、データスカースシステムや、科学応用のAIでよく見られる、高度に一様でないサンプルデータセットにおいて、標準FMよりも大幅に改善されていることを観察する。
我々の研究は、生成モデルにおけるデータ幾何学、一般化、記憶の相互作用を研究する数学的枠組みと、既存のフローマッチングパイプラインに容易に組み込むことのできる堅牢でスケーラブルなアルゴリズムを提供する。
関連論文リスト
- Elucidating Flow Matching ODE Dynamics with Respect to Data Geometries and Denoisers [10.947094609205765]
フローマッチング(FM)モデルは、ODEサンプルモデルに基づく拡散モデルを一般的なフレームワークに拡張する。
FMモデルの厳密な理論的解析は、サンプルの品質、安定性、より広範な適用性に不可欠である。
本稿では,サンプル軌道の包括的解析により,FMモデルの理論を推し進める。
論文 参考訳(メタデータ) (2024-12-25T01:17:15Z) - Categorical Flow Matching on Statistical Manifolds [12.646272756981672]
本稿では,情報幾何学に着想を得たパラメータ化確率尺度の多様体上でのフローマッチングフレームワークを提案する。
我々は,多様体間の微分同相法により数値安定性を克服する効率的なトレーニングとサンプリングアルゴリズムを開発した。
我々は、SFMが、既存のモデルがしばしば失敗するような統計多様体上でより複雑なパターンを学習できることを示した。
論文 参考訳(メタデータ) (2024-05-26T05:50:39Z) - RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Decision Forest Based EMG Signal Classification with Low Volume Dataset
Augmented with Random Variance Gaussian Noise [51.76329821186873]
我々は6種類の手振りを限定的なサンプル数で分類できるモデルを作成し、より広い聴衆によく一般化する。
信号のランダムなバウンドの使用など、より基本的な手法のセットにアピールするが、これらの手法がオンライン環境で持てる力を示したいと考えている。
論文 参考訳(メタデータ) (2022-06-29T23:22:18Z) - Moser Flow: Divergence-based Generative Modeling on Manifolds [49.04974733536027]
Moser Flow (MF) は連続正規化フロー(CNF)ファミリーにおける新しい生成モデルのクラスである
MFは、訓練中にODEソルバを介して呼び出しやバックプロパゲートを必要としない。
一般曲面からのサンプリングにおけるフローモデルの利用を初めて実演する。
論文 参考訳(メタデータ) (2021-08-18T09:00:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。