論文の概要: Unfolding Generative Flows with Koopman Operators: Fast and Interpretable Sampling
- arxiv url: http://arxiv.org/abs/2506.22304v1
- Date: Fri, 27 Jun 2025 15:16:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:23.257167
- Title: Unfolding Generative Flows with Koopman Operators: Fast and Interpretable Sampling
- Title(参考訳): Koopman演算子による生成フローの展開:高速かつ解釈可能なサンプリング
- Authors: Erkan Turan, Aristotelis Siozopoulos, Maks Ovsjanikov,
- Abstract要約: Conditional Flow Matching (CFM)は、連続時間生成モデルをトレーニングするためのシミュレーション不要のフレームワークを提供する。
我々は、CFMを加速し、クープマン作用素理論を統合することにより、その力学の解釈可能な表現を導入することを提案する。
- 参考スコア(独自算出の注目度): 26.912726794632732
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Conditional Flow Matching (CFM) offers a simulation-free framework for training continuous-time generative models, bridging diffusion and flow-based approaches. However, sampling from CFM still relies on numerically solving non-linear ODEs which can be computationally expensive and difficult to interpret. Recent alternatives address sampling speed via trajectory straightening, mini-batch coupling or distillation. However, these methods typically do not shed light on the underlying \textit{structure} of the generative process. In this work, we propose to accelerate CFM and introduce an interpretable representation of its dynamics by integrating Koopman operator theory, which models non-linear flows as linear evolution in a learned space of observables. We introduce a decoder-free Koopman-CFM architecture that learns an embedding where the generative dynamics become linear, enabling closed-form, one-step sampling via matrix exponentiation. This results in significant speedups over traditional CFM as demonstrated on controlled 2D datasets and real-world benchmarks, MNIST, Fashion-MNIST (F-MNIST), and the Toronto Face Dataset (TFD). Unlike previous methods, our approach leads to a well-structured Koopman generator, whose spectral properties, eigenvalues, and eigenfunctions offer principled tools for analyzing generative behavior such as temporal scaling, mode stability, and decomposition in Koopman latent space. By combining sampling efficiency with analytical structure, Koopman-enhanced flow matching offers a potential step toward fast and interpretable generative modeling.
- Abstract(参考訳): Conditional Flow Matching (CFM)は、連続時間生成モデルのトレーニング、ブリッジング拡散、フローベースアプローチのためのシミュレーション不要のフレームワークを提供する。
しかし、CFMからのサンプリングは計算コストが高く解釈が難しい非線形ODEを数値的に解くことに依存している。
最近の代替手段は、軌道ストレートニング、ミニバッチカップリング、蒸留によるサンプリング速度に対処している。
しかし、これらの方法は通常、生成過程の基盤となる \textit{structure} に光を当てない。
本研究では,CFMを加速させ,その力学の解釈可能な表現をクープマン作用素理論と統合し,非線形流れを可観測物の学習空間における線形進化としてモデル化することを提案する。
生成力学が線形となる埋め込みを学習するデコーダフリーのクープマンCFMアーキテクチャを導入し,行列指数による閉形式一段階サンプリングを可能にする。
これにより、制御された2Dデータセットや実世界のベンチマーク、MNIST、Fashion-MNIST(F-MNIST)、トロント顔データセット(TFD)など、従来のCFMよりも大幅に高速化される。
従来の手法と異なり, スペクトル特性, 固有値, 固有関数は, 時間的スケーリング, モード安定性, Koopman潜在空間の分解といった生成挙動を解析するための基本的ツールを提供する, 十分に構造化されたKoopman生成器に導かれる。
サンプリング効率と解析構造を組み合わせることで、クープマン強化フローマッチングは高速かつ解釈可能な生成モデルに向けた潜在的なステップを提供する。
関連論文リスト
- Local Flow Matching Generative Models [19.859984725284896]
局所フローマッチング(Local Flow Matching)は、フローベース生成モデルに基づく密度推定のための計算フレームワークである。
$textttLFM$はシミュレーション不要のスキームを採用し、フローマッチングサブモデルのシーケンスを漸進的に学習する。
FMと比較して, $textttLFM$ のトレーニング効率と競争的生成性能の改善を実証した。
論文 参考訳(メタデータ) (2024-10-03T14:53:10Z) - Latent Space Energy-based Neural ODEs [73.01344439786524]
本稿では,連続時間列を表現するために設計された新しい深部力学モデルを提案する。
マルコフ連鎖モンテカルロの最大推定値を用いてモデルを訓練する。
振動系, ビデオ, 実世界の状態系列(MuJoCo)の実験結果から, 学習可能なエネルギーベース先行モデルの方が既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2024-09-05T18:14:22Z) - Koopman-Based Surrogate Modelling of Turbulent Rayleigh-Bénard Convection [4.248022697109535]
我々は,LRAN(Linear Recurrent Autoencoder Network)と呼ばれるクープマンにインスパイアされたアーキテクチャを用いて,対流中の低次ダイナミクスを学習する。
従来の流体力学法であるKernel Dynamic Mode Decomposition (KDMD)を用いてLRANを比較する。
我々は,最も乱流条件下では,KDMDよりもLRANの方が正確な予測値を得た。
論文 参考訳(メタデータ) (2024-05-10T12:15:02Z) - Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z) - Improving and generalizing flow-based generative models with minibatch
optimal transport [90.01613198337833]
連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文 参考訳(メタデータ) (2023-02-01T14:47:17Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Towards extraction of orthogonal and parsimonious non-linear modes from
turbulent flows [0.0]
本稿では,非線形モードの最小およびほぼ直交の集合を学習するための深い確率-神経-ネットワークアーキテクチャを提案する。
我々のアプローチは、$beta$-variational autoencoders($beta$-VAEs)と畳み込みニューラルネットワーク(CNNs)に基づいている。
論文 参考訳(メタデータ) (2021-09-03T13:38:51Z) - Deep Learning Enhanced Dynamic Mode Decomposition [0.0]
畳み込みオートエンコーダネットワークを用いて、観測対象の最適なファミリーを同時に見つける。
また,観測可能空間への流れの正確な埋め込みと,観測可能空間の流れ座標への浸漬も生成する。
このネットワークはフローのグローバルな変換をもたらし、EDMDとデコーダネットワークを介して将来の状態を予測する。
論文 参考訳(メタデータ) (2021-08-10T03:54:23Z) - Flow-based Spatio-Temporal Structured Prediction of Motion Dynamics [21.24885597341643]
条件付き流れ (CNF) は、高次元と相互相関を持つ複雑な分布を表現できるフレキシブルな生成モデルである。
本研究では,時間的入力特徴の出力を自己回帰的に正規化する新しい手法としてMotionFlowを提案する。
本稿では,予測,動き予測時系列予測,二分節分割などのタスクに本手法を適用した。
論文 参考訳(メタデータ) (2021-04-09T14:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。