論文の概要: Unfolding Generative Flows with Koopman Operators: Fast and Interpretable Sampling
- arxiv url: http://arxiv.org/abs/2506.22304v1
- Date: Fri, 27 Jun 2025 15:16:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:23.257167
- Title: Unfolding Generative Flows with Koopman Operators: Fast and Interpretable Sampling
- Title(参考訳): Koopman演算子による生成フローの展開:高速かつ解釈可能なサンプリング
- Authors: Erkan Turan, Aristotelis Siozopoulos, Maks Ovsjanikov,
- Abstract要約: Conditional Flow Matching (CFM)は、連続時間生成モデルをトレーニングするためのシミュレーション不要のフレームワークを提供する。
我々は、CFMを加速し、クープマン作用素理論を統合することにより、その力学の解釈可能な表現を導入することを提案する。
- 参考スコア(独自算出の注目度): 26.912726794632732
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Conditional Flow Matching (CFM) offers a simulation-free framework for training continuous-time generative models, bridging diffusion and flow-based approaches. However, sampling from CFM still relies on numerically solving non-linear ODEs which can be computationally expensive and difficult to interpret. Recent alternatives address sampling speed via trajectory straightening, mini-batch coupling or distillation. However, these methods typically do not shed light on the underlying \textit{structure} of the generative process. In this work, we propose to accelerate CFM and introduce an interpretable representation of its dynamics by integrating Koopman operator theory, which models non-linear flows as linear evolution in a learned space of observables. We introduce a decoder-free Koopman-CFM architecture that learns an embedding where the generative dynamics become linear, enabling closed-form, one-step sampling via matrix exponentiation. This results in significant speedups over traditional CFM as demonstrated on controlled 2D datasets and real-world benchmarks, MNIST, Fashion-MNIST (F-MNIST), and the Toronto Face Dataset (TFD). Unlike previous methods, our approach leads to a well-structured Koopman generator, whose spectral properties, eigenvalues, and eigenfunctions offer principled tools for analyzing generative behavior such as temporal scaling, mode stability, and decomposition in Koopman latent space. By combining sampling efficiency with analytical structure, Koopman-enhanced flow matching offers a potential step toward fast and interpretable generative modeling.
- Abstract(参考訳): Conditional Flow Matching (CFM)は、連続時間生成モデルのトレーニング、ブリッジング拡散、フローベースアプローチのためのシミュレーション不要のフレームワークを提供する。
しかし、CFMからのサンプリングは計算コストが高く解釈が難しい非線形ODEを数値的に解くことに依存している。
最近の代替手段は、軌道ストレートニング、ミニバッチカップリング、蒸留によるサンプリング速度に対処している。
しかし、これらの方法は通常、生成過程の基盤となる \textit{structure} に光を当てない。
本研究では,CFMを加速させ,その力学の解釈可能な表現をクープマン作用素理論と統合し,非線形流れを可観測物の学習空間における線形進化としてモデル化することを提案する。
生成力学が線形となる埋め込みを学習するデコーダフリーのクープマンCFMアーキテクチャを導入し,行列指数による閉形式一段階サンプリングを可能にする。
これにより、制御された2Dデータセットや実世界のベンチマーク、MNIST、Fashion-MNIST(F-MNIST)、トロント顔データセット(TFD)など、従来のCFMよりも大幅に高速化される。
従来の手法と異なり, スペクトル特性, 固有値, 固有関数は, 時間的スケーリング, モード安定性, Koopman潜在空間の分解といった生成挙動を解析するための基本的ツールを提供する, 十分に構造化されたKoopman生成器に導かれる。
サンプリング効率と解析構造を組み合わせることで、クープマン強化フローマッチングは高速かつ解釈可能な生成モデルに向けた潜在的なステップを提供する。
関連論文リスト
- Is Flow Matching Just Trajectory Replay for Sequential Data? [46.770624059457724]
時系列生成には、フローマッチング(FM)がますます使われている。
一般的な力学構造を学ぶのか、それとも単に効果的な「軌道再生」を行うのかはよく分かっていない。
インプリッドサンプリングは、非パラメトリックなメモリ拡張型連続時間力学系を構成するODEであることを示す。
論文 参考訳(メタデータ) (2026-02-09T06:48:45Z) - Euphonium: Steering Video Flow Matching via Process Reward Gradient Guided Stochastic Dynamics [49.242224984144904]
本稿では,プロセス報酬勾配誘導ダイナミクスによる生成を支援する新しいフレームワークであるEuphoniumを提案する。
我々の重要な洞察は、プロセス・リワード・モデルの勾配を明示的に組み込んだ理論的に原理化されたアルゴリズムとしてサンプリング・プロセスを定式化することである。
我々は,誘導信号をフローネットワークに内部化する蒸留目標を導出し,報奨モデルへの推論時間依存性を排除した。
論文 参考訳(メタデータ) (2026-02-04T08:59:57Z) - FALCON: Few-step Accurate Likelihoods for Continuous Flows [78.37361800856583]
本稿では,FALCON(Few-step Accurate Likelihoods for Continuous Flows)を提案する。
FALCONは分子ボルツマンサンプリングのための最先端の正規化フローモデルより優れており、同等の性能を持つCNFモデルよりも2桁高速である。
論文 参考訳(メタデータ) (2025-12-10T18:47:25Z) - Sequence Modeling with Spectral Mean Flows [18.38715347739777]
ニューラルネットワークを用いたシーケンスモデリングの鍵となる問題は、高非線形で確率的な状態ダイナミクスをどのように表現し、学習するかである。
隠れマルコフテンソル(HMM)の演算子理論的ビューに基づく新しいシーケンスモデリング手法を提案する。
生成過程は、列の空間における最大平均不一致(MMD)勾配フローとして定義される。
論文 参考訳(メタデータ) (2025-10-17T06:56:57Z) - Hierarchical Koopman Diffusion: Fast Generation with Interpretable Diffusion Trajectory [30.327899232038863]
textbfHierarchical Koopman Diffusionは、一段階のサンプリングと解釈可能な生成軌道の両方を達成する新しいフレームワークである。
我々のフレームワークは,拡散モデルにおける高速サンプリングと解釈可能性のギャップを埋め,生成モデルにおける説明可能な画像合成の道を開く。
論文 参考訳(メタデータ) (2025-10-14T07:17:35Z) - One-Step Offline Distillation of Diffusion-based Models via Koopman Modeling [26.913398550088477]
クープマン蒸留モデル(Koopman Distillation Model, KDM)は, クープマン理論に基づく新しいオフライン蒸留手法である。
KDMは、学習された線形作用素がそれらを前方に伝播する埋め込み空間にノイズのある入力を符号化し、続いてクリーンなサンプルを再構成するデコーダを符号化する。
KDMは標準のオフライン蒸留ベンチマークで高い競争力を発揮する。
論文 参考訳(メタデータ) (2025-05-19T16:59:47Z) - FlowDAS: A Stochastic Interpolant-based Framework for Data Assimilation [15.64941169350615]
データ同化(DA)は、PDEが支配するシステムの状態を推定するために、動的モデルと観測を統合する。
FlowDASは、間補体を使用して状態遷移ダイナミクスを学習する生成DAフレームワークである。
本研究では,FlowDASがモデル駆動法,ニューラル演算子,スコアベースベースラインを超える精度と物理的妥当性を示す。
論文 参考訳(メタデータ) (2025-01-13T05:03:41Z) - Local Flow Matching Generative Models [19.859984725284896]
局所フローマッチング(Local Flow Matching)は、フローベース生成モデルに基づく密度推定のための計算フレームワークである。
$textttLFM$はシミュレーション不要のスキームを採用し、フローマッチングサブモデルのシーケンスを漸進的に学習する。
FMと比較して, $textttLFM$ のトレーニング効率と競争的生成性能の改善を実証した。
論文 参考訳(メタデータ) (2024-10-03T14:53:10Z) - Latent Space Energy-based Neural ODEs [73.01344439786524]
本稿では,連続時間列を表現するために設計された新しい深部力学モデルを提案する。
マルコフ連鎖モンテカルロの最大推定値を用いてモデルを訓練する。
振動系, ビデオ, 実世界の状態系列(MuJoCo)の実験結果から, 学習可能なエネルギーベース先行モデルの方が既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2024-09-05T18:14:22Z) - Consistency Flow Matching: Defining Straight Flows with Velocity Consistency [97.28511135503176]
本稿では,速度場の自己整合性を明示する新しいFM法であるConsistency Flow Matching(Consistency-FM)を紹介する。
予備実験により、一貫性FMは、一貫性モデルよりも4.4倍速く収束することにより、トレーニング効率を著しく向上することが示された。
論文 参考訳(メタデータ) (2024-07-02T16:15:37Z) - Koopman-Based Surrogate Modelling of Turbulent Rayleigh-Bénard Convection [4.248022697109535]
我々は,LRAN(Linear Recurrent Autoencoder Network)と呼ばれるクープマンにインスパイアされたアーキテクチャを用いて,対流中の低次ダイナミクスを学習する。
従来の流体力学法であるKernel Dynamic Mode Decomposition (KDMD)を用いてLRANを比較する。
我々は,最も乱流条件下では,KDMDよりもLRANの方が正確な予測値を得た。
論文 参考訳(メタデータ) (2024-05-10T12:15:02Z) - Variational Flow Models: Flowing in Your Style [32.913511518425864]
我々は「線形」過程の確率フローを正定速度(SC)の流れに変換する。
この変換は、SCフローの新しいモデルを訓練することなく、Euler法による元の確率フローに沿って高速なサンプリングを容易にする。
高次数値解法を変換SC流に容易に組み込むことができ、サンプリング精度と効率をより高めることができる。
論文 参考訳(メタデータ) (2024-02-05T12:58:29Z) - Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z) - DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for
Accelerated Seq2Seq Diffusion Models [58.450152413700586]
ガウス空間に基づく離散突然変異を再構成する学習において拡散モデルを容易にする軟吸収状態を導入する。
我々は、サンプリングプロセスの高速化のために、連続空間内で最先端のODEソルバを用いている。
提案手法は, トレーニング収束率を4倍に向上させ, 類似品質のサンプルを800倍高速に生成する。
論文 参考訳(メタデータ) (2023-10-09T15:29:10Z) - A Geometric Perspective on Diffusion Models [57.27857591493788]
本稿では,人気のある分散拡散型SDEのODEに基づくサンプリングについて検討する。
我々は、最適なODEベースのサンプリングと古典的な平均シフト(モード探索)アルゴリズムの理論的関係を確立する。
論文 参考訳(メタデータ) (2023-05-31T15:33:16Z) - Restoration-Degradation Beyond Linear Diffusions: A Non-Asymptotic
Analysis For DDIM-Type Samplers [90.45898746733397]
本研究では拡散生成モデルに用いる決定論的サンプリング器の非漸近解析のためのフレームワークを開発する。
確率フローODEに沿った1ステップは,1) 条件付き対数線上を無限に先行して上昇する回復ステップ,2) 雑音を現在の勾配に向けて前向きに進行する劣化ステップの2段階で表すことができる。
論文 参考訳(メタデータ) (2023-03-06T18:59:19Z) - Improving and generalizing flow-based generative models with minibatch
optimal transport [90.01613198337833]
連続正規化フロー(CNF)のための一般条件流整合(CFM)技術を導入する。
CFMは、拡散モデルのフローをトレーニングするために使用されるような安定した回帰目標を特徴としているが、決定論的フローモデルの効率的な推論を好んでいる。
我々の目的の変種は最適輸送CFM (OT-CFM) であり、訓練がより安定し、より高速な推論をもたらすより単純なフローを生成する。
論文 参考訳(メタデータ) (2023-02-01T14:47:17Z) - Score-based Continuous-time Discrete Diffusion Models [102.65769839899315]
連続時間マルコフ連鎖を介して逆過程が認知されるマルコフジャンププロセスを導入することにより、拡散モデルを離散変数に拡張する。
条件境界分布の単純なマッチングにより、偏りのない推定器が得られることを示す。
提案手法の有効性を,合成および実世界の音楽と画像のベンチマークで示す。
論文 参考訳(メタデータ) (2022-11-30T05:33:29Z) - Manifold Interpolating Optimal-Transport Flows for Trajectory Inference [64.94020639760026]
最適輸送流(MIOFlow)を補間するマニフォールド補間法を提案する。
MIOFlowは、散発的なタイムポイントで撮影された静的スナップショットサンプルから、連続的な人口動態を学習する。
本手法は, 胚体分化および急性骨髄性白血病の治療から得られたscRNA-seqデータとともに, 分岐とマージによるシミュレーションデータについて検討した。
論文 参考訳(メタデータ) (2022-06-29T22:19:03Z) - Towards extraction of orthogonal and parsimonious non-linear modes from
turbulent flows [0.0]
本稿では,非線形モードの最小およびほぼ直交の集合を学習するための深い確率-神経-ネットワークアーキテクチャを提案する。
我々のアプローチは、$beta$-variational autoencoders($beta$-VAEs)と畳み込みニューラルネットワーク(CNNs)に基づいている。
論文 参考訳(メタデータ) (2021-09-03T13:38:51Z) - Deep Learning Enhanced Dynamic Mode Decomposition [0.0]
畳み込みオートエンコーダネットワークを用いて、観測対象の最適なファミリーを同時に見つける。
また,観測可能空間への流れの正確な埋め込みと,観測可能空間の流れ座標への浸漬も生成する。
このネットワークはフローのグローバルな変換をもたらし、EDMDとデコーダネットワークを介して将来の状態を予測する。
論文 参考訳(メタデータ) (2021-08-10T03:54:23Z) - Discrete Denoising Flows [87.44537620217673]
分類的確率変数に対する離散的フローベースモデル(DDF)を提案する。
他の離散フローベースモデルとは対照的に、我々のモデルは勾配バイアスを導入することなく局所的に訓練することができる。
そこで本研究では, DDFs が離散フローより優れていることを示し, 対数類似度で測定した2値MNIST と Cityscapes のセグメンテーションマップをモデル化した。
論文 参考訳(メタデータ) (2021-07-24T14:47:22Z) - Flow-based Spatio-Temporal Structured Prediction of Motion Dynamics [21.24885597341643]
条件付き流れ (CNF) は、高次元と相互相関を持つ複雑な分布を表現できるフレキシブルな生成モデルである。
本研究では,時間的入力特徴の出力を自己回帰的に正規化する新しい手法としてMotionFlowを提案する。
本稿では,予測,動き予測時系列予測,二分節分割などのタスクに本手法を適用した。
論文 参考訳(メタデータ) (2021-04-09T14:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。