論文の概要: Latent Stochastic Interpolants
- arxiv url: http://arxiv.org/abs/2506.02276v1
- Date: Mon, 02 Jun 2025 21:34:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.092434
- Title: Latent Stochastic Interpolants
- Title(参考訳): 潜在確率補間剤
- Authors: Saurabh Singh, Dmitry Lagun,
- Abstract要約: Evidence Interpolants (SI) は2つの確率分布間の柔軟変換が可能な生成モデリングのための強力なフレームワークである。
この研究は、エンドツーエンドの最適化モデルを用いた潜在空間でのジョイントラーニングを可能にする遅延補間(LSI)を提示する。
我々は、標準的な大規模画像ネット生成ベンチマークにおいて、包括的な実験を通してLSIの有効性を実証する。
- 参考スコア(独自算出の注目度): 4.674313947272508
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stochastic Interpolants (SI) are a powerful framework for generative modeling, capable of flexibly transforming between two probability distributions. However, their use in jointly optimized latent variable models remains unexplored as they require direct access to the samples from the two distributions. This work presents Latent Stochastic Interpolants (LSI) enabling joint learning in a latent space with end-to-end optimized encoder, decoder and latent SI models. We achieve this by developing a principled Evidence Lower Bound (ELBO) objective derived directly in continuous time. The joint optimization allows LSI to learn effective latent representations along with a generative process that transforms an arbitrary prior distribution into the encoder-defined aggregated posterior. LSI sidesteps the simple priors of the normal diffusion models and mitigates the computational demands of applying SI directly in high-dimensional observation spaces, while preserving the generative flexibility of the SI framework. We demonstrate the efficacy of LSI through comprehensive experiments on the standard large scale ImageNet generation benchmark.
- Abstract(参考訳): 確率補間(Stochastic Interpolants, SI)は、2つの確率分布間の柔軟変換が可能な生成モデリングのための強力なフレームワークである。
しかし、2つの分布からサンプルに直接アクセスする必要があるため、共同最適化された潜在変数モデルでのそれらの使用は未だ探索されていない。
本研究は、終端最適化エンコーダ、デコーダ、潜時SIモデルを用いて、潜時空間における共同学習を可能にする潜時確率補間器(LSI)を提案する。
連続的に導出する原理的エビデンス・ロウアー・バウンド(ELBO)の目標を導出することでこれを実現できる。
共同最適化により、LSIは任意の事前分布をエンコーダで定義された集約された後部へ変換する生成過程とともに有効な潜在表現を学習することができる。
LSIは通常の拡散モデルの単純な先行を踏襲し、SIフレームワークの生成柔軟性を保ちながら、高次元の観測空間に直接SIを適用する計算要求を緩和する。
我々は、標準的な大規模画像ネット生成ベンチマークにおいて、包括的な実験を通してLSIの有効性を実証する。
関連論文リスト
- Exploring Representation-Aligned Latent Space for Better Generation [86.45670422239317]
生成性能を改善するために,セマンティックな事前情報を統合するReaLSを導入する。
本研究では、ReaLSでトレーニングされたDETとSiTが、FID測定値の15%改善を実現することを示す。
拡張されたセマンティック潜在空間は、セグメンテーションや深さ推定のようなより知覚的な下流タスクを可能にする。
論文 参考訳(メタデータ) (2025-02-01T07:42:12Z) - Synthetic location trajectory generation using categorical diffusion
models [50.809683239937584]
拡散モデル(DPM)は急速に進化し、合成データのシミュレーションにおける主要な生成モデルの一つとなっている。
本稿では,個人が訪れた物理的位置を表す変数列である合成個別位置軌跡(ILT)の生成にDPMを用いることを提案する。
論文 参考訳(メタデータ) (2024-02-19T15:57:39Z) - Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。
我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。
我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文 参考訳(メタデータ) (2023-10-11T18:38:28Z) - A Complete Recipe for Diffusion Generative Models [18.891215475887314]
生成モデル(SGM)における前進過程の定式化のための完全なレシピを提案する。
補助変数に富んだ拡張空間内のスコアベースモデリングに依存する位相空間ランゲヴィン拡散(PSLD)を導入する。
論文 参考訳(メタデータ) (2023-03-03T07:20:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。