論文の概要: A Geometric Unification of Generative AI with Manifold-Probabilistic Projection Models
- arxiv url: http://arxiv.org/abs/2510.00666v1
- Date: Wed, 01 Oct 2025 08:50:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:20.475985
- Title: A Geometric Unification of Generative AI with Manifold-Probabilistic Projection Models
- Title(参考訳): マニフォールド確率射影モデルを用いた生成AIの幾何学的統一
- Authors: Leah Bar, Liron Mor Yosef, Shai Zucker, Neta Shoham, Inbar Seroussi, Nir Sochen,
- Abstract要約: いくつかの生成モデルでは、データの低次元の性質は、低次元の潜在空間の導入によって表される。
本研究では,幾何学的枠組みとカーネルに基づく確率的手法を同時に提供することにより,幾何学的・確率的視点を統一する。
我々は,LMPPM (Latent MPPM) が様々なデータセットにおいてLDM (Latent Diffusion Model) より優れていることを示す。
- 参考スコア(独自算出の注目度): 3.870354915766566
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The foundational premise of generative AI for images is the assumption that images are inherently low-dimensional objects embedded within a high-dimensional space. Additionally, it is often implicitly assumed that thematic image datasets form smooth or piecewise smooth manifolds. Common approaches overlook the geometric structure and focus solely on probabilistic methods, approximating the probability distribution through universal approximation techniques such as the kernel method. In some generative models, the low dimensional nature of the data manifest itself by the introduction of a lower dimensional latent space. Yet, the probability distribution in the latent or the manifold coordinate space is considered uninteresting and is predefined or considered uniform. This study unifies the geometric and probabilistic perspectives by providing a geometric framework and a kernel-based probabilistic method simultaneously. The resulting framework demystifies diffusion models by interpreting them as a projection mechanism onto the manifold of ``good images''. This interpretation leads to the construction of a new deterministic model, the Manifold-Probabilistic Projection Model (MPPM), which operates in both the representation (pixel) space and the latent space. We demonstrate that the Latent MPPM (LMPPM) outperforms the Latent Diffusion Model (LDM) across various datasets, achieving superior results in terms of image restoration and generation.
- Abstract(参考訳): 画像生成AIの基本前提は、画像が本質的に高次元空間に埋め込まれた低次元の物体であるという仮定である。
さらに、しばしば暗黙的に、主題的画像データセットが滑らかまたは断片的に滑らかな多様体を形成すると仮定される。
一般的なアプローチは幾何学的構造を見落とし、確率的手法にのみ焦点を合わせ、カーネル法のような普遍的な近似手法で確率分布を近似する。
いくつかの生成モデルでは、データの低次元の性質は、低次元の潜在空間の導入によって表される。
しかし、潜在あるいは多様体座標空間の確率分布は興味を持たず、事前定義または一様と見なされる。
本研究では,幾何学的枠組みとカーネルに基づく確率的手法を同時に提供することにより,幾何学的・確率的視点を統一する。
結果として生じるフレームワークは拡散モデルを ``良い画像'' の多様体への射影機構として解釈することでデミステレーションする。
この解釈は、表現(ピクセル)空間と潜在空間の両方で動作する新しい決定論的モデル、マニフォールド・確率射影モデル(MPPM)の構築につながる。
LMPPM(Latent MPPM)は,様々なデータセットにおいてLDM(Latent Diffusion Model)よりも優れ,画像の復元と生成において優れた結果が得られることを示す。
関連論文リスト
- Enabling Probabilistic Learning on Manifolds through Double Diffusion Maps [3.081704060720176]
本稿では,PLoM(Probabilistic Learning on Manifolds)アプローチの拡張に基づく確率的サンプリングのための生成学習フレームワークを提案する。
我々は、システム全体の動的複雑さを保ちながら、潜在空間で直接、全順序ISDEを解く。
論文 参考訳(メタデータ) (2025-06-02T20:58:49Z) - Geometric Neural Diffusion Processes [55.891428654434634]
拡散モデルの枠組みを拡張して、無限次元モデリングに一連の幾何学的先行を組み込む。
これらの条件で、生成関数モデルが同じ対称性を持つことを示す。
論文 参考訳(メタデータ) (2023-07-11T16:51:38Z) - Probabilistic and Semantic Descriptions of Image Manifolds and Their
Applications [28.554065677506966]
画像は高次元空間の低次元多様体上にあると言うのが一般的である。
画像は多様体上に不均一に分布し、この分布を確率分布としてモデル化する方法を考案する。
多様体上の点を記述するために意味論的解釈がどのように用いられるかを示す。
論文 参考訳(メタデータ) (2023-07-06T09:36:45Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - PSD Representations for Effective Probability Models [117.35298398434628]
最近提案された非負関数に対する正半定値(PSD)モデルがこの目的に特に適していることを示す。
我々はPSDモデルの近似と一般化能力の両方を特徴付け、それらが強い理論的保証を享受していることを示す。
本研究では,PSDモデルの密度推定,決定理論,推論への応用への道を開く。
論文 参考訳(メタデータ) (2021-06-30T15:13:39Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - Joint Estimation of Image Representations and their Lie Invariants [57.3768308075675]
画像は世界の状態とコンテンツの両方をエンコードする。
この情報の自動抽出は、画像表現に固有の高次元かつ絡み合った符号化のために困難である。
本稿では,これらの課題の解決を目的とした2つの理論的アプローチを紹介する。
論文 参考訳(メタデータ) (2020-12-05T00:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。