論文の概要: What's Inside Your Diffusion Model? A Score-Based Riemannian Metric to Explore the Data Manifold
- arxiv url: http://arxiv.org/abs/2505.11128v2
- Date: Mon, 19 May 2025 09:31:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-20 12:45:56.19155
- Title: What's Inside Your Diffusion Model? A Score-Based Riemannian Metric to Explore the Data Manifold
- Title(参考訳): 拡散モデルの内部に何があるのか? データマニフォールドを探索するスコアベースのリーマン計量
- Authors: Simone Azeglio, Arianna Di Bernardo,
- Abstract要約: スコアに基づくリーマン計量を導入し、データ多様体の内在幾何学を特徴づける。
我々のアプローチは、測地学が自然に多様体の輪郭に従う幾何学を生成する。
我々のスコアに基づく測地学は、基礎となるデータ分布を尊重する有意義な垂直変換を捉えていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent advances in diffusion models have demonstrated their remarkable ability to capture complex image distributions, but the geometric properties of the learned data manifold remain poorly understood. We address this gap by introducing a score-based Riemannian metric that leverages the Stein score function from diffusion models to characterize the intrinsic geometry of the data manifold without requiring explicit parameterization. Our approach defines a metric tensor in the ambient space that stretches distances perpendicular to the manifold while preserving them along tangential directions, effectively creating a geometry where geodesics naturally follow the manifold's contours. We develop efficient algorithms for computing these geodesics and demonstrate their utility for both interpolation between data points and extrapolation beyond the observed data distribution. Through experiments on synthetic data with known geometry, Rotated MNIST, and complex natural images via Stable Diffusion, we show that our score-based geodesics capture meaningful transformations that respect the underlying data distribution. Our method consistently outperforms baseline approaches on perceptual metrics (LPIPS) and distribution-level metrics (FID, KID), producing smoother, more realistic image transitions. These results reveal the implicit geometric structure learned by diffusion models and provide a principled way to navigate the manifold of natural images through the lens of Riemannian geometry.
- Abstract(参考訳): 拡散モデルの最近の進歩は、複雑な画像分布をキャプチャする顕著な能力を示しているが、学習されたデータ多様体の幾何学的性質はいまだによく分かっていない。
このギャップは、拡散モデルからシュタインスコア関数を利用するスコアベースのリーマン計量を導入し、明示的なパラメータ化を必要とせず、データ多様体の内在幾何学を特徴づけることによって解決する。
我々のアプローチは、接方向に沿って保存しながら多様体に垂直な距離を伸ばす周囲空間における計量テンソルを定義し、測地線が多様体の輪郭を自然に追従する幾何学を効果的に形成する。
我々はこれらの測地線を計算するための効率的なアルゴリズムを開発し、観測されたデータ分布を超えてデータポイントと外挿の両方を補間するためのそれらの有用性を実証する。
既知幾何、回転MNIST、および安定拡散による複雑な自然画像による合成データの実験を通して、我々のスコアに基づく測地学は、基礎となるデータ分布を尊重する有意義な変換を捉えていることを示す。
提案手法は,知覚的メトリクス(LPIPS)と分布レベルメトリクス(FID,KID)のベースラインアプローチを一貫して上回り,よりスムーズでリアルな画像遷移を生成する。
これらの結果は拡散モデルによって学習された暗黙的な幾何学構造を明らかにし、リーマン幾何学のレンズを通して自然像の多様体をナビゲートする原理的な方法を提供する。
関連論文リスト
- Learning over von Mises-Fisher Distributions via a Wasserstein-like Geometry [0.0]
我々は、フォン・ミセス・フィッシャー(vMF)分布の族に対する幾何対応距離計量を導入する。
最適輸送の理論により、2つの vMF 分布間の相違を2つの解釈可能な成分に分解するワッサーシュタインのような距離を提案する。
論文 参考訳(メタデータ) (2025-04-19T03:38:15Z) - Score-based pullback Riemannian geometry [10.649159213723106]
本稿では,データ駆動型リーマン幾何学のフレームワークを提案する。
データサポートを通して高品質な測地学を作成し、データ多様体の固有次元を確実に推定する。
我々のフレームワークは、訓練中に等方性正規化を採用することで、自然に異方性正規化フローで使用することができる。
論文 参考訳(メタデータ) (2024-10-02T18:52:12Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - Scaling Riemannian Diffusion Models [68.52820280448991]
非自明な多様体上の高次元タスクにスケールできることを示す。
我々は、$SU(n)$格子上のQCD密度と高次元超球面上の対照的に学習された埋め込みをモデル化する。
論文 参考訳(メタデータ) (2023-10-30T21:27:53Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Shape And Structure Preserving Differential Privacy [70.08490462870144]
正方形距離関数の勾配がラプラス機構よりも感度をよりよく制御できることを示す。
また,2乗距離関数の勾配を用いることで,ラプラス機構よりも感度を制御できることを示す。
論文 参考訳(メタデータ) (2022-09-21T18:14:38Z) - Geometric Scattering on Measure Spaces [15.819230791757906]
測度空間上での幾何散乱の一般統一モデルを導入する。
未知多様体をランダムにサンプリングして得られる有限測度空間を考える。
本稿では, 関連するグラフ散乱変換が基礎多様体上の散乱変換を近似するデータ駆動グラフを構築するための2つの方法を提案する。
論文 参考訳(メタデータ) (2022-08-17T22:40:09Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - Uniform Interpolation Constrained Geodesic Learning on Data Manifold [28.509561636926414]
学習された測地線とともに、2つのデータサンプル間で高品質なデータを生成することができる。
提案手法の有効性を実証するために, モデルの理論解析を行い, 画像翻訳を例に挙げる。
論文 参考訳(メタデータ) (2020-02-12T07:47:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。