論文の概要: Image Interpolation with Score-based Riemannian Metrics of Diffusion Models
- arxiv url: http://arxiv.org/abs/2504.20288v1
- Date: Mon, 28 Apr 2025 22:04:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.683469
- Title: Image Interpolation with Score-based Riemannian Metrics of Diffusion Models
- Title(参考訳): 拡散モデルのスコアベースリーマン計量による画像補間
- Authors: Shinnosuke Saito, Takashi Matsubara,
- Abstract要約: 本稿では,事前学習した拡散モデルのデータ空間をリーマン多様体として扱う新しい枠組みを提案する。
MNISTとStable Diffusionの実験により、この幾何学的なアプローチは、既存の方法よりも現実的でノイズが少なく、プロンプトに忠実な画像を生み出すことが示されている。
- 参考スコア(独自算出の注目度): 9.514940899499752
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models excel in content generation by implicitly learning the data manifold, yet they lack a practical method to leverage this manifold - unlike other deep generative models equipped with latent spaces. This paper introduces a novel framework that treats the data space of pre-trained diffusion models as a Riemannian manifold, with a metric derived from the score function. Experiments with MNIST and Stable Diffusion show that this geometry-aware approach yields image interpolations that are more realistic, less noisy, and more faithful to prompts than existing methods, demonstrating its potential for improved content generation and editing.
- Abstract(参考訳): 拡散モデルは、データ多様体を暗黙的に学習することで、コンテンツ生成において優れているが、この多様体を利用する実践的な方法が欠如している。
本稿では、事前学習された拡散モデルのデータ空間をリーマン多様体として扱う新しい枠組みを、スコア関数から導出した計量を用いて紹介する。
MNISTとStable Diffusionの実験により、この幾何学的なアプローチは、既存の方法よりも現実的でノイズが少なく、プロンプトに忠実な画像補間をもたらし、コンテンツ生成と編集の改善の可能性を示している。
関連論文リスト
- Continuous Diffusion Model for Language Modeling [57.396578974401734]
離散データに対する既存の連続拡散モデルは、離散的アプローチと比較して性能が限られている。
本稿では,下層の分類分布の幾何学を組み込んだ言語モデリングのための連続拡散モデルを提案する。
論文 参考訳(メタデータ) (2025-02-17T08:54:29Z) - Diffusion Models Learn Low-Dimensional Distributions via Subspace Clustering [15.326641037243006]
拡散モデルは画像分布を効果的に学習し、新しいサンプルを生成する。
我々は、この現象に関する理論的な洞察を、重要な経験的観測を利用して提供する。
基礎となる分布を学習するのに必要となるサンプルの最小数は、本質的な次元と線形にスケールすることを示す。
論文 参考訳(メタデータ) (2024-09-04T04:14:02Z) - Scaling Riemannian Diffusion Models [68.52820280448991]
非自明な多様体上の高次元タスクにスケールできることを示す。
我々は、$SU(n)$格子上のQCD密度と高次元超球面上の対照的に学習された埋め込みをモデル化する。
論文 参考訳(メタデータ) (2023-10-30T21:27:53Z) - Generative Modeling on Manifolds Through Mixture of Riemannian Diffusion Processes [57.396578974401734]
一般多様体上に生成拡散過程を構築するための原理的枠組みを導入する。
従来の拡散モデルの認知的アプローチに従う代わりに、橋梁プロセスの混合を用いて拡散過程を構築する。
混合過程を幾何学的に理解し,データ点への接する方向の重み付け平均としてドリフトを導出する。
論文 参考訳(メタデータ) (2023-10-11T06:04:40Z) - Mirror Diffusion Models for Constrained and Watermarked Generation [41.27274841596343]
ミラー拡散モデル(MDM)は、トラクタビリティを損なうことなく凸制約セット上のデータを生成する新しい拡散モデルである。
安全とプライバシーのために、我々は、生成したデータに目に見えないが定量的な情報を埋め込む新しいメカニズムとして制約セットを探求する。
私たちの研究は、複雑なドメイン上での抽出可能な拡散を学習する新しいアルゴリズムの機会をもたらします。
論文 参考訳(メタデータ) (2023-10-02T14:26:31Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Riemannian Diffusion Models [11.306081315276089]
拡散モデルは画像生成と推定のための最新の最先端手法である。
本研究では、連続時間拡散モデルを任意のリーマン多様体に一般化する。
提案手法は,全てのベンチマークにおいて新しい最先端の可能性を実現する。
論文 参考訳(メタデータ) (2022-08-16T21:18:31Z) - Riemannian Diffusion Schr\"odinger Bridge [56.20669989459281]
拡散モデルのサンプリングを高速化するために,emphRiemannian Diffusion Schr"odinger Bridgeを導入する。
提案手法は, 合成データと実際の地球・気候データについて検証する。
論文 参考訳(メタデータ) (2022-07-07T00:35:04Z) - Riemannian Score-Based Generative Modeling [56.20669989459281]
経験的性能を示すスコアベース生成モデル(SGM)を紹介する。
現在のSGMは、そのデータが平坦な幾何学を持つユークリッド多様体上で支えられているという前提を定めている。
これにより、ロボット工学、地球科学、タンパク質モデリングの応用にこれらのモデルを使用することができない。
論文 参考訳(メタデータ) (2022-02-06T11:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。