論文の概要: Residual Prior Diffusion: A Probabilistic Framework Integrating Coarse Latent Priors with Diffusion Models
- arxiv url: http://arxiv.org/abs/2512.21593v1
- Date: Thu, 25 Dec 2025 09:19:10 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-29 11:53:06.405935
- Title: Residual Prior Diffusion: A Probabilistic Framework Integrating Coarse Latent Priors with Diffusion Models
- Title(参考訳): Residual Prior Diffusion: 粗遅延項と拡散モデルを統合する確率的フレームワーク
- Authors: Takuro Kutsuna,
- Abstract要約: Residual Prior Diffusion (RPD) は、粗い事前モデルをまずデータ分散の大規模構造をキャプチャする2段階のフレームワークである。
RPDは、分布の大規模構造を維持しながら、精密な詳細を正確にキャプチャする。
自然画像生成タスクにおいて、RDDは、代表拡散ベースラインと一致または一致した生成品質を達成した。
- 参考スコア(独自算出の注目度): 0.5753274939310764
- License:
- Abstract: Diffusion models have become a central tool in deep generative modeling, but standard formulations rely on a single network and a single diffusion schedule to transform a simple prior, typically a standard normal distribution, into the target data distribution. As a result, the model must simultaneously represent the global structure of the distribution and its fine-scale local variations, which becomes difficult when these scales are strongly mismatched. This issue arises both in natural images, where coarse manifold-level structure and fine textures coexist, and in low-dimensional distributions with highly concentrated local structure. To address this issue, we propose Residual Prior Diffusion (RPD), a two-stage framework in which a coarse prior model first captures the large-scale structure of the data distribution, and a diffusion model is then trained to represent the residual between the prior and the target data distribution. We formulate RPD as an explicit probabilistic model with a tractable evidence lower bound, whose optimization reduces to the familiar objectives of noise prediction or velocity prediction. We further introduce auxiliary variables that leverage information from the prior model and theoretically analyze how they reduce the difficulty of the prediction problem in RPD. Experiments on synthetic datasets with fine-grained local structure show that standard diffusion models fail to capture local details, whereas RPD accurately captures fine-scale detail while preserving the large-scale structure of the distribution. On natural image generation tasks, RPD achieved generation quality that matched or exceeded that of representative diffusion-based baselines and it maintained strong performance even with a small number of inference steps.
- Abstract(参考訳): 拡散モデルは、深層生成モデリングにおいて中心的なツールとなっているが、標準定式化は単一のネットワークと単一の拡散スケジュールに依存して、単純な先行分布(通常標準正規分布)をターゲットデータ分布に変換する。
結果として、モデルは分布のグローバルな構造とその微細な局所的変動を同時に表現しなければなりません。
この問題は、粗い多様体構造と細かいテクスチャが共存する自然像と、高濃度局所構造を持つ低次元分布の両方で生じる。
この問題を解決するために、まず粗い先行モデルがデータ分布の大規模構造をキャプチャし、次に拡散モデルをトレーニングして、先行データ分布と対象データ分布の間の残差を表す2段階のフレームワークであるResidual Prior Diffusion (RPD)を提案する。
我々は, RPD を, ゆがみのある証拠を低く抑えた明示的確率モデルとして定式化し, その最適化は騒音予測や速度予測のよく知られた目的に還元する。
さらに、先行モデルからの情報を活用する補助変数を導入し、RTDにおける予測問題の難しさをいかに軽減するか理論的に分析する。
局所構造がきめ細かい合成データセットの実験では、標準拡散モデルでは局所的な詳細を捉えることができず、RDDは分布の大規模構造を保ちながら精密に微細な詳細を捉える。
自然画像生成タスクにおいて, RPDは, 拡散ベースラインに一致するか, あるいは超えた生成品質を達成し, 少数の推論ステップを伴っても高い性能を維持した。
関連論文リスト
- DS-Diffusion: Data Style-Guided Diffusion Model for Time-Series Generation [3.7098771725459336]
時系列生成タスクのためのデータスタイル誘導拡散モデル(DS-Diffusion)を提案する。
DS-Diffusionは、条件付きガイダンスを導入するためにフレームワーク全体をトレーニングするのを避ける。
生成されたサンプルは、それらが発するデータスタイルを明確に示すことができる。
論文 参考訳(メタデータ) (2025-09-23T03:06:39Z) - Elucidated Rolling Diffusion Models for Probabilistic Weather Forecasting [52.6508222408558]
Eucidated Rolling Diffusion Models (ERDM)を紹介する。
ERDMはEucidated Diffusion Models (EDM) の原理的, 性能的設計とローリング予測構造を統一する最初のフレームワークである
2D Navier-StokesシミュレーションとERA5グローバル気象予報の1.5円解像度では、ERDMはキー拡散ベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2025-06-24T21:44:31Z) - Consistent World Models via Foresight Diffusion [56.45012929930605]
我々は、一貫した拡散に基づく世界モデルを学習する上で重要なボトルネックは、最適下予測能力にあると主張している。
本稿では,拡散に基づく世界モデリングフレームワークであるForesight Diffusion(ForeDiff)を提案する。
論文 参考訳(メタデータ) (2025-05-22T10:01:59Z) - PoGDiff: Product-of-Gaussians Diffusion Models for Imbalanced Text-to-Image Generation [13.07145194221385]
本稿では,この課題に対処するため,PoGDiffと呼ばれる汎用的な微調整手法を提案する。
実世界のデータセットを用いた実験により,拡散モデルにおける不均衡問題に効果的に対処できることが示されている。
論文 参考訳(メタデータ) (2025-02-12T04:07:14Z) - Constrained Diffusion Models via Dual Training [80.03953599062365]
拡散プロセスは、トレーニングデータセットのバイアスを反映したサンプルを生成する傾向がある。
所望の分布に基づいて拡散制約を付与し,制約付き拡散モデルを構築する。
本稿では,制約付き拡散モデルを用いて,目的と制約の最適なトレードオフを実現する混合データ分布から新しいデータを生成することを示す。
論文 参考訳(メタデータ) (2024-08-27T14:25:42Z) - Adapting to Unknown Low-Dimensional Structures in Score-Based Diffusion Models [6.76974373198208]
周囲の次元が$d$である場合、各デノイングステップ内で発生する誤差の依存性は、一般的には避けられない。
これはDDPMサンプリング器がターゲット分布の未知の低次元構造に適応できるという最初の理論実証である。
論文 参考訳(メタデータ) (2024-05-23T17:59:10Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - ManiFlow: Implicitly Representing Manifolds with Normalizing Flows [145.9820993054072]
正規化フロー(NF)は、複雑な実世界のデータ分布を正確にモデル化することが示されているフレキシブルな明示的な生成モデルである。
摂動分布から標本を与えられた多様体上の最も可能性の高い点を復元する最適化目的を提案する。
最後に、NFsの明示的な性質、すなわち、ログのような勾配とログのような勾配から抽出された表面正規化を利用する3次元点雲に焦点を当てる。
論文 参考訳(メタデータ) (2022-08-18T16:07:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。