論文の概要: Taming Sampling Perturbations with Variance Expansion Loss for Latent Diffusion Models
- arxiv url: http://arxiv.org/abs/2603.21085v1
- Date: Sun, 22 Mar 2026 06:56:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.230882
- Title: Taming Sampling Perturbations with Variance Expansion Loss for Latent Diffusion Models
- Title(参考訳): 潜時拡散モデルにおける分散損失を考慮したサンプリング摂動のモデル化
- Authors: Qifan Li, Xingyu Zhou, Jinhua Zhang, Weiyi You, Shuhang Gu,
- Abstract要約: 遅延拡散モデルが高忠実かつ効率的な画像生成の主流のフレームワークとして登場した。
摂動をサンプリングする堅牢性は、生成品質を決定する上で重要な役割を担っていることを示す。
本研究では,強い再構成を維持しつつ,摂動をサンプリングする潜在空間を堅牢に構築する手法を提案する。
- 参考スコア(独自算出の注目度): 22.168463445392856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Latent diffusion models have emerged as the dominant framework for high-fidelity and efficient image generation, owing to their ability to learn diffusion processes in compact latent spaces. However, while previous research has focused primarily on reconstruction accuracy and semantic alignment of the latent space, we observe that another critical factor, robustness to sampling perturbations, also plays a crucial role in determining generation quality. Through empirical and theoretical analyses, we show that the commonly used $β$-VAE-based tokenizers in latent diffusion models, tend to produce overly compact latent manifolds that are highly sensitive to stochastic perturbations during diffusion sampling, leading to visual degradation. To address this issue, we propose a simple yet effective solution that constructs a latent space robust to sampling perturbations while maintaining strong reconstruction fidelity. This is achieved by introducing a Variance Expansion loss that counteracts variance collapse and leverages the adversarial interplay between reconstruction and variance expansion to achieve an adaptive balance that preserves reconstruction accuracy while improving robustness to stochastic sampling. Extensive experiments demonstrate that our approach consistently enhances generation quality across different latent diffusion architectures, confirming that robustness in latent space is a key missing ingredient for stable and faithful diffusion sampling.
- Abstract(参考訳): 遅延拡散モデルは、コンパクトな潜在空間における拡散過程を学習する能力のため、高忠実で効率的な画像生成の主流のフレームワークとして現れてきた。
しかし、従来の研究では、主に潜伏空間の復元精度と意味的アライメントに焦点が当てられていたが、別の重要な要因である摂動サンプリングの堅牢性は、生成品質を決定する上でも重要な役割を担っている。
実験的および理論的解析により、潜伏拡散モデルにおいて一般的に用いられる$β$-VAEベースのトークン化器は、拡散サンプリング中に確率的摂動に非常に敏感な超コンパクトな潜伏多様体を生成する傾向にあり、視覚的劣化をもたらすことを示した。
この問題に対処するために,頑健な再構成忠実性を維持しつつ,摂動をサンプリングする頑健な空間を構築する,単純で効果的なソリューションを提案する。
これは、分散崩壊を防止し、再構成と分散膨張の対角的相互作用を活用して、確率的サンプリングに対する堅牢性を改善しつつ、再構成精度を保った適応バランスを実現することで達成される。
広汎な実験により,本手法は様々な潜伏拡散アーキテクチャにおける生成品質を一貫して向上させ,安定かつ忠実な拡散サンプリングにおいて,潜伏空間におけるロバスト性が欠落する重要な要素であることを確認した。
関連論文リスト
- On Stability and Robustness of Diffusion Posterior Sampling for Bayesian Inverse Problems [42.76879947185353]
拡散に基づく解法は、生成過程を導くために、BIPにおける観測が想定される可能性に依存する。
このギャップを後部近似誤差を特徴付けることにより橋渡しし,拡散型解法のエンハンスタビリティを実証する。
本稿では, 既存の勾配型後方サンプリング装置と互換性があり, イントロバスト拡散後サンプリング法を提案する。
論文 参考訳(メタデータ) (2026-02-02T12:47:15Z) - Robust Posterior Diffusion-based Sampling via Adaptive Guidance Scale [39.27744518020771]
逆プロブレム定式化のための拡散過程を導出する適応的確率ステップサイズ戦略を提案する。
結果として得られたアプローチであるAdaptive Posterior diffusion Smpling (AdaPS)は、ハイパーフリーであり、多様な画像タスクにおける再構成品質を改善する。
論文 参考訳(メタデータ) (2025-11-23T14:37:59Z) - Boosting Fidelity for Pre-Trained-Diffusion-Based Low-Light Image Enhancement via Condition Refinement [63.54516423266521]
事前学習拡散ベース(PTDB)法は、しばしばコンテンツ忠実さを犠牲にして知覚的リアリズムを高める。
本稿では,事前学習した拡散モデルにおける条件付けのための新しい最適化手法を提案する。
我々のアプローチはプラグアンドプレイであり、より効率的な制御を提供するために既存の拡散ネットワークにシームレスに統合される。
論文 参考訳(メタデータ) (2025-10-20T02:40:06Z) - Provable Maximum Entropy Manifold Exploration via Diffusion Models [58.89696361871563]
探索は科学的な発見のような現実世界の意思決定問題を解決するために重要である。
本稿では,事前学習した拡散モデルにより暗黙的に定義された近似データ多様体に対して,探索をエントロピーとしてキャストする新しいフレームワークを提案する。
本研究では,事前学習した拡散モデルの逐次微調整として探索問題を解くミラー降下に基づくアルゴリズムを開発する。
論文 参考訳(メタデータ) (2025-06-18T11:59:15Z) - A Study of Posterior Stability for Time-Series Latent Diffusion [59.41969496514184]
まず,後部崩壊により可変オートエンコーダ(VAE)への潜伏拡散が減少し,表現性が低下することを示す。
次に、入力変数に対するリカレントデコーダの感度を定量化する、依存性測度という原則的手法を導入する。
理論的および実証的研究に基づいて,潜伏拡散を延長し,後部が安定な新しい枠組みを導入する。
論文 参考訳(メタデータ) (2024-05-22T21:54:12Z) - Digging into contrastive learning for robust depth estimation with diffusion models [55.62276027922499]
そこで我々はD4RDと呼ばれる新しい頑健な深度推定法を提案する。
複雑な環境での性能劣化を軽減するために、拡散モデルに適した独自のコントラスト学習モードを備えている。
実験では、D4RDは合成汚職データセットや現実世界の気象条件に関する最先端のソリューションを超越している。
論文 参考訳(メタデータ) (2024-04-15T14:29:47Z) - Adapt and Diffuse: Sample-adaptive Reconstruction via Latent Diffusion Models [24.5360032541275]
逆問題は、ノイズや(非線形でない)観測からクリーンな信号を回復することが目的である複数のアプリケーションで発生する。
我々のキーとなる観察は、既存の逆問題解決器のほとんどは、再構成作業の難易度に計算力を適応させる能力が欠如していることである。
オートエンコーダの潜時空間における劣化信号の劣化度を推定するために,$textitseverity encoding$という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-09-12T23:41:29Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z) - Spontaneous Symmetry Breaking in Generative Diffusion Models [6.4322891559626125]
生成拡散モデルは近年,高次元データ生成の先導的アプローチとして浮上している。
これらのモデルの力学は、生成力学を2つの異なる位相に分割する自発的対称性の破れを示す。
本稿では,より高性能でバイアスの少ない高速サンプリングを実現する可能性を持つ拡散モデルの生成力学を理解するための新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-31T09:36:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。