論文の概要: Decoupled Residual Denoising Diffusion Models for Unified and Data Efficient Image-to-Image Translation
- arxiv url: http://arxiv.org/abs/2606.01048v1
- Date: Sun, 31 May 2026 06:38:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.171825
- Title: Decoupled Residual Denoising Diffusion Models for Unified and Data Efficient Image-to-Image Translation
- Title(参考訳): 画像から画像への一元的・データ的変換のための残差分分解拡散モデル
- Authors: Ziyue Lin, Jiahe Hou, Hongyu Xia, Xinrui Xie, Feifei Wang, Yuyin Zhou, Wei Wang, Jiawei Liu, Liangqiong Qu,
- Abstract要約: 本稿では,統合的かつデータ効率のよいイメージ・ツー・イメージ(I2I)翻訳のためのDDD(Decoupled Residual Denoising Diffusion Model)を提案する。
- 参考スコア(独自算出の注目度): 29.96691004865241
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Decoupled Residual Denoising Diffusion models (DRDD) for unified and data-efficient image-to-image (I2I) translation. While diffusion models have advanced I2I translation in terms of quality and diversity, we uncover a previously under-explored property in diffusion models. Crucially, beyond its conventional role of manifold lifting (i.e., moving data off low-dimensional manifolds), injecting Gaussian noise facilitates domain harmonization by implicitly aligning feature distributions across domains, a property particularly advantageous for unified I2I translation. However, existing diffusion models prematurely erode this harmonization effect, as noise and residuals are simultaneously removed in a single coupled diffusion process. To address this, DRDD decouples the diffusion process into two sequential and independent diffusion stages: (1) a stochastic noise diffusion for domain harmonization and manifold lifting, and (2) a deterministic residual diffusion that learns the core semantic mapping entirely within the fixed-noise domain. This decoupling preserves harmonization and manifold lifting effects throughout the transformation, substantially simplifying the learning of unified mappings across diverse tasks and domains. Notably, the noise diffusion stage is trained exclusively on abundant, unpaired target-domain images, greatly improving data efficiency. Comprehensive theoretical and empirical analysis demonstrates that DRDD is broadly compatible with mainstream diffusion models and consistently delivers robust, unified I2I translation, even under limited paired data. Our code is available at https://github.com/HKU-HealthAI/DRDD.
- Abstract(参考訳): 本稿では,統合的かつデータ効率のよいイメージ・ツー・イメージ(I2I)翻訳のためのDDD(Decoupled Residual Denoising Diffusion Model)を提案する。
拡散モデルでは、品質と多様性の観点からI2I翻訳が進んだが、拡散モデルでは以前に未探索な性質が発見された。
重要なことに、多様体リフト(すなわち低次元多様体からデータを移動させる)という従来の役割を超えて、ガウスノイズを注入することで、ドメイン間の特徴分布を暗黙的に整列させることにより、ドメイン調和化が促進される。
しかし、単一結合拡散過程において、ノイズと残差が同時に除去されるため、既存の拡散モデルは、この調和効果を早期に消去する。
DRDDは拡散過程を,(1)領域調和化と多様体リフトのための確率的ノイズ拡散,(2)コアセマンティックマッピングを完全に固定ノイズ領域内で学習する決定論的残留拡散の2段階に分解する。
この疎結合は変換全体を通して調和性と多様体リフト効果を保ち、様々なタスクや領域にわたる統一写像の学習を大幅に単純化する。
特に、ノイズ拡散ステージは、豊富な未ペアのターゲットドメイン画像にのみ訓練され、データ効率が大幅に向上する。
包括的理論的および経験的分析により、DRDDは主流の拡散モデルと広く互換性があり、限定されたペアデータの下でも、一貫して堅牢で統一されたI2I翻訳を提供することを示した。
私たちのコードはhttps://github.com/HKU-HealthAI/DRDD.comで公開されています。
関連論文リスト
- Coevolutionary Continuous Discrete Diffusion: Make Your Diffusion Language Model a Latent Reasoner [66.86440230599656]
拡散言語モデルは必ずしも離散空間にある必要はないと主張する。
特に、連続拡散モデルが離散拡散やループ変換器よりも強い表現性を持つことを示す。
本稿では,連続表現空間と離散トークン空間の結合に関する共同多モード拡散過程を定義する共進化連続拡散法(CCDD)を提案する。
論文 参考訳(メタデータ) (2025-10-03T17:44:41Z) - Dig2DIG: Dig into Diffusion Information Gains for Image Fusion [46.504772732456196]
本稿では拡散情報ゲイン(DIG)を導入し,各モードの情報貢献度を異なる段階で定量化する。
本手法は,融合品質と推論効率の両方の観点から,既存の拡散に基づくアプローチよりも優れている。
論文 参考訳(メタデータ) (2025-03-24T12:43:11Z) - Soft Mixture Denoising: Beyond the Expressive Bottleneck of Diffusion
Models [76.46246743508651]
我々は,現在の拡散モデルが後方認知において表現力のあるボトルネックを持っていることを示した。
本稿では,後方復調のための表現的かつ効率的なモデルであるソフトミキシング・デノナイジング(SMD)を導入する。
論文 参考訳(メタデータ) (2023-09-25T12:03:32Z) - Unifying Diffusion Models' Latent Space, with Applications to
CycleDiffusion and Guidance [95.12230117950232]
関係領域で独立に訓練された2つの拡散モデルから共通潜時空間が現れることを示す。
テキスト・画像拡散モデルにCycleDiffusionを適用することで、大規模なテキスト・画像拡散モデルがゼロショット画像・画像拡散エディタとして使用できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:53:52Z) - Diffusion-GAN: Training GANs with Diffusion [135.24433011977874]
GAN(Generative Adversarial Network)は、安定してトレーニングすることが難しい。
フォワード拡散チェーンを利用してインスタンスノイズを生成する新しいGANフレームワークであるDiffusion-GANを提案する。
我々は,Diffusion-GANにより,最先端のGANよりも高い安定性とデータ効率で,よりリアルな画像を生成することができることを示す。
論文 参考訳(メタデータ) (2022-06-05T20:45:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。