論文の概要: Enhancing diffusion models with Gaussianization preprocessing
- arxiv url: http://arxiv.org/abs/2512.21020v1
- Date: Wed, 24 Dec 2025 07:34:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-25 19:43:21.71818
- Title: Enhancing diffusion models with Gaussianization preprocessing
- Title(参考訳): ガウス化前処理による拡散モデルの強化
- Authors: Li Cunzhi, Louis Kang, Hideaki Shimazaki,
- Abstract要約: 拡散モデル(英: Diffusion model)は、画像生成などのタスクにおいて顕著な成功を収めた生成モデルのクラスである。
これらのモデルのボトルネックの1つは、軌道分岐開始前の遅延によるサンプリングが遅いことである。
我々の主な目的は、トレーニングデータを前処理して再建品質を向上させることにより、分岐関連問題を緩和することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models are a class of generative models that have demonstrated remarkable success in tasks such as image generation. However, one of the bottlenecks of these models is slow sampling due to the delay before the onset of trajectory bifurcation, at which point substantial reconstruction begins. This issue degrades generation quality, especially in the early stages. Our primary objective is to mitigate bifurcation-related issues by preprocessing the training data to enhance reconstruction quality, particularly for small-scale network architectures. Specifically, we propose applying Gaussianization preprocessing to the training data to make the target distribution more closely resemble an independent Gaussian distribution, which serves as the initial density of the reconstruction process. This preprocessing step simplifies the model's task of learning the target distribution, thereby improving generation quality even in the early stages of reconstruction with small networks. The proposed method is, in principle, applicable to a broad range of generative tasks, enabling more stable and efficient sampling processes.
- Abstract(参考訳): 拡散モデル(英: Diffusion model)は、画像生成などのタスクにおいて顕著な成功を収めた生成モデルのクラスである。
しかし、これらのモデルのボトルネックの1つは、軌道分岐開始の遅延によるサンプリングが遅いことであり、その時点ではかなりの再構築が始まっている。
この問題は、特に初期段階において、世代品質を低下させる。
我々の主な目的は、特に小規模ネットワークアーキテクチャにおいて、再構成品質を向上させるためにトレーニングデータを前処理することで、分岐関連の問題を緩和することである。
具体的には、トレーニングデータにガウス化前処理を適用して、目標分布を再構成過程の初期密度となる独立ガウス分布により近いものにすることを提案する。
この前処理ステップは、ターゲット分布を学習するモデルのタスクを単純化し、小さなネットワークによる再構築の初期段階においても生成品質を向上させる。
提案手法は、原理的には幅広い生成タスクに適用可能であり、より安定かつ効率的なサンプリングプロセスを可能にする。
関連論文リスト
- Image Tokenizer Needs Post-Training [76.91832192778732]
本稿では,遅延空間構築と復号化に着目した新しいトークン化学習手法を提案する。
具体的には,トークン化の堅牢性を大幅に向上させる,プラグアンドプレイ型トークン化学習手法を提案する。
生成したトークンと再構成されたトークンの分布差を軽減するために、よく訓練された生成モデルに関するトークン化デコーダをさらに最適化する。
論文 参考訳(メタデータ) (2025-09-15T21:38:03Z) - LD-RPS: Zero-Shot Unified Image Restoration via Latent Diffusion Recurrent Posterior Sampling [38.700993166492495]
本稿では,事前学習した潜伏拡散モデルを用いた再帰サンプリングによるデータセットフリーで統一的な手法を提案する。
本手法では,マルチモーダル理解モデルを用いて,タスクブレンド条件下で生成モデルにセマンティックな事前情報を提供する。
論文 参考訳(メタデータ) (2025-07-01T14:25:09Z) - IRBridge: Solving Image Restoration Bridge with Pre-trained Generative Diffusion Models [43.84154970740943]
画像復元におけるブリッジモデルは、劣化画像からクリア画像への拡散過程を構築する。
既存の手法では、特定の種類の劣化に対して、スクラッチからブリッジモデルをトレーニングする必要があります。
IRBridgeフレームワークを導入し、画像復元ブリッジ内で生成モデルの直接利用を可能にする。
論文 参考訳(メタデータ) (2025-05-30T09:45:41Z) - Active Generation for Image Classification [45.93535669217115]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - JoReS-Diff: Joint Retinex and Semantic Priors in Diffusion Model for Low-light Image Enhancement [69.6035373784027]
低照度画像強調(LLIE)は条件付き拡散モデルを用いて有望な性能を実現している。
従来手法は、タスク固有の条件戦略の十分な定式化の重要性を無視するものであった。
本稿では,Retinex および semantic-based pre-processing condition を付加した新しいアプローチである JoReS-Diff を提案する。
論文 参考訳(メタデータ) (2023-12-20T08:05:57Z) - Class-Prototype Conditional Diffusion Model with Gradient Projection for Continual Learning [20.175586324567025]
破滅的な忘れ方を減らすことは、継続的な学習における重要なハードルである。
大きな問題は、生成したデータの品質がオリジナルのものと比べて低下することである。
本稿では,ジェネレータにおける画像品質を向上させる連続学習のためのGRに基づくアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-10T17:39:42Z) - Phasic Content Fusing Diffusion Model with Directional Distribution
Consistency for Few-Shot Model Adaption [73.98706049140098]
本稿では,方向分布の整合性を損なう少数ショット拡散モデルを用いた新しいファシックコンテンツを提案する。
具体的には、ファシックコンテンツ融合を用いたファシックトレーニング戦略を設計し、tが大きければ、モデルがコンテンツやスタイル情報を学ぶのに役立てる。
最後に、ドメイン適応時の構造整合性を高めるクロスドメイン構造ガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2023-09-07T14:14:11Z) - Steerable Conditional Diffusion for Out-of-Distribution Adaptation in Medical Image Reconstruction [75.91471250967703]
我々は、ステアブル条件拡散と呼ばれる新しいサンプリングフレームワークを導入する。
このフレームワークは、利用可能な測定によって提供される情報のみに基づいて、画像再構成と並行して拡散モデルを適用する。
様々な画像モダリティにまたがるアウト・オブ・ディストリビューション性能の大幅な向上を実現した。
論文 参考訳(メタデータ) (2023-08-28T08:47:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。