論文の概要: Scale Space Diffusion
- arxiv url: http://arxiv.org/abs/2603.08709v1
- Date: Mon, 09 Mar 2026 17:59:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:16.708816
- Title: Scale Space Diffusion
- Title(参考訳): スケール空間拡散
- Authors: Soumik Mukhopadhyay, Prateksha Udhayanan, Abhinav Shrivastava,
- Abstract要約: スケール空間理論はローパスフィルタリングによって同様の階層構造を示す。
我々はこの接続を形式化し、ノイズの多い拡散状態が小さなサンプル画像以上の情報を含まないことを示す。
我々は,ネットワークの必要な部分のみを用いて,分解能保存と分解能向上を行うUNetバリアントであるFlexi-UNetを紹介した。
- 参考スコア(独自算出の注目度): 46.993305407761675
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Diffusion models degrade images through noise, and reversing this process reveals an information hierarchy across timesteps. Scale-space theory exhibits a similar hierarchy via low-pass filtering. We formalize this connection and show that highly noisy diffusion states contain no more information than small, downsampled images - raising the question of why they must be processed at full resolution. To address this, we fuse scale spaces into the diffusion process by formulating a family of diffusion models with generalized linear degradations and practical implementations. Using downsampling as the degradation yields our proposed Scale Space Diffusion. To support Scale Space Diffusion, we introduce Flexi-UNet, a UNet variant that performs resolution-preserving and resolution-increasing denoising using only the necessary parts of the network. We evaluate our framework on CelebA and ImageNet and analyze its scaling behavior across resolutions and network depths. Our project website ( https://prateksha.github.io/projects/scale-space-diffusion/ ) is available publicly.
- Abstract(参考訳): 拡散モデルはノイズによって画像を劣化させ、この過程を逆転させると、時間経過によって情報階層が明らかになる。
スケール空間理論はローパスフィルタリングによって同様の階層構造を示す。
この関係を形式化し、非常にノイズの多い拡散状態が小さなサンプル画像以上の情報を含まないことを示し、なぜそれらをフル解像度で処理しなければならないのかという疑問を提起する。
これを解決するために、一般化された線形分解と実践的な実装で拡散モデルの族を定式化することにより、スケール空間を拡散過程に融合する。
ダウンサンプリングを分解として使うと、提案したスケール空間拡散が得られる。
スケールスペース拡散をサポートするために,ネットワークの必要な部分のみを用いて,分解能保存と分解能向上を行うUNetバリアントであるFlexi-UNetを導入する。
我々は、CelebAとImageNetのフレームワークを評価し、そのスケール挙動を解像度とネットワーク深度で分析する。
プロジェクトのWebサイト(https://prateksha.github.io/projects/scale-space-diffusion/)が公開されています。
関連論文リスト
- PGP-DiffSR: Phase-Guided Progressive Pruning for Efficient Diffusion-based Image Super-Resolution [95.61422489193113]
拡散モデルから冗長情報を除去する軽量拡散法 PGP-DiffSR を開発した。
本手法は,計算負荷とメモリ消費を大幅に削減しつつ,競合する復元品質を実現する。
論文 参考訳(メタデータ) (2025-12-02T12:06:39Z) - Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models [82.8261101680427]
滑らかな潜伏空間は、入力潜伏空間上の摂動が出力画像の定常的な変化に対応することを保証している。
この特性は、画像の反転、反転、編集を含む下流タスクにおいて有益である。
スムース拡散(Smooth Diffusion, Smooth Diffusion)は, 高速かつスムーズな拡散モデルである。
論文 参考訳(メタデータ) (2023-12-07T16:26:23Z) - ElasticDiffusion: Training-free Arbitrary Size Image Generation through Global-Local Content Separation [15.057394130958583]
ElasticDiffusionは、事前訓練されたテキストと画像の拡散モデルが様々なサイズで画像を生成することができる、トレーニング不要のデコード手法である。
実験と定性的な結果から,マルチディフュージョンと安定ディフュージョンの標準デコード戦略と比較して,アスペクト比における画像コヒーレンス品質が優れていた。
論文 参考訳(メタデータ) (2023-11-30T18:58:17Z) - Diffusion Models Without Attention [110.5623058129782]
Diffusion State Space Model (DiffuSSM) は、よりスケーラブルな状態空間モデルバックボーンで注目メカニズムを置き換えるアーキテクチャである。
拡散訓練におけるFLOP効率の高いアーキテクチャへの注力は、大きな前進となる。
論文 参考訳(メタデータ) (2023-11-30T05:15:35Z) - Simple diffusion: End-to-end diffusion for high resolution images [27.47227724865238]
本稿では,高分解能画像の拡散を極力シンプルに保ちながら,デノナイズ拡散を改善することを目的とする。
4つの主な発見は,1)高分解能画像に対してノイズスケジュールを調整すること,2)アーキテクチャの特定の部分のみをスケールすること,3)アーキテクチャの特定の場所でドロップアウトを追加すること,4)高分解能特徴マップを避けるためのダウンサンプリングは効果的な戦略である。
論文 参考訳(メタデータ) (2023-01-26T13:35:02Z) - SDM: Spatial Diffusion Model for Large Hole Image Inpainting [106.90795513361498]
本稿では,空間拡散モデル(SDM)を提案する。
また,提案手法は非結合確率モデルと空間拡散スキームにより,高品質な大穴工法を実現する。
論文 参考訳(メタデータ) (2022-12-06T13:30:18Z) - Dimensionality-Varying Diffusion Process [52.52681373641533]
拡散モデルは、信号破壊プロセスを逆転して新しいデータを生成することを学習する。
信号分解による前方拡散過程の理論的一般化を行う。
FFHQで訓練された拡散モデルのFIDを,52.40から10.46までの1024Times1024$解像度で改善する。
論文 参考訳(メタデータ) (2022-11-29T09:05:55Z) - Subspace Diffusion Generative Models [4.310834990284412]
スコアベースモデルは、高次元拡散過程を通じて、ノイズをデータにマッピングすることでサンプルを生成する。
データ分布がノイズに向かって進化するにつれて、射影による部分空間への拡散を制限する。
私たちのフレームワークは継続的拡散と完全に互換性があり、柔軟性を維持しています。
論文 参考訳(メタデータ) (2022-05-03T13:43:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。