論文の概要: Efficient and Training-Free Single-Image Diffusion Models
- arxiv url: http://arxiv.org/abs/2606.04299v1
- Date: Wed, 03 Jun 2026 00:05:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.433789
- Title: Efficient and Training-Free Single-Image Diffusion Models
- Title(参考訳): 効率・学習自由な単一画像拡散モデル
- Authors: Haojun Qiu, Kiriakos N. Kutulakos, David B. Lindell,
- Abstract要約: 内部構造が単一の参照画像と一致した画像を生成することの問題点を考察する。
我々は、パッチベースのデノイザを、効率的でトレーニング不要な画像拡散モデルに統合する。
提案手法は,訓練された単一画像拡散モデルと比較して,最先端の世代品質と多様性を実現する。
- 参考スコア(独自算出の注目度): 17.578119446864132
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the problem of generating images whose internal structure -- defined by the distribution of patches across multiple scales -- matches that of a single reference image. Recent approaches address this problem by training a diffusion model on a single image. But even in this setting, training is computationally expensive and requires hours of optimization. Instead, we model the image using a dataset of its patches at different scales. As this dataset is finite and the dimensionality of its patches is small, the score function for a noisy patch can be computed tractably using an optimal, closed-form denoiser, eliminating the need for neural network training. We integrate this patch-based denoiser into an efficient, training-free image diffusion model, and we describe how our method connects to classical patch-based image restoration techniques. Our approach achieves state-of-the-art generation quality and diversity compared to trained single-image diffusion models, and we demonstrate applications, including unconditional image generation, text-guided stylization, image symmetrization, and retargeting. Further, we show that our approach is compatible with latent space diffusion, and we show multiple additional acceleration techniques to achieve megapixel single-image generation in one second, and gigapixel generation in minutes.
- Abstract(参考訳): 複数のスケールにまたがるパッチの分布によって定義された内部構造が単一の参照画像と一致するような画像を生成するという問題を考える。
近年のアプローチでは、単一の画像上で拡散モデルをトレーニングすることでこの問題に対処している。
しかし、この設定でさえ、トレーニングは計算コストが高く、数時間の最適化が必要です。
代わりに、異なるスケールでパッチのデータセットを使用してイメージをモデル化する。
このデータセットは有限であり、パッチの寸法が小さいため、ノイズの多いパッチのスコア関数を最適でクローズドなデノイザを用いてトラクタブルに計算することができ、ニューラルネットワークのトレーニングの必要性を排除できる。
我々は、このパッチベースのデノイザを効率よくトレーニング不要な画像拡散モデルに統合し、我々の手法が古典的なパッチベースの画像復元技術とどのように結びつくかを述べる。
提案手法は,非条件画像生成,テキスト誘導型スタイリゼーション,画像対称性,再ターゲティングなどの応用例を示す。
さらに,本手法は遅延空間拡散と互換性があることを示し,1秒でメガピクセルの単一画像生成,数分でギガピクセルの生成を実現するために,さらに複数の加速技術を示す。
関連論文リスト
- Reusing Computation in Text-to-Image Diffusion for Efficient Generation of Image Sets [19.950913420708734]
本稿では,初期拡散段階における意味的類似性と共有性に基づいてクラスタが促進する学習自由アプローチを提案する。
提案手法は,既存のパイプラインとシームレスに統合し,プロンプトセットでスケールし,大規模テキスト・画像生成の環境・経済的負担を軽減する。
論文 参考訳(メタデータ) (2025-08-28T17:35:03Z) - Fast constrained sampling in pre-trained diffusion models [80.99262780028015]
任意の制約下で高速で高品質な生成を可能にするアルゴリズムを提案する。
我々の手法は、最先端のトレーニングフリー推論手法に匹敵するか、超越した結果をもたらす。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - Enhancing Consistency-Based Image Generation via Adversarialy-Trained Classification and Energy-Based Discrimination [13.238373528922194]
本稿では,一貫性に基づく画像の生成を後処理する新しい手法を提案し,その知覚的品質を向上させる。
本手法では,両部位を逆向きに訓練する共同分類器-識別器モデルを用いる。
このジョイントマシンの指導の下で、サンプル特異的な投影勾配を用いることで、合成画像を洗練し、ImageNet 64x64データセット上でFIDスコアを改良した。
論文 参考訳(メタデータ) (2024-05-25T14:53:52Z) - Meta Internal Learning [88.68276505511922]
単一画像生成のための内部学習は、単一の画像に基づいて新しい画像を生成するようにジェネレータを訓練するフレームワークである。
本稿では,サンプル画像の内部統計をより効果的にモデル化するために,画像集合のトレーニングを可能にするメタラーニング手法を提案する。
以上の結果から, 得られたモデルは, 多数の共通画像アプリケーションにおいて, シングルイメージのGANと同程度に適していることがわかった。
論文 参考訳(メタデータ) (2021-10-06T16:27:38Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Learning Deformable Image Registration from Optimization: Perspective,
Modules, Bilevel Training and Beyond [62.730497582218284]
マルチスケールの伝搬により微分同相モデルを最適化する,新しいディープラーニングベースのフレームワークを開発した。
我々は,脳MRIデータにおける画像-アトラス登録,肝CTデータにおける画像-画像登録を含む,3次元ボリュームデータセットにおける画像登録実験の2つのグループを実行する。
論文 参考訳(メタデータ) (2020-04-30T03:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。