論文の概要: APT: Improving Diffusion Models for High Resolution Image Generation with Adaptive Path Tracing
- arxiv url: http://arxiv.org/abs/2507.21690v1
- Date: Tue, 29 Jul 2025 11:13:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.055535
- Title: APT: Improving Diffusion Models for High Resolution Image Generation with Adaptive Path Tracing
- Title(参考訳): APT:適応経路追跡による高分解能画像生成のための拡散モデルの改善
- Authors: Sangmin Han, Jinho Jeong, Jinwoo Kim, Seon Joo Kim,
- Abstract要約: 遅延拡散モデル(LDM)は一般的に固定解像度で訓練され、高解像度画像へのスケーリングの能力を制限する。
本稿では,アダプティブパストレース(APT)を提案する。これは,パッチ分布の一貫性を維持するために,統計的マッチングを組み合わせたフレームワークである。
その結果、APTは高解像度画像においてより鮮明で洗練された細部を生成する。
- 参考スコア(独自算出の注目度): 24.33819371470651
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Latent Diffusion Models (LDMs) are generally trained at fixed resolutions, limiting their capability when scaling up to high-resolution images. While training-based approaches address this limitation by training on high-resolution datasets, they require large amounts of data and considerable computational resources, making them less practical. Consequently, training-free methods, particularly patch-based approaches, have become a popular alternative. These methods divide an image into patches and fuse the denoising paths of each patch, showing strong performance on high-resolution generation. However, we observe two critical issues for patch-based approaches, which we call ``patch-level distribution shift" and ``increased patch monotonicity." To address these issues, we propose Adaptive Path Tracing (APT), a framework that combines Statistical Matching to ensure patch distributions remain consistent in upsampled latents and Scale-aware Scheduling to deal with the patch monotonicity. As a result, APT produces clearer and more refined details in high-resolution images. In addition, APT enables a shortcut denoising process, resulting in faster sampling with minimal quality degradation. Our experimental results confirm that APT produces more detailed outputs with improved inference speed, providing a practical approach to high-resolution image generation.
- Abstract(参考訳): 遅延拡散モデル(LDM)は一般的に固定解像度で訓練され、高解像度画像までスケールアップする際の能力を制限する。
トレーニングベースのアプローチは、高解像度データセットのトレーニングによるこの制限に対処するが、大量のデータと相当量の計算リソースを必要とするため、実用的ではない。
結果として、トレーニングフリーなメソッド、特にパッチベースのアプローチが一般的な代替手段となっている。
これらの手法は、画像をパッチに分割し、各パッチのデノイングパスを融合させ、高分解能生成において強い性能を示す。
しかし、パッチベースのアプローチでは「パッチレベルの分散シフト」と「パッチの単調性の向上」という2つの重要な問題を観察する。
これらの問題に対処するため,アダプティブパストラシング (APT) を提案する。このフレームワークは,アダプティブパストラシング (APT) とアダプティブパストラシング (APT) を併用し,アダプティブパストラシング (APT) とアダプティブパストラシング (APT) を併用し,パッチのモノトニック性に対処する。
その結果、APTは高解像度画像においてより鮮明で洗練された細部を生成する。
さらに、APTはショートカットデノナイジングプロセスを可能にし、最小品質の劣化を伴ってより高速なサンプリングを実現する。
実験により、APTは推論速度を向上し、より詳細な出力を生成することが確認され、高解像度画像生成への実用的なアプローチを提供する。
関連論文リスト
- Diffusion Models for Solving Inverse Problems via Posterior Sampling with Piecewise Guidance [52.705112811734566]
断片的なガイダンススキームを用いて,逆問題を解決するための新しい拡散型フレームワークが導入された。
提案手法は問題に依存しず,様々な逆問題に容易に適応できる。
このフレームワークは, (4時間), (8時間) の超分解能タスクに対して, (23%), (24%) および (24%) の無作為マスクを塗布する場合の (25%) の推論時間を短縮する。
論文 参考訳(メタデータ) (2025-07-22T19:35:14Z) - Progressive Alignment Degradation Learning for Pansharpening [3.7939736380306552]
深層学習に基づくパンシャーピングにより,高分解能マルチスペクトル画像(HRMS)を効果的に生成できることが示されている。
Waldプロトコルは、人工低解像度データで訓練されたネットワークが、高解像度データでも同じように機能すると仮定する。
本稿では,PAlignNetとPDegradeNetという2つのサブネットワーク間の相互イテレーションを用いて,正確な劣化過程を適応的に学習するPADMを提案する。
論文 参考訳(メタデータ) (2025-06-25T07:07:32Z) - One Look is Enough: A Novel Seamless Patchwise Refinement for Zero-Shot Monocular Depth Estimation Models on High-Resolution Images [25.48185527420231]
我々は、効率的で一般化可能なタイルベースのフレームワークであるPatch Refine Once (PRO)を提案する。
提案手法は, (i) 深度不連続性問題を緩和しつつ, テスト時間効率を向上させるグループパッチ整合性トレーニングという2つの重要な要素から構成される。
Bias Free Maskingは、DEモデルがデータセット固有のバイアスに過度に適合することを防ぐ。
論文 参考訳(メタデータ) (2025-03-28T11:46:50Z) - One-Step Diffusion Model for Image Motion-Deblurring [85.76149042561507]
本稿では,脱臭過程を1段階に短縮する新しいフレームワークである脱臭拡散モデル(OSDD)を提案する。
拡散モデルにおける忠実度損失に対処するために,構造復元を改善する改良された変分オートエンコーダ(eVAE)を導入する。
提案手法は,実測値と非参照値の両方で高い性能を達成する。
論文 参考訳(メタデータ) (2025-03-09T09:39:57Z) - FAM Diffusion: Frequency and Attention Modulation for High-Resolution Image Generation with Stable Diffusion [63.609399000712905]
スケールした解像度での推論は反復的なパターンと構造的歪みをもたらす。
これらの問題を解決するために組み合わせた2つの単純なモジュールを提案する。
我々の手法はファム拡散と呼ばれ、任意の潜在拡散モデルにシームレスに統合でき、追加の訓練を必要としない。
論文 参考訳(メタデータ) (2024-11-27T17:51:44Z) - Degradation-Guided One-Step Image Super-Resolution with Diffusion Priors [75.24313405671433]
拡散に基づく画像超解像法 (SR) は、事前訓練された大規模なテキスト・画像拡散モデルを先行として活用することにより、顕著な成功を収めた。
本稿では,拡散型SR手法の効率問題に対処する新しい一段階SRモデルを提案する。
既存の微調整戦略とは異なり、SR専用の劣化誘導低ランク適応 (LoRA) モジュールを設計した。
論文 参考訳(メタデータ) (2024-09-25T16:15:21Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - PatchScaler: An Efficient Patch-Independent Diffusion Model for Image Super-Resolution [44.345740602726345]
PatchScalerは、単一画像超解像のための効率的なパッチ非依存拡散パイプラインである。
テクスチャは、共通参照テクスチャメモリから、ターゲットパッチのテクスチャ先行を適応的に検索する。
本コードでは,定量評価と定性評価の両方において優れた性能を示し,推論を著しく高速化する。
論文 参考訳(メタデータ) (2024-05-27T13:31:46Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。