論文の概要: NoiseShift: Resolution-Aware Noise Recalibration for Better Low-Resolution Image Generation
- arxiv url: http://arxiv.org/abs/2510.02307v1
- Date: Thu, 02 Oct 2025 17:59:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.291143
- Title: NoiseShift: Resolution-Aware Noise Recalibration for Better Low-Resolution Image Generation
- Title(参考訳): ノイズシフト:低分解能画像生成のための分解能を考慮したノイズ補正
- Authors: Ruozhen He, Moayed Haji-Ali, Ziyan Yang, Vicente Ordonez,
- Abstract要約: ノイズスケジューラは解像度に不平等な効果がある。
ノイズシフトは、分解能サイズで条件付けられたデノイザーのノイズレベルを補正する。
LAION-COCOでは、SD3.5が15.89%、SD3が8.56%、Flux-Devが2.44%改善している。
- 参考スコア(独自算出の注目度): 16.655610485222997
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Text-to-image diffusion models trained on a fixed set of resolutions often fail to generalize, even when asked to generate images at lower resolutions than those seen during training. High-resolution text-to-image generators are currently unable to easily offer an out-of-the-box budget-efficient alternative to their users who might not need high-resolution images. We identify a key technical insight in diffusion models that when addressed can help tackle this limitation: Noise schedulers have unequal perceptual effects across resolutions. The same level of noise removes disproportionately more signal from lower-resolution images than from high-resolution images, leading to a train-test mismatch. We propose NoiseShift, a training-free method that recalibrates the noise level of the denoiser conditioned on resolution size. NoiseShift requires no changes to model architecture or sampling schedule and is compatible with existing models. When applied to Stable Diffusion 3, Stable Diffusion 3.5, and Flux-Dev, quality at low resolutions is significantly improved. On LAION-COCO, NoiseShift improves SD3.5 by 15.89%, SD3 by 8.56%, and Flux-Dev by 2.44% in FID on average. On CelebA, NoiseShift improves SD3.5 by 10.36%, SD3 by 5.19%, and Flux-Dev by 3.02% in FID on average. These results demonstrate the effectiveness of NoiseShift in mitigating resolution-dependent artifacts and enhancing the quality of low-resolution image generation.
- Abstract(参考訳): 固定解像度でトレーニングされたテキスト・ツー・イメージ拡散モデルは、トレーニング中に見られた画像よりも低い解像度で画像を生成するように要求されたとしても、一般化に失敗することが多い。
現在、高解像度のテキスト・ツー・イメージ・ジェネレータは、高解像度の画像を必要としないユーザに対して、アウト・オブ・ボックスの予算効率の代替手段を簡単に提供できない。
ノイズスケジューラはこの制限に対処する上で有効な拡散モデルに関する重要な技術的洞察を同定する。
同じレベルのノイズは、高解像度画像よりも低解像度画像からの信号が不均等に多く取り除かれ、列車のミスマッチに繋がる。
本研究では,分解能サイズで条件付きノイズレベルを補正する学習自由度手法であるNossShiftを提案する。
NoiseShiftでは、モデルアーキテクチャやサンプリングスケジュールの変更は必要とせず、既存のモデルと互換性がある。
安定拡散3, 安定拡散3.5, フラックスデフに適用すると, 低分解能で品質が著しく向上する。
LAION-COCOでは、SD3.5が15.89%、SD3が8.56%、Flux-Devが2.44%改善している。
CelebAでは、ノイズシフトはSD3.5を10.36%改善し、SD3を5.19%改善し、Flux-Devを平均3.02%改善した。
これらの結果は、分解能に依存したアーティファクトの緩和と低分解能画像生成の品質向上におけるノイズシフトの有効性を示す。
関連論文リスト
- ResShift: Efficient Diffusion Model for Image Super-resolution by
Residual Shifting [70.83632337581034]
拡散に基づく画像超解像法(SR)は主に低推論速度によって制限される。
本稿では,SRの拡散段数を大幅に削減する新しい,効率的な拡散モデルを提案する。
本手法は,残差をシフトすることで高分解能画像と低分解能画像の間を移動させるマルコフ連鎖を構成する。
論文 参考訳(メタデータ) (2023-07-23T15:10:02Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - On the Importance of Noise Scheduling for Diffusion Models [8.360383061862844]
拡散生成モデルにおけるノイズスケジューリング手法の効果について検討する。
この簡単なレシピは、ImageNet上の高解像度画像に対して、最先端のピクセルベースの拡散モデルを生成する。
論文 参考訳(メタデータ) (2023-01-26T07:37:22Z) - Rethinking Noise Synthesis and Modeling in Raw Denoising [75.55136662685341]
センサの実際の雑音を直接サンプリングすることで、ノイズを合成する新しい視点を導入する。
それは本質的に、異なるカメラセンサーに対して正確な生画像ノイズを発生させる。
論文 参考訳(メタデータ) (2021-10-10T10:45:24Z) - Noise Conditional Flow Model for Learning the Super-Resolution Space [8.130080378039601]
超解法におけるノイズ条件流モデルNCSRは、画像の視覚的品質と多様性を高める。
NCSRは,従来のGANモデルよりも,多様性と視覚的品質が向上し,視覚的品質が向上することを示す。
論文 参考訳(メタデータ) (2021-06-06T07:43:52Z) - Image Super-Resolution via Iterative Refinement [53.57766722279425]
SR3は再精製による超解像へのアプローチである。
確率的デノイジング拡散モデルを条件付き画像生成に適応させる。
様々な倍率係数の超分解能タスクに強い性能を示す。
論文 参考訳(メタデータ) (2021-04-15T17:50:42Z) - Designing a Practical Degradation Model for Deep Blind Image
Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。
本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文 参考訳(メタデータ) (2021-03-25T17:40:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。