論文の概要: ICM-SR: Image-Conditioned Manifold Regularization for Image Super-Resoultion
- arxiv url: http://arxiv.org/abs/2511.22048v1
- Date: Thu, 27 Nov 2025 03:06:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.369299
- Title: ICM-SR: Image-Conditioned Manifold Regularization for Image Super-Resoultion
- Title(参考訳): ICM-SR:画像超解像のための画像合成マニフォールド正規化
- Authors: Junoh Kang, Donghun Ryu, Bohyung Han,
- Abstract要約: 実世界の超解像(Real-ISR)は、しばしばテキストから画像への拡散モデルの強力な生成先を生かしている。
既存の方法はしばしば正規化多様体の重要性を見落とし、通常はテキスト条件多様体にデフォルトとなる。
本稿では, スパースかつ本質的な構造情報に基づいて条件付き多様体への出力を正規化する画像条件付き多様体正規化(ICM)を提案する。
- 参考スコア(独自算出の注目度): 39.19685799384519
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Real world image super-resolution (Real-ISR) often leverages the powerful generative priors of text-to-image diffusion models by regularizing the output to lie on their learned manifold. However, existing methods often overlook the importance of the regularizing manifold, typically defaulting to a text-conditioned manifold. This approach suffers from two key limitations. Conceptually, it is misaligned with the Real-ISR task, which is to generate high quality (HQ) images directly tied to the low quality (LQ) images. Practically, the teacher model often reconstructs images with color distortions and blurred edges, indicating a flawed generative prior for this task. To correct these flaws and ensure conceptual alignment, a more suitable manifold must incorporate information from the images. While the most straightforward approach is to condition directly on the raw input images, their high information densities make the regularization process numerically unstable. To resolve this, we propose image-conditioned manifold regularization (ICM), a method that regularizes the output towards a manifold conditioned on the sparse yet essential structural information: a combination of colormap and Canny edges. ICM provides a task-aligned and stable regularization signal, thereby avoiding the instability of dense-conditioning and enhancing the final super-resolution quality. Our experiments confirm that the proposed regularization significantly enhances super-resolution performance, particularly in perceptual quality, demonstrating its effectiveness for real-world applications. We will release the source code of our work for reproducibility.
- Abstract(参考訳): 実世界画像超解像(Real-ISR)は、しばしば、学習多様体上の出力を正規化することにより、テキストと画像の拡散モデルの強力な生成先を活用できる。
しかし、既存の方法はしばしば正規化多様体の重要性を見落とし、通常はテキスト条件多様体にデフォルトとなる。
このアプローチには2つの重要な制限がある。
概念的には、低品質(LQ)画像に直結した高品質(HQ)画像を生成するReal-ISRタスクと不一致である。
実際、教師モデルは、色歪みとぼやけた縁でイメージを再構成することが多く、このタスクに先立って、生成に欠陥があることが示される。
これらの欠陥を修正し、概念的アライメントを確保するためには、より適切な多様体は画像からの情報を組み込まなければならない。
最も簡単なアプローチは、生の入力画像に直接条件を付けることであるが、その高い情報密度は、正規化過程を数値的に不安定にする。
これを解決するために、カラーマップとキャニーエッジの組み合わせである、スパースで重要な構造情報に基づいて条件付き多様体への出力を正規化する画像条件付き多様体正規化(ICM)を提案する。
ICMはタスク整列かつ安定な正規化信号を提供するため、密閉条件の不安定性を回避し、最終的な超解像品質を向上させる。
本実験により,提案手法は,特に知覚品質の超解像性能を著しく向上させ,実世界の応用に有効であることが確認された。
私たちは再現性のために作業のソースコードをリリースします。
関連論文リスト
- Feature Alignment with Equivariant Convolutions for Burst Image Super-Resolution [52.55429225242423]
本稿では,同変畳み込みに基づくアライメントを特徴とするBurst Image Super-Resolution (BISR) のための新しいフレームワークを提案する。
これにより、アライメント変換は画像領域の明示的な監督を通じて学習でき、特徴領域に容易に適用できる。
BISRベンチマークの実験は、定量的メトリクスと視覚的品質の両方において、我々のアプローチの優れた性能を示している。
論文 参考訳(メタデータ) (2025-03-11T11:13:10Z) - LoLiSRFlow: Joint Single Image Low-light Enhancement and
Super-resolution via Cross-scale Transformer-based Conditional Flow [8.929704596997913]
ローライト強化(LLE)とスーパーレゾリューション(SR)に固有の劣化機構を検討するため,LoLiSRFLowと呼ばれる正規化フローネットワークを提案する。
LoLiSRFLowは、高解像度で露呈された画像に対する様々な実現可能な解に対する条件付き確率分布を学習する。
また,7100個の低分解能暗黒/高分解能のシャープペアを含むDFSR-LLEという,現実的な低分解能劣化をモデル化した合成データセットを提案する。
論文 参考訳(メタデータ) (2024-02-29T05:40:43Z) - CoSeR: Bridging Image and Language for Cognitive Super-Resolution [74.24752388179992]
本稿では,低解像度画像の理解能力を備えたSRモデルを実現するCoSeR(Cognitive Super-Resolution)フレームワークを提案する。
画像の外観と言語理解を組み合わせることで、認知的な埋め込みを生成する。
画像の忠実度をさらに向上させるため、「オール・イン・アテンション」と呼ばれる新しい条件注入方式を提案する。
論文 参考訳(メタデータ) (2023-11-27T16:33:29Z) - A Unified Conditional Framework for Diffusion-based Image Restoration [39.418415473235235]
画像復元のための拡散モデルに基づく統一条件付きフレームワークを提案する。
我々は、軽量なUNetを利用して初期ガイダンスと拡散モデルを予測し、指導の残余を学習する。
そこで本研究では,高解像度画像を扱うために,単純なステップ間パッチ分割方式を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:22:24Z) - Perceptual Image Restoration with High-Quality Priori and Degradation
Learning [28.93489249639681]
本モデルは,復元画像と劣化画像の類似度を測定するのに有効であることを示す。
同時修復・拡張フレームワークは,実世界の複雑な分解型によく一般化する。
論文 参考訳(メタデータ) (2021-03-04T13:19:50Z) - Frequency Consistent Adaptation for Real World Super Resolution [64.91914552787668]
実シーンにスーパーリゾリューション(SR)法を適用する際に周波数領域の整合性を保証する新しい周波数一貫性適応(FCA)を提案する。
監視されていない画像から劣化カーネルを推定し、対応するLow-Resolution (LR)画像を生成する。
ドメイン一貫性のあるLR-HRペアに基づいて、容易に実装可能な畳み込みニューラルネットワーク(CNN)SRモデルを訓練する。
論文 参考訳(メタデータ) (2020-12-18T08:25:39Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。