論文の概要: OmniScaleSR: Unleashing Scale-Controlled Diffusion Prior for Faithful and Realistic Arbitrary-Scale Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2512.04699v1
- Date: Thu, 04 Dec 2025 11:50:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:46.142962
- Title: OmniScaleSR: Unleashing Scale-Controlled Diffusion Prior for Faithful and Realistic Arbitrary-Scale Image Super-Resolution
- Title(参考訳): OmniScaleSR: 忠実でリアルな任意スケールの超解像に先立つスケール制御拡散
- Authors: Xinning Chai, Zhengxue Cheng, Yuhong Zhang, Hengsheng Zhang, Yingsheng Qin, Yucai Yang, Rong Xie, Li Song,
- Abstract要約: 任意スケール超解像(ASSR)は、固定スケール(例:4x)でのみ動作する従来の超解像法(SR)の限界を克服する
近年の拡散型現実画像超解像(Real-ISR)モデルでは, 強力な事前学習による拡散の先行処理を生かし, 4x設定で印象的な結果を示した。
OmniScaleSRは,高忠実度と高現実性の両方を実現するために設計された,拡散に基づくリアルな任意のスケールのSRフレームワークである。
- 参考スコア(独自算出の注目度): 25.29121925794166
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Arbitrary-scale super-resolution (ASSR) overcomes the limitation of traditional super-resolution (SR) methods that operate only at fixed scales (e.g., 4x), enabling a single model to handle arbitrary magnification. Most existing ASSR approaches rely on implicit neural representation (INR), but its regression-driven feature extraction and aggregation intrinsically limit the ability to synthesize fine details, leading to low realism. Recent diffusion-based realistic image super-resolution (Real-ISR) models leverage powerful pre-trained diffusion priors and show impressive results at the 4x setting. We observe that they can also achieve ASSR because the diffusion prior implicitly adapts to scale by encouraging high-realism generation. However, without explicit scale control, the diffusion process cannot be properly adjusted for different magnification levels, resulting in excessive hallucination or blurry outputs, especially under ultra-high scales. To address these issues, we propose OmniScaleSR, a diffusion-based realistic arbitrary-scale SR framework designed to achieve both high fidelity and high realism. We introduce explicit, diffusion-native scale control mechanisms that work synergistically with implicit scale adaptation, enabling scale-aware and content-aware modulation of the diffusion process. In addition, we incorporate multi-domain fidelity enhancement designs to further improve reconstruction accuracy. Extensive experiments on bicubic degradation benchmarks and real-world datasets show that OmniScaleSR surpasses state-of-the-art methods in both fidelity and perceptual realism, with particularly strong performance at large magnification factors. Code will be released at https://github.com/chaixinning/OmniScaleSR.
- Abstract(参考訳): 任意スケール超解像(ASSR)は、固定スケール(例えば4x)でのみ動作する従来の超解像法(SR)の制限を克服し、任意の倍率を扱うことができる。
多くの既存のASSRアプローチは暗黙の神経表現(INR)に依存しているが、その回帰駆動的特徴抽出と集約は本質的に細部を合成する能力を制限し、低リアリズムをもたらす。
近年の拡散型現実画像超解像(Real-ISR)モデルでは, 強力な事前学習による拡散の先行処理を生かし, 4x設定で印象的な結果を示した。
拡散が暗黙的にスケールに適応するので,ASSRも実現可能である。
しかし、明示的なスケール制御がなければ、拡散過程は異なる倍率レベルに対して適切に調整できないため、特に超高スケールでは、過剰な幻覚やぼやけた出力が生じる。
これらの問題に対処するために,高忠実度と高現実性の両方を実現するために,拡散に基づくリアルな任意のスケールのSRフレームワークであるOmniScaleSRを提案する。
我々は,暗黙のスケール適応と相乗的に機能し,拡散過程のスケールアウェアとコンテンツアウェアの調整を可能にする,明示的,拡散ネイティブなスケール制御機構を導入する。
さらに,複数領域の忠実度向上設計を取り入れて,再構築精度をさらに向上する。
バイキュビック劣化ベンチマークと実世界のデータセットの大規模な実験により、OmniScaleSRは忠実さと知覚的リアリズムの両方において最先端の手法を超越しており、特に大きな倍率係数での強いパフォーマンスを示している。
コードはhttps://github.com/chaixinning/OmniScaleSR.comでリリースされる。
関連論文リスト
- Your Super Resolution Model is not Enough for Tackling Real-World Scenarios [2.101267270902429]
本稿では,任意の規模のSRを動作させる機能を備えた,最新の固定スケールSRモデルに適合する,SAAM (Scale-Aware Attention Module) を提案する。
SAAMは軽量でスケール適応的な特徴抽出とアップサンプリングを採用し、効率的なガイダンスと勾配分散損失にSimpleパラメータフリーアテンションモジュール(SimAM)を組み込んでいる。
提案手法は,複数の最先端SRバックボーンにシームレスに統合され,幅広い整数および非整数スケール因子の競合や優れた性能を実現する。
論文 参考訳(メタデータ) (2025-09-08T07:13:58Z) - Chain-of-Zoom: Extreme Super-Resolution via Scale Autoregression and Preference Alignment [51.99765487172328]
CoZ(Chain-of-zoom)は、SISRをマルチスケール対応プロンプトを備えた中間スケールステートの連鎖に分解するフレームワークである。
視覚的手がかりは高倍率で減少するため、視覚言語モデル(VLM)によって生成されたマルチスケール対応テキストプロンプトで各ズームステップを拡大する。
実験により、CoZでラップされた標準4x拡散SRモデルが256倍拡大し、高い知覚品質と忠実度が得られることが示された。
論文 参考訳(メタデータ) (2025-05-24T08:50:08Z) - $\text{S}^{3}$Mamba: Arbitrary-Scale Super-Resolution via Scaleable State Space Model [45.65903826290642]
ASSRは、1つのモデルを用いて、任意のスケールで低解像度画像を高解像度画像に超解き放つことを目的としている。
拡張性のある連続表現空間を構築するために,$textS3$Mambaと呼ばれる新しい任意のスケール超解法を提案する。
論文 参考訳(メタデータ) (2024-11-16T11:13:02Z) - Latent Diffusion, Implicit Amplification: Efficient Continuous-Scale Super-Resolution for Remote Sensing Images [7.920423405957888]
E$2$DiffSRは、最先端のSR手法と比較して、客観的な指標と視覚的品質を達成する。
拡散に基づくSR法の推論時間を非拡散法と同程度のレベルに短縮する。
論文 参考訳(メタデータ) (2024-10-30T09:14:13Z) - Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。
本稿では,階層型統合拡散モデル(HI-Diff)を提案する。
人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文 参考訳(メタデータ) (2023-05-22T12:18:20Z) - Implicit Diffusion Models for Continuous Super-Resolution [65.45848137914592]
本稿では,高忠実度連続画像超解像のためのインプリシティ拡散モデル(IDM)を提案する。
IDMは暗黙のニューラル表現とデノナイジング拡散モデルを統合されたエンドツーエンドフレームワークに統合する。
スケーリング係数は分解能を調節し、最終出力におけるLR情報と生成された特徴の比率を変調する。
論文 参考訳(メタデータ) (2023-03-29T07:02:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。