論文の概要: $\text{S}^{3}$Mamba: Arbitrary-Scale Super-Resolution via Scaleable State Space Model
- arxiv url: http://arxiv.org/abs/2411.11906v1
- Date: Sat, 16 Nov 2024 11:13:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-20 13:36:55.394995
- Title: $\text{S}^{3}$Mamba: Arbitrary-Scale Super-Resolution via Scaleable State Space Model
- Title(参考訳): $\text{S}^{3}$Mamba: スケール可能な状態空間モデルによる任意スケール超解法
- Authors: Peizhe Xia, Long Peng, Xin Di, Renjing Pei, Yang Wang, Yang Cao, Zheng-Jun Zha,
- Abstract要約: ASSRは、1つのモデルを用いて、任意のスケールで低解像度画像を高解像度画像に超解き放つことを目的としている。
拡張性のある連続表現空間を構築するために,$textS3$Mambaと呼ばれる新しい任意のスケール超解法を提案する。
- 参考スコア(独自算出の注目度): 45.65903826290642
- License:
- Abstract: Arbitrary scale super-resolution (ASSR) aims to super-resolve low-resolution images to high-resolution images at any scale using a single model, addressing the limitations of traditional super-resolution methods that are restricted to fixed-scale factors (e.g., $\times2$, $\times4$). The advent of Implicit Neural Representations (INR) has brought forth a plethora of novel methodologies for ASSR, which facilitate the reconstruction of original continuous signals by modeling a continuous representation space for coordinates and pixel values, thereby enabling arbitrary-scale super-resolution. Consequently, the primary objective of ASSR is to construct a continuous representation space derived from low-resolution inputs. However, existing methods, primarily based on CNNs and Transformers, face significant challenges such as high computational complexity and inadequate modeling of long-range dependencies, which hinder their effectiveness in real-world applications. To overcome these limitations, we propose a novel arbitrary-scale super-resolution method, called $\text{S}^{3}$Mamba, to construct a scalable continuous representation space. Specifically, we propose a Scalable State Space Model (SSSM) to modulate the state transition matrix and the sampling matrix of step size during the discretization process, achieving scalable and continuous representation modeling with linear computational complexity. Additionally, we propose a novel scale-aware self-attention mechanism to further enhance the network's ability to perceive global important features at different scales, thereby building the $\text{S}^{3}$Mamba to achieve superior arbitrary-scale super-resolution. Extensive experiments on both synthetic and real-world benchmarks demonstrate that our method achieves state-of-the-art performance and superior generalization capabilities at arbitrary super-resolution scales.
- Abstract(参考訳): 任意スケール超解像(ASSR)は、1つのモデルを用いて任意のスケールで高解像度画像に超解像を超解像することを目的としており、固定スケールの要素に制限される従来の超解像法(例えば$\times2$, $\times4$)の限界に対処する。
Inlicit Neural Representations (INR) の出現は、座標とピクセル値の連続表現空間をモデル化し、任意のスケールの超解像を実現することによって、元の連続信号の再構成を容易にするASSRの新しい方法論を多数生み出した。
したがって、ASSRの主な目的は、低分解能入力から導かれる連続表現空間を構築することである。
しかし、CNNやTransformerをベースとした既存の手法は、計算の複雑さや長距離依存の不十分なモデリングといった重大な課題に直面しており、現実のアプリケーションではその効果を妨げている。
これらの制限を克服するために、スケーラブルな連続表現空間を構築するために、$\text{S}^{3}$Mambaと呼ばれる新しい任意のスケール超解法を提案する。
具体的には、離散化過程における状態遷移行列とサンプリング行列を変調するスケーラブルな状態空間モデル(SSSM)を提案し、線形計算複雑性を伴うスケーラブルかつ連続的な表現モデルを実現する。
さらに,異なるスケールでグローバルな重要な特徴を知覚するネットワークの能力を一層高め,より優れた任意のスケールの超解像を実現するために$\text{S}^{3}$Mambaを構築するための,新たなスケール対応自己認識機構を提案する。
提案手法は, 任意の超解像スケールにおいて, 最先端性能と優れた一般化能力を達成することを実証した。
関連論文リスト
- Learning Dual-Level Deformable Implicit Representation for Real-World Scale Arbitrary Super-Resolution [81.74583887661794]
実世界の任意の超解像のトレーニングと評価のために,整数と非整数のスケーリング因子を併用した新しい実世界の超解像ベンチマークを構築した。
具体的には,実世界の劣化による画像レベルの変形と画素レベルの変形の両方を扱うために,外観埋め込みと変形場を設計する。
実世界の任意の超解像のためのRealArbiSRおよびRealSRベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-03-16T13:44:42Z) - Efficient Model Agnostic Approach for Implicit Neural Representation
Based Arbitrary-Scale Image Super-Resolution [5.704360536038803]
単一の画像超解像(SISR)は、主に深層畳み込みネットワークによって大きく進歩した。
従来のネットワークは、画像を一定のスケールにスケールアップすることに限定されており、任意のスケールのイメージを生成するために暗黙の神経機能を利用することになる。
我々は,任意のスケールで超解像を実現する,新しい,効率的なフレームワークであるMixture of Experts Implicit Super-Resolution(MoEISR)を導入する。
論文 参考訳(メタデータ) (2023-11-20T05:34:36Z) - Implicit Diffusion Models for Continuous Super-Resolution [65.45848137914592]
本稿では,高忠実度連続画像超解像のためのインプリシティ拡散モデル(IDM)を提案する。
IDMは暗黙のニューラル表現とデノナイジング拡散モデルを統合されたエンドツーエンドフレームワークに統合する。
スケーリング係数は分解能を調節し、最終出力におけるLR情報と生成された特徴の比率を変調する。
論文 参考訳(メタデータ) (2023-03-29T07:02:20Z) - A Simple Plugin for Transforming Images to Arbitrary Scales [47.36233857830832]
我々は、既存の超解像モデルに挿入できる汎用プラグインを開発し、Arbitrary Resolution Image Scalingに向けた能力を便利に増強する。
得られたモデルは、固定スケールファクタ上での本来の性能を維持できるだけでなく、目に見えないスケールに拡張可能であることを示し、標準ベンチマーク上で既存の任意のスケールの超解像モデルよりも大幅に優れていることを示す。
論文 参考訳(メタデータ) (2022-10-07T09:24:38Z) - Effective Invertible Arbitrary Image Rescaling [77.46732646918936]
Invertible Neural Networks (INN)は、ダウンスケーリングとアップスケーリングのサイクルを共同で最適化することにより、アップスケーリングの精度を大幅に向上させることができる。
本研究の1つのモデルのみをトレーニングすることにより、任意の画像再スケーリングを実現するために、単純で効果的な非可逆的再スケーリングネットワーク(IARN)を提案する。
LR出力の知覚品質を損なうことなく、双方向任意再スケーリングにおいて最先端(SOTA)性能を実現する。
論文 参考訳(メタデータ) (2022-09-26T22:22:30Z) - Scale-Aware Dynamic Network for Continuous-Scale Super-Resolution [16.67263192454279]
連続的スケールSRのためのSADN(Scale-Aware dynamic network)を提案する。
まず、複数のSRタスクを様々なスケールで特徴学習するためのSAD-Conv層を提案する。
第2に,マルチ双線形局所暗黙関数 (MBLIF) を付加した連続スケールアップサンプリングモジュール (CSUM) を考案した。
論文 参考訳(メタデータ) (2021-10-29T09:57:48Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。