論文の概要: SwinIR: Image Restoration Using Swin Transformer
- arxiv url: http://arxiv.org/abs/2108.10257v1
- Date: Mon, 23 Aug 2021 15:55:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-24 15:29:56.296956
- Title: SwinIR: Image Restoration Using Swin Transformer
- Title(参考訳): SwinIR: Swin Transformer を用いた画像復元
- Authors: Jingyun Liang, Jiezhang Cao, Guolei Sun, Kai Zhang, Luc Van Gool, Radu
Timofte
- Abstract要約: 本研究では,Swin Transformerに基づく画像復元のための強力なベースラインモデルSwinIRを提案する。
SwinIRは、浅い特徴抽出、深い特徴抽出、高品質の画像再構成の3つの部分で構成されている。
画像超解像、画像デノイング、JPEG圧縮アーティファクト削減の3つの代表的なタスクについて実験を行った。
- 参考スコア(独自算出の注目度): 124.8794221439392
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Image restoration is a long-standing low-level vision problem that aims to
restore high-quality images from low-quality images (e.g., downscaled, noisy
and compressed images). While state-of-the-art image restoration methods are
based on convolutional neural networks, few attempts have been made with
Transformers which show impressive performance on high-level vision tasks. In
this paper, we propose a strong baseline model SwinIR for image restoration
based on the Swin Transformer. SwinIR consists of three parts: shallow feature
extraction, deep feature extraction and high-quality image reconstruction. In
particular, the deep feature extraction module is composed of several residual
Swin Transformer blocks (RSTB), each of which has several Swin Transformer
layers together with a residual connection. We conduct experiments on three
representative tasks: image super-resolution (including classical, lightweight
and real-world image super-resolution), image denoising (including grayscale
and color image denoising) and JPEG compression artifact reduction.
Experimental results demonstrate that SwinIR outperforms state-of-the-art
methods on different tasks by $\textbf{up to 0.14$\sim$0.45dB}$, while the
total number of parameters can be reduced by $\textbf{up to 67%}$.
- Abstract(参考訳): 画像復元は、低品質の画像(例えば、ダウンスケール、ノイズ、圧縮画像)から高品質な画像を復元することを目的とした、長年の低レベルビジョン問題である。
最先端の画像復元手法は畳み込みニューラルネットワークに基づいているが、高レベルの視覚タスクにおいて印象的なパフォーマンスを示すTransformerを使った試みはほとんどない。
本稿では,Swin Transformerに基づく画像復元のための強力なベースラインモデルSwinIRを提案する。
swinirは、浅い特徴抽出、深い特徴抽出、高品質の画像再構成の3つの部分からなる。
特に、深い特徴抽出モジュールはいくつかの残余Swin Transformerブロック(RSTB)で構成され、それぞれが残余接続とともに複数のSwin Transformer層を有する。
画像スーパーレゾリューション(古典的,軽量,実世界の画像スーパーレゾリューションを含む)、画像デノイジング(グレースケールとカラー画像デノイジングを含む)、jpeg圧縮アーティファクト削減の3つの代表的なタスクについて実験を行った。
実験の結果、SwinIRは異なるタスクにおける最先端のメソッドを$\textbf{up to 0.14$\sim$0.45dB}$で上回り、パラメータの総数は$\textbf{up to 67%}$で減少することを示した。
関連論文リスト
- Multi-Scale Representation Learning for Image Restoration with State-Space Model [13.622411683295686]
効率的な画像復元のためのマルチスケール状態空間モデル(MS-Mamba)を提案する。
提案手法は,計算複雑性を低く保ちながら,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2024-08-19T16:42:58Z) - Gated Multi-Resolution Transfer Network for Burst Restoration and
Enhancement [75.25451566988565]
低画質の原画像のバーストから空間的精度の高い高画質画像を再構成する新しいGated Multi-Resolution Transfer Network (GMTNet)を提案する。
5つのデータセットに関する詳細な実験分析は、我々のアプローチを検証し、バースト超解像、バーストデノイング、低照度バーストエンハンスメントのための最先端技術を設定する。
論文 参考訳(メタデータ) (2023-04-13T17:54:00Z) - Image Deblurring by Exploring In-depth Properties of Transformer [86.7039249037193]
我々は、事前訓練された視覚変換器(ViT)から抽出した深い特徴を活用し、定量的な測定値によって測定された性能を犠牲にすることなく、回復した画像のシャープ化を促進する。
得られた画像と対象画像の変換器特徴を比較することにより、事前学習された変換器は、高解像度のぼやけた意味情報を提供する。
特徴をベクトルとみなし、抽出された画像から抽出された表現とユークリッド空間における対象表現との差を計算する。
論文 参考訳(メタデータ) (2023-03-24T14:14:25Z) - Single Image Super-Resolution Using Lightweight Networks Based on Swin
Transformer [2.9649783577150837]
我々は、Swin Transformerに基づくMSwinSRとUGSwinSRという2つの軽量モデルを提案する。
MSwinSRは、最先端のSwinIRと比較してPSNRを$mathbf0.07dB$で増加させる。
パラメータの数は$mathbf30.68%$で、計算コストは$mathbf9.936%$で削減できる。
論文 参考訳(メタデータ) (2022-10-20T05:03:16Z) - Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and
Restoration [71.6879432974126]
本稿では,画像超解像のためのSwinIRの改良を目的とした小説Swin Transformer V2について検討する。
JPEG圧縮アーティファクトの除去,画像超解像(古典的および軽量),圧縮画像超解像の3つの代表的な課題について実験を行った。
実験の結果,Swin2SRはSwinIRのトレーニング収束と性能を向上させることができることがわかった。
論文 参考訳(メタデータ) (2022-09-22T23:25:08Z) - HST: Hierarchical Swin Transformer for Compressed Image Super-resolution [26.589370745694502]
低解像度圧縮画像を復元する階層型スウィントランス (HST) ネットワークを提案する。
我々のHSTは、低品質の圧縮画像超解像トラックにおけるAIM 2022の5位であり、PSNRは23.51dBである。
論文 参考訳(メタデータ) (2022-08-21T13:41:51Z) - Restormer: Efficient Transformer for High-Resolution Image Restoration [118.9617735769827]
畳み込みニューラルネットワーク(CNN)は、大規模データから一般化可能な画像の事前学習をうまく行う。
トランスフォーマーは、自然言語とハイレベルな視覚タスクにおいて、顕著なパフォーマンス向上を示している。
我々のモデルであるRecovery Transformer (Restormer) は、いくつかの画像復元タスクにおいて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-11-18T18:59:10Z) - Exploiting Deep Generative Prior for Versatile Image Restoration and
Manipulation [181.08127307338654]
本研究は, 大規模自然画像に基づいて学習したGAN(Generative Adversarial Network)により, 得られた画像の有効利用方法を示す。
深層生成前駆体(DGP)は、色、パッチ、解像度、様々な劣化した画像の欠落したセマンティクスを復元するための説得力のある結果を提供する。
論文 参考訳(メタデータ) (2020-03-30T17:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。