論文の概要: Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and
Restoration
- arxiv url: http://arxiv.org/abs/2209.11345v1
- Date: Thu, 22 Sep 2022 23:25:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 17:06:29.420979
- Title: Swin2SR: SwinV2 Transformer for Compressed Image Super-Resolution and
Restoration
- Title(参考訳): Swin2SR:圧縮画像超解像再生用SwingV2変換器
- Authors: Marcos V. Conde, Ui-Jin Choi, Maxime Burchi, Radu Timofte
- Abstract要約: 本稿では,画像超解像のためのSwinIRの改良を目的とした小説Swin Transformer V2について検討する。
JPEG圧縮アーティファクトの除去,画像超解像(古典的および軽量),圧縮画像超解像の3つの代表的な課題について実験を行った。
実験の結果,Swin2SRはSwinIRのトレーニング収束と性能を向上させることができることがわかった。
- 参考スコア(独自算出の注目度): 71.6879432974126
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Compression plays an important role on the efficient transmission and storage
of images and videos through band-limited systems such as streaming services,
virtual reality or videogames. However, compression unavoidably leads to
artifacts and the loss of the original information, which may severely degrade
the visual quality. For these reasons, quality enhancement of compressed images
has become a popular research topic. While most state-of-the-art image
restoration methods are based on convolutional neural networks, other
transformers-based methods such as SwinIR, show impressive performance on these
tasks.
In this paper, we explore the novel Swin Transformer V2, to improve SwinIR
for image super-resolution, and in particular, the compressed input scenario.
Using this method we can tackle the major issues in training transformer vision
models, such as training instability, resolution gaps between pre-training and
fine-tuning, and hunger on data. We conduct experiments on three representative
tasks: JPEG compression artifacts removal, image super-resolution (classical
and lightweight), and compressed image super-resolution. Experimental results
demonstrate that our method, Swin2SR, can improve the training convergence and
performance of SwinIR, and is a top-5 solution at the "AIM 2022 Challenge on
Super-Resolution of Compressed Image and Video".
- Abstract(参考訳): 圧縮は、ストリーミングサービス、バーチャルリアリティ、ビデオゲームなどの帯域限定システムを通じて、画像やビデオの効率的な伝送と保存において重要な役割を果たす。
しかし、圧縮は必然的にアーティファクトにつながり、元の情報が失われ、視覚品質が著しく低下する可能性がある。
これらの理由から,圧縮画像の品質向上が研究テーマとなっている。
ほとんどの最先端の画像復元手法は畳み込みニューラルネットワークに基づいているが、SwinIRのような他のトランスフォーマーベースの手法では、これらのタスクで素晴らしいパフォーマンスを示している。
本稿では,画像超解像におけるSwinIRの改良,特に圧縮入力シナリオについて,新しいSwin Transformer V2について検討する。
この手法を用いることで、トレーニング不安定性、事前トレーニングと微調整の解決ギャップ、データへの飢餓といった、トランスフォーマービジョンモデルのトレーニングに対処できる。
JPEG圧縮アーティファクトの除去,画像超解像(古典的および軽量),圧縮画像超解像の3つの代表的な課題について実験を行った。
実験の結果,Swin2SRはSwinIRのトレーニングコンバージェンスと性能を向上し,AIM 2022 Challenge on Super-Resolution of Compressed Image and Videoの上位5のソリューションであることがわかった。
関連論文リスト
- Transferable Learned Image Compression-Resistant Adversarial Perturbations [66.46470251521947]
敵対的攻撃は容易に画像分類システムを破壊し、DNNベースの認識タスクの脆弱性を明らかにする。
我々は、学習した画像圧縮機を前処理モジュールとして利用する画像分類モデルをターゲットにした新しいパイプラインを提案する。
論文 参考訳(メタデータ) (2024-01-06T03:03:28Z) - VCISR: Blind Single Image Super-Resolution with Video Compression
Synthetic Data [18.877077302923713]
本稿では,映像圧縮に基づく劣化モデルを用いて,ブラインドSISRタスクにおける低解像度画像データを合成する。
提案手法は既存の画像データセットに適用可能である。
SISR分解モデルにビデオ符号化アーティファクトを導入することで、ニューラルネットワークは、ビデオ圧縮劣化を復元する機能を備えた、画像の超解凍を可能にする。
論文 参考訳(メタデータ) (2023-11-02T05:24:19Z) - HST: Hierarchical Swin Transformer for Compressed Image Super-resolution [26.589370745694502]
低解像度圧縮画像を復元する階層型スウィントランス (HST) ネットワークを提案する。
我々のHSTは、低品質の圧縮画像超解像トラックにおけるAIM 2022の5位であり、PSNRは23.51dBである。
論文 参考訳(メタデータ) (2022-08-21T13:41:51Z) - Crowd Counting on Heavily Compressed Images with Curriculum Pre-Training [90.76576712433595]
ディープニューラルネットワークによって処理された画像に損失圧縮を適用することで、大幅な精度低下につながる可能性がある。
カリキュラム学習のパラダイムに着想を得て,圧縮画像の群集カウントのためのカリキュラム事前学習(CPT)と呼ばれる新しいトレーニング手法を提案する。
論文 参考訳(メタデータ) (2022-08-15T08:43:21Z) - Analysis of the Effect of Low-Overhead Lossy Image Compression on the
Performance of Visual Crowd Counting for Smart City Applications [78.55896581882595]
画像圧縮技術は画像の品質を低下させ、精度を低下させる。
本稿では,低オーバヘッド損失画像圧縮法の適用が視覚的群集カウントの精度に与える影響を解析する。
論文 参考訳(メタデータ) (2022-07-20T19:20:03Z) - SwinIQA: Learned Swin Distance for Compressed Image Quality Assessment [23.87848736166893]
我々は,スウィン距離空間における圧縮画像の知覚的品質を測定するために,フル参照画像品質評価尺度SwinIQAを設計する。
実験の結果,提案手法は従来のCLICデータセットの手法と学習に基づく手法と比較して,人間の知覚的判断との整合性が高いことがわかった。
論文 参考訳(メタデータ) (2022-05-09T13:31:27Z) - SwinIR: Image Restoration Using Swin Transformer [124.8794221439392]
本研究では,Swin Transformerに基づく画像復元のための強力なベースラインモデルSwinIRを提案する。
SwinIRは、浅い特徴抽出、深い特徴抽出、高品質の画像再構成の3つの部分で構成されている。
画像超解像、画像デノイング、JPEG圧縮アーティファクト削減の3つの代表的なタスクについて実験を行った。
論文 参考訳(メタデータ) (2021-08-23T15:55:32Z) - Enhanced Invertible Encoding for Learned Image Compression [40.21904131503064]
本稿では,改良されたインバーチブルを提案する。
非可逆ニューラルネットワーク(INN)によるネットワークは、情報損失問題を大幅に軽減し、圧縮性を向上する。
Kodak, CLIC, Tecnick のデータセットによる実験結果から,本手法は既存の学習画像圧縮法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2021-08-08T17:32:10Z) - Early Exit or Not: Resource-Efficient Blind Quality Enhancement for
Compressed Images [54.40852143927333]
ロスシー画像圧縮は、通信帯域を節約するために広範に行われ、望ましくない圧縮アーティファクトをもたらす。
圧縮画像に対する資源効率の高いブラインド品質向上手法(RBQE)を提案する。
提案手法は, 評価された画像の品質に応じて, 自動的にエンハンスメントを終了するか, 継続するかを決定することができる。
論文 参考訳(メタデータ) (2020-06-30T07:38:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。