論文の概要: Resolution Enhancement Processing on Low Quality Images Using Swin
Transformer Based on Interval Dense Connection Strategy
- arxiv url: http://arxiv.org/abs/2303.09190v2
- Date: Sat, 13 May 2023 06:54:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 22:58:05.883275
- Title: Resolution Enhancement Processing on Low Quality Images Using Swin
Transformer Based on Interval Dense Connection Strategy
- Title(参考訳): 間隔密結合戦略に基づくスウィントランスを用いた低画質画像の解像度向上処理
- Authors: Rui-Yang Ju, Chih-Chia Chen, Jen-Shiun Chiang, Yu-Shian Lin, Wei-Han
Chen, Chun-Tse Chien
- Abstract要約: Transformer-based method has demonstrated great performance for image super- resolution in the method based on the convolutional neural network (CNNs)
この研究は、新しく設計されたアルゴリズムに従って異なるブロックを接続するインターバルDense Connection Strategyを提案する。
本研究は、リアルタイムアプリケーションにおいて、低画質画像上でオブジェクト検出とリアルタイム画像の超解像を行うために、You Only Look Once(YOLOv8)モデルの最後のバージョンと提案モデルを適用した。
- 参考スコア(独自算出の注目度): 1.5705307898493193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Transformer-based method has demonstrated remarkable performance for
image super-resolution in comparison to the method based on the convolutional
neural networks (CNNs). However, using the self-attention mechanism like SwinIR
(Image Restoration Using Swin Transformer) to extract feature information from
images needs a significant amount of computational resources, which limits its
application on low computing power platforms. To improve the model feature
reuse, this research work proposes the Interval Dense Connection Strategy,
which connects different blocks according to the newly designed algorithm. We
apply this strategy to SwinIR and present a new model, which named SwinOIR
(Object Image Restoration Using Swin Transformer). For image super-resolution,
an ablation study is conducted to demonstrate the positive effect of the
Interval Dense Connection Strategy on the model performance. Furthermore, we
evaluate our model on various popular benchmark datasets, and compare it with
other state-of-the-art (SOTA) lightweight models. For example, SwinOIR obtains
a PSNR of 26.62 dB for x4 upscaling image super-resolution on Urban100 dataset,
which is 0.15 dB higher than the SOTA model SwinIR. For real-life application,
this work applies the lastest version of You Only Look Once (YOLOv8) model and
the proposed model to perform object detection and real-life image
super-resolution on low-quality images. This implementation code is publicly
available at https://github.com/Rubbbbbbbbby/SwinOIR.
- Abstract(参考訳): 本手法は,畳み込みニューラルネットワーク(cnns)に基づく手法と比較して,画像の超解像性能が著しく向上した。
しかし、画像から特徴情報を抽出するために、SwinIR (Image Restoration Using Swin Transformer) のような自己保持機構を使用するには、膨大な量の計算資源が必要であるため、低計算パワープラットフォームへの応用が制限される。
モデル機能の再利用を改善するため,新たに設計されたアルゴリズムに従って異なるブロックを接続するインターバルDense Connection Strategyを提案する。
我々はこの戦略をSwinIRに適用し、SwinOIR (Object Image Restoration using Swin Transformer) と名付けた新しいモデルを提案する。
画像の超解像に対して,区間密結合戦略がモデル性能に及ぼす影響を示すため,アブレーション実験を行った。
さらに,このモデルを様々なベンチマークデータセット上で評価し,他のSOTA(State-of-the-art)軽量モデルと比較した。
例えば、SwinOIRはUrban100データセットの超高解像度化のために26.62dBのPSNRを取得し、これはSOTAモデルSwinIRよりも0.15dB高い。
本研究は, リアルタイムアプリケーションにおいて, YOLOv8(You Only Look Once)モデルの最後のバージョンと提案モデルを適用し, 低画質画像上でオブジェクト検出とリアルタイム画像の超解像を行う。
この実装コードはhttps://github.com/Rubbbbbbby/SwinOIRで公開されている。
関連論文リスト
- Efficient Visual State Space Model for Image Deblurring [83.57239834238035]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Degradation-Aware Self-Attention Based Transformer for Blind Image
Super-Resolution [23.336576280389608]
本稿では,入力画像の劣化表現を未知の雑音で学習する自己認識型トランスフォーマモデルを提案する。
提案したモデルを,テスト用の大規模ベンチマークデータセットに適用し,最先端のパフォーマンスを実現する。
提案手法では,Urban100データセットのPSNRが32.43dB,DASRより0.94dB,KDSRより26.62dB,KDSRより0.26dB向上した。
論文 参考訳(メタデータ) (2023-10-06T11:52:31Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - ConvNeXt-ChARM: ConvNeXt-based Transform for Efficient Neural Image
Compression [18.05997169440533]
ConvNeXt-ChARMは,効率的なConvNeXtベースのトランスフォーメーションコーディングフレームワークである。
ConvNeXt-ChARMは、VVC参照エンコーダ(VTM-18.0)と最先端の学習画像圧縮手法であるSwinT-ChARMに対して、平均5.24%と1.22%と、一貫したBDレート(PSNR)の低下をもたらすことを示した。
論文 参考訳(メタデータ) (2023-07-12T11:45:54Z) - Cascaded Cross-Attention Networks for Data-Efficient Whole-Slide Image
Classification Using Transformers [0.11219061154635457]
全スライディングイメージングは、組織標本の高解像度画像のキャプチャとデジタル化を可能にする。
高解像度情報を効果的に活用するための候補としてトランスフォーマーアーキテクチャが提案されている。
本稿では,抽出されたパッチ数と線形にスケールするクロスアテンション機構に基づく新しいカスケード型クロスアテンションネットワーク(CCAN)を提案する。
論文 参考訳(メタデータ) (2023-05-11T16:42:24Z) - Combining Attention Module and Pixel Shuffle for License Plate
Super-Resolution [3.8831062015253055]
本研究は,低解像度・低画質画像におけるライセンスプレート(LP)再構成に焦点を当てた。
本稿では、注目/変圧器モジュールの概念を拡張したシングルイメージ超解法(SISR)アプローチを提案する。
実験では, 提案手法は, 定量的および定性的に, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-10-30T13:05:07Z) - Learning Transformer Features for Image Quality Assessment [53.51379676690971]
本稿では,CNNバックボーンとトランスフォーマーエンコーダを用いて特徴抽出を行うIQAフレームワークを提案する。
提案するフレームワークはFRモードとNRモードの両方と互換性があり、共同トレーニング方式が可能である。
論文 参考訳(メタデータ) (2021-12-01T13:23:00Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Deep Variational Network Toward Blind Image Restoration [60.45350399661175]
ブラインド画像復元はコンピュータビジョンでは一般的だが難しい問題である。
両利点を両立させることを目的として,新しいブラインド画像復元手法を提案する。
画像デノイングと超解像という2つの典型的なブラインド赤外線タスクの実験により,提案手法が現状よりも優れた性能を達成できることが実証された。
論文 参考訳(メタデータ) (2020-08-25T03:30:53Z) - Radon cumulative distribution transform subspace modeling for image
classification [18.709734704950804]
画像変形モデルの幅広いクラスに適用可能な新しい教師付き画像分類法を提案する。
この方法は、画像データに先述のRandon Cumulative Distribution Transform(R-CDT)を用いる。
テスト精度の向上に加えて,計算効率の向上も示す。
論文 参考訳(メタデータ) (2020-04-07T19:47:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。