論文の概要: Transforming Image Super-Resolution: A ConvFormer-based Efficient
Approach
- arxiv url: http://arxiv.org/abs/2401.05633v1
- Date: Thu, 11 Jan 2024 03:08:00 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-13 01:47:49.361363
- Title: Transforming Image Super-Resolution: A ConvFormer-based Efficient
Approach
- Title(参考訳): 画像の超解像:convformerに基づく効率的なアプローチ
- Authors: Gang Wu, Junjun Jiang, Junpeng Jiang, Xianming Liu
- Abstract要約: 本稿では, Convolutional Transformer Layer (ConvFormer) と ConvFormer-based Super-Resolution Network (CFSR) を紹介する。
CFSRは、計算コストの少ない長距離依存と広範囲の受容場を効率的にモデル化する。
これは、x2 SRタスクのUrban100データセットで0.39dB、パラメータが26%、FLOPが31%減少している。
- 参考スコア(独自算出の注目度): 63.98380888730723
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent progress in single-image super-resolution (SISR) has achieved
remarkable performance, yet the computational costs of these methods remain a
challenge for deployment on resource-constrained devices. Especially for
transformer-based methods, the self-attention mechanism in such models brings
great breakthroughs while incurring substantial computational costs. To tackle
this issue, we introduce the Convolutional Transformer layer (ConvFormer) and
the ConvFormer-based Super-Resolution network (CFSR), which offer an effective
and efficient solution for lightweight image super-resolution tasks. In detail,
CFSR leverages the large kernel convolution as the feature mixer to replace the
self-attention module, efficiently modeling long-range dependencies and
extensive receptive fields with a slight computational cost. Furthermore, we
propose an edge-preserving feed-forward network, simplified as EFN, to obtain
local feature aggregation and simultaneously preserve more high-frequency
information. Extensive experiments demonstrate that CFSR can achieve an
advanced trade-off between computational cost and performance when compared to
existing lightweight SR methods. Compared to state-of-the-art methods, e.g.
ShuffleMixer, the proposed CFSR achieves 0.39 dB gains on Urban100 dataset for
x2 SR task while containing 26% and 31% fewer parameters and FLOPs,
respectively. Code and pre-trained models are available at
https://github.com/Aitical/CFSR.
- Abstract(参考訳): シングルイメージ超解像(SISR)の最近の進歩は目覚ましい性能を達成しているが、これらの手法の計算コストは、資源に制約のあるデバイスに展開する上での課題である。
特に変圧器に基づく手法では、そのようなモデルにおける自己保持機構は、かなりの計算コストを発生させながら大きなブレークスルーをもたらす。
この問題に対処するために,コンボリューショナルトランスフォーマー層(ConvFormer)とコンボフォーマーをベースとしたスーパーリゾリューションネットワーク(CFSR)を導入する。
詳細は、CFSRは機能ミキサーとして大きなカーネルの畳み込みを活用し、長距離依存や広範囲の受容場を計算コストで効率的にモデル化する。
さらに、EFNとして単純化されたエッジ保存フィードフォワードネットワークを提案し、局所的な特徴集約を取得し、さらに高周波情報を同時に保存する。
大規模実験により、CFSRは既存の軽量SR法と比較して計算コストと性能の高度なトレードオフを達成できることを示した。
ShuffleMixerのような最先端の手法と比較して、提案されたCFSRは、x2 SRタスクのUrban100データセットで0.39dB、パラメータが26%、FLOPが31%少ない。
コードと事前訓練されたモデルはhttps://github.com/Aitical/CFSR.comで入手できる。
関連論文リスト
- Unfolding Once is Enough: A Deployment-Friendly Transformer Unit for
Super-Resolution [16.54421804141835]
SISRモデルの中間機能の高解像度化は、メモリと計算要求を増加させる。
本稿では、SISRタスクのためのデプロイメントフレンドリな内部パッチ変換ネットワーク(DITN)を提案する。
我々のモデルは、質的かつ定量的な性能と高いデプロイメント効率で競合する結果を得ることができる。
論文 参考訳(メタデータ) (2023-08-05T05:42:51Z) - Can SAM Boost Video Super-Resolution? [78.29033914169025]
単純な有効モジュールであるSAM-guidEd refinEment Module (SEEM)を提案する。
この軽量プラグインモジュールは、セマンティック・アウェア機能の生成にアテンションメカニズムを活用するように設計されている。
我々はSEEMをEDVRとBasicVSRの2つの代表的手法に適用し、最小限の実装労力で継続的に性能を向上する。
論文 参考訳(メタデータ) (2023-05-11T02:02:53Z) - Incorporating Transformer Designs into Convolutions for Lightweight
Image Super-Resolution [46.32359056424278]
大規模な畳み込みカーネルは畳み込みニューラルネットワークの設計に人気がある。
カーネルのサイズが大きくなるとパラメータの数が2倍に増加し、計算量やメモリの要求も大きくなる。
本稿では,自己注意機構を付加した標準畳み込みを改良した近傍注意モジュールを提案する。
NAモジュールをベースとして,TSRと呼ばれる軽量単一画像超解像(SISR)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-25T01:32:18Z) - Spatially-Adaptive Feature Modulation for Efficient Image
Super-Resolution [90.16462805389943]
視覚変換器(ViT)のようなブロック上に,空間適応型特徴変調(SAFM)機構を開発する。
提案法は最先端のSR法よりも3倍程度小さい。
論文 参考訳(メタデータ) (2023-02-27T14:19:31Z) - ShuffleMixer: An Efficient ConvNet for Image Super-Resolution [88.86376017828773]
本稿では、大きな畳み込みとチャネル分割シャッフル操作を探索する軽量画像超解像のためのShuffleMixerを提案する。
具体的には,チャネル分割とシャッフルを基本成分とする2つのプロジェクション層を効率よく混合する。
実験結果から,ShuffleMixerはモデルパラメータやFLOPの手法に比べて約6倍小さいことがわかった。
論文 参考訳(メタデータ) (2022-05-30T15:26:52Z) - Residual Local Feature Network for Efficient Super-Resolution [20.62809970985125]
本研究では,Residual Local Feature Network (RLFN)を提案する。
主なアイデアは、3つの畳み込みレイヤを局所的な特徴学習に使用して、機能の集約を単純化することだ。
さらに,NTIRE 2022の高効率超解像問題において,第1位を獲得した。
論文 参考訳(メタデータ) (2022-05-16T08:46:34Z) - Fully Quantized Image Super-Resolution Networks [81.75002888152159]
効率と精度を両立させるためのフル量子化画像超解像フレームワーク(FQSR)を提案する。
我々は、SRResNet、SRGAN、EDSRを含む複数の主流超解像アーキテクチャに量子化スキームを適用した。
低ビット量子化を用いたFQSRは、5つのベンチマークデータセットの完全精度と比較すると、パー性能で実現できる。
論文 参考訳(メタデータ) (2020-11-29T03:53:49Z) - Optimization-driven Machine Learning for Intelligent Reflecting Surfaces
Assisted Wireless Networks [82.33619654835348]
インテリジェントサーフェス(IRS)は、個々の散乱素子の位相シフトを制御して無線チャネルを再形成するために用いられる。
散乱素子の規模が大きいため、受動ビームフォーミングは一般に高い計算複雑性によって挑戦される。
本稿では、IRS支援無線ネットワークの性能向上のための機械学習(ML)アプローチに焦点を当てる。
論文 参考訳(メタデータ) (2020-08-29T08:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。