論文の概要: Image Super-Resolution using Efficient Striped Window Transformer
- arxiv url: http://arxiv.org/abs/2301.09869v1
- Date: Tue, 24 Jan 2023 09:09:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-25 14:10:26.936514
- Title: Image Super-Resolution using Efficient Striped Window Transformer
- Title(参考訳): 高能率角形ウィンドウ変換器を用いた画像超解像
- Authors: Jinpeng Shi, Hui Li, Tianle Liu, Yulong Liu, Mingjian Zhang, Jinchen
Zhu, Ling Zheng, Shizhuang Weng
- Abstract要約: 本稿では,効率的なストライプウィンドウトランス (ESWT) を提案する。
ESWTは効率的な変換層(ETL)で構成されており、クリーンな構造と冗長な操作を避けることができる。
トランスの可能性をさらに活用するために,新しいフレキシブルウィンドウトレーニング戦略を提案する。
- 参考スコア(独自算出の注目度): 6.815956004383743
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, transformer-based methods have made impressive progress in
single-image super-resolu-tion (SR). However, these methods are difficult to
apply to lightweight SR (LSR) due to the challenge of balancing model
performance and complexity. In this paper, we propose an efficient striped
window transformer (ESWT). ESWT consists of efficient transformation layers
(ETLs), allowing a clean structure and avoiding redundant operations. Moreover,
we designed a striped window mechanism to obtain a more efficient ESWT in
modeling long-term dependencies. To further exploit the potential of the
transformer, we propose a novel flexible window training strategy. Without any
additional cost, this strategy can further improve the performance of ESWT.
Extensive experiments show that the proposed method outperforms
state-of-the-art transformer-based LSR methods with fewer parameters, faster
inference, smaller FLOPs, and less memory consumption, achieving a better
trade-off between model performance and complexity.
- Abstract(参考訳): 近年, 単一像超解離反応 (SR) において, トランスフォーマー法は顕著な進歩を遂げている。
しかし,軽量sr (lsr) では,モデルの性能と複雑さのバランスをとることが困難である。
本稿では,効率のよい窓形変圧器(eswt)を提案する。
ESWTは効率的な変換層(ETL)で構成されており、クリーンな構造と冗長な操作を避けることができる。
さらに,長期依存関係のモデリングにおいて,より効率的なESWTを実現するために,ストライプウィンドウ機構を設計した。
トランスの可能性をさらに活用するために,新しいフレキシブルウィンドウトレーニング戦略を提案する。
追加のコストがなければ、この戦略はESWTの性能をさらに向上させることができる。
拡張実験により,提案手法は,パラメータが小さく,推論が速く,FLOPが小さく,メモリ消費が小さく,モデル性能と複雑性のトレードオフが良好であることを示す。
関連論文リスト
- Vision-RWKV: Efficient and Scalable Visual Perception with RWKV-Like
Architectures [99.20299078655376]
本稿では、NLPフィールドで使用されるRWKVモデルから適応したVision-RWKVを紹介する。
我々のモデルは、スパース入力を効率的に処理し、ロバストなグローバル処理能力を実証するために設計されている。
評価の結果,VRWKVは画像分類におけるViTの性能を超え,高速化とメモリ使用量の削減を図っている。
論文 参考訳(メタデータ) (2024-03-04T18:46:20Z) - Transforming Image Super-Resolution: A ConvFormer-based Efficient
Approach [63.98380888730723]
本稿では, Convolutional Transformer Layer (ConvFormer) と ConvFormer-based Super-Resolution Network (CFSR) を紹介する。
CFSRは、計算コストの少ない長距離依存と広範囲の受容場を効率的にモデル化する。
これは、x2 SRタスクのUrban100データセットで0.39dB、パラメータが26%、FLOPが31%減少している。
論文 参考訳(メタデータ) (2024-01-11T03:08:00Z) - LATIS: Lambda Abstraction-based Thermal Image Super-resolution [10.375865762847347]
低解像度熱画像の品質向上には, SISR(Single Image Super- resolution)が有効である。
抽象化に基づく熱画像超解像(LATIS)は、熱画像のSISRのための新しい軽量アーキテクチャである。
論文 参考訳(メタデータ) (2023-11-18T02:55:04Z) - Unfolding Once is Enough: A Deployment-Friendly Transformer Unit for
Super-Resolution [16.54421804141835]
SISRモデルの中間機能の高解像度化は、メモリと計算要求を増加させる。
本稿では、SISRタスクのためのデプロイメントフレンドリな内部パッチ変換ネットワーク(DITN)を提案する。
我々のモデルは、質的かつ定量的な性能と高いデプロイメント効率で競合する結果を得ることができる。
論文 参考訳(メタデータ) (2023-08-05T05:42:51Z) - RWKV: Reinventing RNNs for the Transformer Era [54.716108899349614]
本稿では,変換器の効率的な並列化学習とRNNの効率的な推論を組み合わせた新しいモデルアーキテクチャを提案する。
モデルを最大14億のパラメータにスケールし、トレーニングされたRNNの中では最大で、同じサイズのTransformerと同等のRWKVのパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2023-05-22T13:57:41Z) - Rethinking Efficient Tuning Methods from a Unified Perspective [34.67645496324432]
我々はPETLの設計パラダイムを再検討し、パラメータ効率の伝達学習のための統一的なフレームワークU-Tuningを導出する。
U-Tuningフレームワークは、既存の手法を同時に包含し、パラメータ効率の移行学習のための新しいアプローチを導出することができる。
論文 参考訳(メタデータ) (2023-03-01T17:38:03Z) - Full Stack Optimization of Transformer Inference: a Survey [58.55475772110702]
トランスフォーマーモデルは広範囲のアプリケーションにまたがって優れた精度を実現する。
最近のTransformerモデルの推測に必要な計算量と帯域幅は、かなり増加しています。
Transformerモデルをより効率的にすることに注力している。
論文 参考訳(メタデータ) (2023-02-27T18:18:13Z) - Rich CNN-Transformer Feature Aggregation Networks for Super-Resolution [50.10987776141901]
近年の視覚変換器と自己注意は,様々なコンピュータビジョンタスクにおいて有望な成果を上げている。
我々は,CNNの局所的特徴とトランスフォーマーが捉えた長距離依存性を活用する,超解像(SR)タスクのための効果的なハイブリッドアーキテクチャを提案する。
提案手法は,多数のベンチマークデータセットから最先端のSR結果を得る。
論文 参考訳(メタデータ) (2022-03-15T06:52:25Z) - Sliced Recursive Transformer [23.899076070924153]
視覚変換器における再帰操作は、追加パラメータを伴わずにパラメータ利用を改善することができる。
我々のモデル Sliced Recursive Transformer (SReT) は、効率的な視覚変換のための様々な設計と互換性がある。
論文 参考訳(メタデータ) (2021-11-09T17:59:14Z) - Video Face Super-Resolution with Motion-Adaptive Feedback Cell [90.73821618795512]
深部畳み込みニューラルネットワーク(CNN)の発展により,ビデオ超解像法(VSR)は近年,顕著な成功を収めている。
本稿では,動作補償を効率的に捕捉し,適応的にネットワークにフィードバックする,シンプルで効果的なブロックである動き適応型フィードバックセル(MAFC)を提案する。
論文 参考訳(メタデータ) (2020-02-15T13:14:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。