論文の概要: WaveHiT-SR: Hierarchical Wavelet Network for Efficient Image Super-Resolution
- arxiv url: http://arxiv.org/abs/2508.19927v1
- Date: Wed, 27 Aug 2025 14:37:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.669899
- Title: WaveHiT-SR: Hierarchical Wavelet Network for Efficient Image Super-Resolution
- Title(参考訳): WaveHiT-SR:画像超解像のための階層ウェーブレットネットワーク
- Authors: Fayaz Ali, Muhammad Zawish, Steven Davy, Radu Timofte,
- Abstract要約: 我々は(WaveHiT-SR)と呼ばれる階層型トランスフォーマーフレームワークにウェーブレット変換を埋め込み、新しいアプローチを提案する。
階層的な処理によって徐々に高解像度画像を再構成することにより、性能を犠牲にすることなく計算複雑性を低減させる。
SwinIR-Light, SwinIR-NG, SRFormer-Light の洗練されたバージョンでは最先端のSR結果が得られ, パラメータが少なく, FLOP が小さくなり, 高速化された。
- 参考スコア(独自算出の注目度): 44.55918322585521
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Transformers have demonstrated promising performance in computer vision tasks, including image super-resolution (SR). The quadratic computational complexity of window self-attention mechanisms in many transformer-based SR methods forces the use of small, fixed windows, limiting the receptive field. In this paper, we propose a new approach by embedding the wavelet transform within a hierarchical transformer framework, called (WaveHiT-SR). First, using adaptive hierarchical windows instead of static small windows allows to capture features across different levels and greatly improve the ability to model long-range dependencies. Secondly, the proposed model utilizes wavelet transforms to decompose images into multiple frequency subbands, allowing the network to focus on both global and local features while preserving structural details. By progressively reconstructing high-resolution images through hierarchical processing, the network reduces computational complexity without sacrificing performance. The multi-level decomposition strategy enables the network to capture fine-grained information in lowfrequency components while enhancing high-frequency textures. Through extensive experimentation, we confirm the effectiveness and efficiency of our WaveHiT-SR. Our refined versions of SwinIR-Light, SwinIR-NG, and SRFormer-Light deliver cutting-edge SR results, achieving higher efficiency with fewer parameters, lower FLOPs, and faster speeds.
- Abstract(参考訳): トランスフォーマーは、画像超解像(SR)を含むコンピュータビジョンタスクにおいて有望な性能を示した。
多くの変圧器をベースとしたSR法では、窓の自己注意機構の2次計算の複雑さにより、小さな固定窓の使用が強制され、受容場が制限される。
本稿では,ウェーブレット変換を階層型トランスフォーマフレームワーク(WaveHiT-SR)に組み込む手法を提案する。
まず、静的な小さなウィンドウの代わりに適応的な階層ウィンドウを使用することで、さまざまなレベルの機能をキャプチャし、長距離依存関係をモデル化する能力を大幅に改善することができる。
第二に、提案モデルではウェーブレット変換を用いて複数の周波数サブバンドに分割し、ネットワークが構造的詳細を保ちながらグローバルな特徴とローカルな特徴の両方に集中できるようにする。
階層的な処理によって徐々に高解像度画像を再構成することにより、性能を犠牲にすることなく計算複雑性を低減させる。
マルチレベル分解戦略により、ネットワークは高周波テクスチャを高めながら、低周波成分の微細な情報を捕捉できる。
広範囲な実験により,WaveHiT-SRの有効性と有効性を確認した。
SwinIR-Light, SwinIR-NG, SRFormer-Light の洗練されたバージョンでは最先端のSR結果が得られ, パラメータが少なく, FLOP が小さくなり, 高速化された。
関連論文リスト
- FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - Dual-domain Modulation Network for Lightweight Image Super-Resolution [26.992373105057684]
軽量画像超解像(SR)は、低解像度画像から限られた計算コストで高解像度画像を再構成することを目的としている。
既存の周波数ベースSR法では、全体構造と高周波部品の再構築のバランスが取れない。
本稿では,ウェーブレット情報とフーリエ情報の両方を導入することで,コスト削減を図りながら,高周波特徴と全体のSR構造再構築を両立させることができることを示す。
論文 参考訳(メタデータ) (2025-03-13T04:59:46Z) - HiT-SR: Hierarchical Transformer for Efficient Image Super-Resolution [70.52256118833583]
変換器ベースSRネットワークを階層変換器(HiT-SR)に変換する戦略を提案する。
具体的には、一般的に使われている固定された小さなウィンドウを階層的なウィンドウに置き換えて、異なるスケールで機能を集約する。
大規模なウィンドウに必要となる計算量を考慮すると、窓の大きさに線形な複雑性を持つ空間チャネル相関法をさらに設計する。
論文 参考訳(メタデータ) (2024-07-08T12:42:10Z) - CFAT: Unleashing TriangularWindows for Image Super-resolution [5.130320840059732]
トランスフォーマーモデルが画像超解像(SR)の分野に革命をもたらした
境界レベルの歪みを軽減するために,矩形ウィンドウと同期して動作する非重なりの三角形ウィンドウ手法を提案する。
提案モデルでは,他の最先端SRアーキテクチャに比べて0.7dB性能が向上した。
論文 参考訳(メタデータ) (2024-03-24T13:31:31Z) - WaveMixSR: A Resource-efficient Neural Network for Image
Super-resolution [2.0477182014909205]
本稿では、WaveMixアーキテクチャに基づく画像超解像のための新しいニューラルネットワーク、WaveMixSRを提案する。
WaveMixSRは、すべてのデータセットで競合性能を達成し、複数の超解像度タスクでBSD100データセットで最先端のパフォーマンスに達する。
論文 参考訳(メタデータ) (2023-07-01T21:25:03Z) - Hybrid Pixel-Unshuffled Network for Lightweight Image Super-Resolution [64.54162195322246]
畳み込みニューラルネットワーク(CNN)は画像超解像(SR)において大きな成功を収めた
ほとんどのディープCNNベースのSRモデルは、高い性能を得るために大量の計算を処理している。
SRタスクに効率的かつ効果的なダウンサンプリングモジュールを導入することで,HPUN(Hybrid Pixel-Unshuffled Network)を提案する。
論文 参考訳(メタデータ) (2022-03-16T20:10:41Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。