論文の概要: WaMaIR: Image Restoration via Multiscale Wavelet Convolutions and Mamba-based Channel Modeling with Texture Enhancement
- arxiv url: http://arxiv.org/abs/2510.16765v1
- Date: Sun, 19 Oct 2025 09:11:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.133852
- Title: WaMaIR: Image Restoration via Multiscale Wavelet Convolutions and Mamba-based Channel Modeling with Texture Enhancement
- Title(参考訳): WaMaIR:マルチスケールウェーブレット畳み込みによる画像復元とテクスチャ強化によるマンバ型チャネルモデリング
- Authors: Shengyu Zhu, Fan, Fuxuan Zhang,
- Abstract要約: WaMaIRは画像認識のための大きな受容場を持つ新しいフレームワークであり、復元された画像のテクスチャ詳細の再構築を改善する。
具体的には,Global Multiscale Wavelet Transform Convolutions (GMWTConvs)を導入し,画像の特徴を抽出するために受容場を拡張する。
また,Mamba-based Channel-Aware Module (MCAM) を提案する。
- 参考スコア(独自算出の注目度): 0.9062266355882445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image restoration is a fundamental and challenging task in computer vision, where CNN-based frameworks demonstrate significant computational efficiency. However, previous CNN-based methods often face challenges in adequately restoring fine texture details, which are limited by the small receptive field of CNN structures and the lack of channel feature modeling. In this paper, we propose WaMaIR, which is a novel framework with a large receptive field for image perception and improves the reconstruction of texture details in restored images. Specifically, we introduce the Global Multiscale Wavelet Transform Convolutions (GMWTConvs) for expandding the receptive field to extract image features, preserving and enriching texture features in model inputs. Meanwhile, we propose the Mamba-Based Channel-Aware Module (MCAM), explicitly designed to capture long-range dependencies within feature channels, which enhancing the model sensitivity to color, edges, and texture information. Additionally, we propose Multiscale Texture Enhancement Loss (MTELoss) for image restoration to guide the model in preserving detailed texture structures effectively. Extensive experiments confirm that WaMaIR outperforms state-of-the-art methods, achieving better image restoration and efficient computational performance of the model.
- Abstract(参考訳): 画像復元はコンピュータビジョンにおける基本的な課題であり、CNNベースのフレームワークは計算効率を著しく向上させる。
しかし、従来のCNNベースの手法では、CNN構造の小さな受容領域とチャネル特徴モデリングの欠如によって制限された、きめ細かいテクスチャの詳細を適切に復元する上で、しばしば課題に直面している。
本稿では、画像認識のための大きな受容場を持つ新しいフレームワークであるWaMaIRを提案し、復元された画像におけるテクスチャ詳細の再構築を改善する。
具体的には、GMWTConvs(Global Multiscale Wavelet Transform Convolutions)を導入し、知覚場を拡張して画像の特徴を抽出し、モデル入力におけるテクスチャの特徴を保存・強化する。
一方,Mamba-based Channel-Aware Module (MCAM) は特徴チャネル内の長距離依存性を明示的に捉えるように設計されており,色・エッジ・テクスチャ情報に対するモデル感度を高める。
さらに,画像復元のためのMTELos(Multiscale Texture Enhancement Loss)を提案する。
大規模な実験により、WaMaIRは最先端の手法より優れ、より優れた画像復元と効率的な計算性能を実現することが確認された。
関連論文リスト
- Directing Mamba to Complex Textures: An Efficient Texture-Aware State Space Model for Image Restoration [75.51789992466183]
TAMAMbaIRは画像テクスチャの達成と性能と効率のトレードオフを同時に知覚する。
画像超解像, デラリニング, 低照度画像強調のためのベンチマーク実験により, TAMAMbaIRは高い効率で最先端の性能を達成できることを示した。
論文 参考訳(メタデータ) (2025-01-27T23:53:49Z) - Fine-Grained Multi-View Hand Reconstruction Using Inverse Rendering [11.228453237603834]
本稿では,逆レンダリングを利用して手ポーズを復元し,詳細を複雑化する多視点ハンドメッシュ再構成手法を提案する。
また、ハンドメッシュとテクスチャの両方を洗練させるために、新しいハンドアルベドとメッシュ(HAM)最適化モジュールも導入した。
提案手法は,再現精度とレンダリング品質の両面において,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2024-07-08T07:28:24Z) - GTR: Improving Large 3D Reconstruction Models through Geometry and Texture Refinement [51.97726804507328]
マルチビュー画像から3次元メッシュを再構成する手法を提案する。
提案手法は, 変圧器を用いたトリプレーンジェネレータとニューラルレージアンスフィールド(NeRF)モデルを用いた大規模再構成モデルから着想を得たものである。
論文 参考訳(メタデータ) (2024-06-09T05:19:24Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。