Fugu-MT 論文翻訳(概要): MambaIR: A Simple Baseline for Image Restoration with State-Space Model

論文の概要: MambaIR: A Simple Baseline for Image Restoration with State-Space Model

arxiv url: http://arxiv.org/abs/2402.15648v3
Date: Tue, 15 Oct 2024 02:45:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:30.99272
Title: MambaIR: A Simple Baseline for Image Restoration with State-Space Model
Title（参考訳）: MambaIR: ステートスペースモデルによる画像復元のためのシンプルなベースライン
Authors: Hang Guo, Jinmin Li, Tao Dai, Zhihao Ouyang, Xudong Ren, Shu-Tao Xia,
Abstract要約: 我々は,バニラ・マンバを改善するために,局部増強とチャンネルアテンションを導入するMambaIRを紹介した。本手法は,画像SR上でSwinIRを最大0.45dB向上させる。
参考スコア（独自算出の注目度）: 46.827053426281715
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: Recent years have seen significant advancements in image restoration, largely attributed to the development of modern deep neural networks, such as CNNs and Transformers. However, existing restoration backbones often face the dilemma between global receptive fields and efficient computation, hindering their application in practice. Recently, the Selective Structured State Space Model, especially the improved version Mamba, has shown great potential for long-range dependency modeling with linear complexity, which offers a way to resolve the above dilemma. However, the standard Mamba still faces certain challenges in low-level vision such as local pixel forgetting and channel redundancy. In this work, we introduce a simple but effective baseline, named MambaIR, which introduces both local enhancement and channel attention to improve the vanilla Mamba. In this way, our MambaIR takes advantage of the local pixel similarity and reduces the channel redundancy. Extensive experiments demonstrate the superiority of our method, for example, MambaIR outperforms SwinIR by up to 0.45dB on image SR, using similar computational cost but with a global receptive field. Code is available at \url{https://github.com/csguoh/MambaIR}.
Abstract（参考訳）: 近年では画像復元が大幅に進歩しており、主にCNNやTransformersのような現代のディープニューラルネットワークの開発によるものである。しかし、既存の復元バックボーンは、大域的な受容場と効率的な計算のジレンマに直面し、実際に応用を妨げている。近年、Selective Structured State Space Model、特に改良されたMambaは、線形複雑性を持つ長距離依存モデリングに大きな可能性を示し、上記のジレンマを解決する方法を提供している。しかしながら、標準のMambaは、ローカルピクセルのリプレースやチャネルの冗長性といった、低レベルのビジョンにおいて、いくつかの課題に直面している。本研究では,バニラ・マンバの改良のために,局所的な拡張とチャネルの注意を両立させる,シンプルだが効果的なベースラインであるMambaIRを紹介する。このようにして、我々のMambaIRは、局所的なピクセル類似性を生かし、チャネルの冗長性を減少させる。例えば、MambaIRは画像SR上でSwinIRを最大0.45dBで上回り、同様の計算コストを用いるが、大域的受容場を持つ。コードは \url{https://github.com/csguoh/MambaIR} で入手できる。

関連論文リスト

SaMam: Style-aware State Space Model for Arbitrary Image Style Transfer [41.09041735653436]
私たちはSaMamと呼ばれるMambaベースのスタイル転送フレームワークを開発した。具体的には、コンテンツやスタイル情報を効率的に抽出するマンバエンコーダを設計する。既存のSSMの局所的画素分割やチャネル冗長性,空間的不連続性といった問題に対処するために,局所的拡張とジグザグスキャンを導入する。
論文参考訳（メタデータ） (2025-03-20T08:18:27Z)
MatIR: A Hybrid Mamba-Transformer Image Restoration Model [95.17418386046054]
そこで我々は,MatIRと呼ばれるMamba-Transformerハイブリッド画像復元モデルを提案する。 MatIRはTransformer層とMamba層のブロックをクロスサイクルして特徴を抽出する。 Mambaモジュールでは、4つのスキャンパスに沿って横断するImage Inpainting State Space (IRSS)モジュールを導入する。
論文参考訳（メタデータ） (2025-01-30T14:55:40Z)
Multi-dimensional Visual Prompt Enhanced Image Restoration via Mamba-Transformer Aggregation [4.227991281224256]
本稿では,計算効率を犠牲にすることなく,MambaとTransformerの相補的な利点を十分に活用することを提案する。マンバの選択的走査機構は空間モデリングに焦点をあて、長距離空間依存のキャプチャを可能にする。トランスフォーマーの自己保持機構は、画像の空間次元と二次的な成長の重荷を回避し、チャネルモデリングに焦点をあてる。
論文参考訳（メタデータ） (2024-12-20T12:36:34Z)
MambaIRv2: Attentive State Space Restoration [96.4452232356586]
本稿では,空間復元モデルに到達するために,MambaとViTsに似た非因果モデリング能力を備えたMambaIRv2を提案する。具体的には、提案された注意状態空間方程式は、スキャンされたシーケンスを超えることができ、単一のスキャンで画像の展開を容易にする。
論文参考訳（メタデータ） (2024-11-22T12:45:12Z)
ColorMamba: Towards High-quality NIR-to-RGB Spectral Translation with Mamba [0.12499537119440242]
NIRを可視光スペクトルに変換することは、クロスドメインの複雑さのために困難である。現在のモデルは、幅広い受容領域と計算効率のバランスをとるのに苦労し、実用的使用を制限している。そこで我々は,まずスペクトル翻訳タスクにマンバを導入し,カラーマンバ(ColorMamba)という,シンプルで効果的なバックボーンを提案する。
論文参考訳（メタデータ） (2024-08-15T11:29:13Z)
MambaVT: Spatio-Temporal Contextual Modeling for robust RGB-T Tracking [51.28485682954006]
本研究では,マンバをベースとした純フレームワーク(MambaVT)を提案する。具体的には、長距離クロスフレーム統合コンポーネントを考案し、ターゲットの外観変化にグローバルに適応する。実験では、RGB-TトラッキングのためのMambaのビジョンの可能性が示され、MambaVTは4つの主要なベンチマークで最先端のパフォーマンスを達成した。
論文参考訳（メタデータ） (2024-08-15T02:29:00Z)
Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文参考訳（メタデータ） (2024-08-01T15:14:10Z)
Mamba-UIE: Enhancing Underwater Images with Physical Model Constraint [6.2101866921752285]
水中画像強調(UIE)では、畳み込みニューラルネットワーク(CNN)は長距離依存関係のモデリングに固有の制限がある。本研究では,物理モデルによる制約に基づく水中画像強調フレームワークであるMamba-UIEを提案する。提案したMamba-UIEは既存の最先端手法よりも優れており,PSNRは27.13で,SSIMは0.93である。
論文参考訳（メタデータ） (2024-07-27T13:22:10Z)
PixMamba: Leveraging State Space Models in a Dual-Level Architecture for Underwater Image Enhancement [7.443057703389351]
水中画像強調(UIE)は海洋調査や探査に重要であるが、複雑な色歪みと激しいぼやけによって妨げられている。近年のディープラーニングに基づく手法は目覚ましい成果を上げているが、これらの手法は高い計算コストと不十分なグローバルモデリングに苦慮している。我々は,ステートスペースモデル(SSM)を活用して,効率的なグローバル依存性モデリングを実現することにより,これらの課題を克服するために設計された新しいアーキテクチャであるPixMambaを提案する。
論文参考訳（メタデータ） (2024-06-12T17:34:38Z)
Frequency-Assisted Mamba for Remote Sensing Image Super-Resolution [49.902047563260496]
我々は、リモートセンシング画像(RSI)の超高解像度化のために、視覚状態空間モデル(Mamba)を統合するための最初の試みを開発した。より優れたSR再構築を実現するため,FMSRと呼ばれる周波数支援型Mambaフレームワークを考案した。我々のFMSRは、周波数選択モジュール(FSM)、ビジョン状態空間モジュール(VSSM)、ハイブリッドゲートモジュール(HGM)を備えた多層融合アーキテクチャを備えている。
論文参考訳（メタデータ） (2024-05-08T11:09:24Z)
RSMamba: Remote Sensing Image Classification with State Space Model [25.32283897448209]
リモートセンシング画像分類のための新しいアーキテクチャであるRSMambaを紹介する。 RSMamba は State Space Model (SSM) をベースにしており、Mamba として知られる効率的なハードウェアを意識した設計を取り入れている。非時間画像データのモデル化にマンバの容量を増大させる動的マルチパスアクティベーション機構を提案する。
論文参考訳（メタデータ） (2024-03-28T17:59:49Z)
PointMamba: A Simple State Space Model for Point Cloud Analysis [65.59944745840866]
我々は、最近の代表的状態空間モデル(SSM)であるMambaの成功を、NLPからポイントクラウド分析タスクへ転送するPointMambaを提案する。従来のトランスフォーマーとは異なり、PointMambaは線形複雑性アルゴリズムを採用し、グローバルなモデリング能力を示しながら計算コストを大幅に削減する。
論文参考訳（メタデータ） (2024-02-16T14:56:13Z)
Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文参考訳（メタデータ） (2020-02-07T03:45:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。