論文の概要: DeRainMamba: A Frequency-Aware State Space Model with Detail Enhancement for Image Deraining
- arxiv url: http://arxiv.org/abs/2510.06746v1
- Date: Wed, 08 Oct 2025 08:05:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 16:41:20.358204
- Title: DeRainMamba: A Frequency-Aware State Space Model with Detail Enhancement for Image Deraining
- Title(参考訳): DeRainMamba: 詳細な画像デライニング機能を備えた周波数対応状態空間モデル
- Authors: Zhiliang Zhu, Tao Zeng, Tao Yang, Guoliang Luo, Jiyong Zeng,
- Abstract要約: 周波数対応状態空間モジュール(FASSM)と多方向知覚畳み込み(MDPConv)を統合したDeRainMambaを提案する。
4つの公開ベンチマークでの大規模な実験により、DeRainMambaはPSNRとSSIMの最先端手法を一貫して上回っていることが示された。
その結果, 単一画像デライニングのための状態空間フレームワークにおける周波数領域モデリングと空間的詳細化の併用の有効性が検証された。
- 参考スコア(独自算出の注目度): 7.900269590721382
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Image deraining is crucial for improving visual quality and supporting reliable downstream vision tasks. Although Mamba-based models provide efficient sequence modeling, their limited ability to capture fine-grained details and lack of frequency-domain awareness restrict further improvements. To address these issues, we propose DeRainMamba, which integrates a Frequency-Aware State-Space Module (FASSM) and Multi-Directional Perception Convolution (MDPConv). FASSM leverages Fourier transform to distinguish rain streaks from high-frequency image details, balancing rain removal and detail preservation. MDPConv further restores local structures by capturing anisotropic gradient features and efficiently fusing multiple convolution branches. Extensive experiments on four public benchmarks demonstrate that DeRainMamba consistently outperforms state-of-the-art methods in PSNR and SSIM, while requiring fewer parameters and lower computational costs. These results validate the effectiveness of combining frequency-domain modeling and spatial detail enhancement within a state-space framework for single image deraining.
- Abstract(参考訳): 画像のデライン化は、視覚的品質を改善し、信頼性の高い下流視覚タスクをサポートするために不可欠である。
Mambaベースのモデルは効率的なシーケンスモデリングを提供するが、細かな細部を捉える能力と周波数領域認識の欠如により、さらなる改善が制限される。
これらの問題に対処するために、周波数対応状態空間モジュール(FASSM)とMDPConv(Multi-Directional Perception Convolution)を統合したDeRainMambaを提案する。
FASSMはフーリエ変換を利用して、雨のストリークと高周波画像の詳細を区別し、雨の除去と詳細な保存のバランスをとる。
MDPConvはさらに、異方性勾配の特徴を捉え、複数の畳み込み枝を効率的に融合することで局所構造を復元する。
4つの公開ベンチマークでの大規模な実験により、DeRainMambaはPSNRとSSIMの最先端の手法を一貫して上回り、パラメータの削減と計算コストの低減を図っている。
これらの結果は, 単一画像デライニングのための状態空間フレームワークにおける周波数領域モデリングと空間的詳細化の併用の有効性を検証した。
関連論文リスト
- Beyond Illumination: Fine-Grained Detail Preservation in Extreme Dark Image Restoration [3.5382753486225087]
暗黒画像のディテールリカバリを主眼とした,効率的な2段階探索手法を提案する。
第1段階では、周波数領域のグローバル照明を効果的に復元するResidual Fourier-Guided Module (RFGM)を導入する。
RFGMは、残コネクションを介して、ステージ間およびチャネル間依存関係をキャプチャする。
Patch Mamba はチャネル結合された非サンプルパッチで動作し、ピクセルレベルの相関を慎重にモデル化し、解像度損失を伴わずに微細な詳細を向上する。
グラッド・マンバ(Grad Mamba)は、高次領域、状態空間モデルにおける状態崩壊の緩和、シャープの優先順位付けなどに焦点を当てている。
論文 参考訳(メタデータ) (2025-08-05T11:31:08Z) - Frequency-Aware Autoregressive Modeling for Efficient High-Resolution Image Synthesis [40.93077975823353]
視覚的自己回帰モデリングは、次のスケールの予測パラダイムに基づいており、画像の品質とモデルのスケーラビリティにおいて顕著な優位性を示している。
しかし、高解像度の段階での計算オーバーヘッドは、相当数のトークンが関与しているため、依然として重要な課題である。
Sparsevarは、次世代の予測のためのプラグイン・アンド・プレイ・アクセラレーション・フレームワークで、追加のトレーニングを必要とせず、推論中に低周波トークンを動的に排除する。
論文 参考訳(メタデータ) (2025-07-28T01:13:24Z) - Frequency Domain-Based Diffusion Model for Unpaired Image Dehazing [92.61216319417208]
そこで本稿では,未確認データにおける有益な知識を十分に活用するための,新しい周波数領域ベース拡散モデルを提案する。
拡散モデル(DM)が示す強い生成能力に着想を得て,周波数領域再構成の観点からデハージング課題に取り組む。
論文 参考訳(メタデータ) (2025-07-02T01:22:46Z) - Learning Multi-scale Spatial-frequency Features for Image Denoising [58.883244886588336]
本稿では,マルチスケール適応型デュアルドメインネットワーク(MADNet)を提案する。
画像ピラミッド入力を用いて低解像度画像からノイズのない結果を復元する。
高周波情報と低周波情報の相互作用を実現するために,適応型空間周波数学習ユニットを設計する。
論文 参考訳(メタデータ) (2025-06-19T13:28:09Z) - FADPNet: Frequency-Aware Dual-Path Network for Face Super-Resolution [70.61549422952193]
計算コストの制限による顔超解像(FSR)は未解決の問題である。
既存のアプローチでは、全ての顔のピクセルを等しく扱い、計算資源を最適以下に割り当てる。
本稿では、低周波成分と高周波成分に顔の特徴を分解する周波数対応デュアルパスネットワークであるFADPNetを提案する。
論文 参考訳(メタデータ) (2025-06-17T02:33:42Z) - Iterative Optimal Attention and Local Model for Single Image Rain Streak Removal [17.153392956724783]
本研究では,単一画像雨量除去のための期待最大化変換器 (EMResformer) を提案する。
EMR変換器は、特徴集約のための重要な自己アテンション値を保持し、より優れた画像再構成を実現するために局所的特徴を増強する。
提案するEMResformerは,合成データセットと実世界のデータセットの両方において,現在最先端の単一画像雨量除去手法を超越している。
論文 参考訳(メタデータ) (2025-03-20T14:06:53Z) - Frequency Domain Enhanced U-Net for Low-Frequency Information-Rich Image Segmentation in Surgical and Deep-Sea Exploration Robots [34.28684917337352]
CNNと人間の視覚系における周波数帯域感度の差について検討する。
本稿では、生体視覚機構にインスパイアされたウェーブレット適応スペクトル融合(WASF)法を提案する。
我々は SAM2 のバックボーンネットワークを利用する FE-UNet モデルを開発し, セグメンテーション精度を確保するために細調整した Hiera-Large モジュールを組み込んだ。
論文 参考訳(メタデータ) (2025-02-06T07:24:34Z) - GaraMoSt: Parallel Multi-Granularity Motion and Structural Modeling for Efficient Multi-Frame Interpolation in DSA Images [35.42266460525047]
Digital Subtraction Angiography (DSA) 画像は複雑な血管構造と様々な動きを含んでいる。
自然シーンビデオフレーム補間法(VFI)を適用すると、動きのアーティファクト、構造的散逸、ぼやけが生じる。
MoSt-DSAはこれらの問題に初めて対処し、SOTAの結果を得た。
我々は,これらの問題に同じ計算時間スケールで対処するGalaMoStを提案する。
論文 参考訳(メタデータ) (2024-12-18T18:04:12Z) - Cross-Scan Mamba with Masked Training for Robust Spectral Imaging [51.557804095896174]
本研究では,空間スペクトルSSMを用いたクロススキャンマンバ(CS-Mamba)を提案する。
実験の結果, CS-Mambaは最先端の性能を達成し, マスク付きトレーニング手法によりスムーズな特徴を再構築し, 視覚的品質を向上させることができた。
論文 参考訳(メタデータ) (2024-08-01T15:14:10Z) - Image Deraining with Frequency-Enhanced State Space Model [2.9465623430708905]
本研究では,画像デライニングによる画像デライニングにSSMを導入し,DFSSM(Deraining Frequency-Enhanced State Space Model)を提案する。
我々は,複数のカーネルサイズを持つ畳み込みを用いて,様々なスケールの劣化を効果的に捕捉する,新しい混合スケールゲート畳み込みブロックを開発した。
合成および実世界の雨天画像データセットの実験により,我々の手法が最先端の手法を超越していることが判明した。
論文 参考訳(メタデータ) (2024-05-26T07:45:12Z) - Efficient Visual State Space Model for Image Deblurring [99.54894198086852]
畳み込みニューラルネットワーク(CNN)とビジョントランスフォーマー(ViT)は、画像復元において優れた性能を発揮している。
本稿では,画像のデブロアに対する簡易かつ効果的な視覚状態空間モデル(EVSSM)を提案する。
提案したEVSSMは、ベンチマークデータセットや実世界の画像に対する最先端の手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2024-05-23T09:13:36Z) - Low-Light Image Enhancement with Wavelet-based Diffusion Models [50.632343822790006]
拡散モデルは画像復元作業において有望な結果を得たが、時間を要する、過剰な計算資源消費、不安定な復元に悩まされている。
本稿では,DiffLLと呼ばれる高能率かつ高能率な拡散型低光画像強調手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T03:08:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。