論文の概要: WDMamba: When Wavelet Degradation Prior Meets Vision Mamba for Image Dehazing
- arxiv url: http://arxiv.org/abs/2505.04369v1
- Date: Wed, 07 May 2025 12:37:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-08 19:07:36.070765
- Title: WDMamba: When Wavelet Degradation Prior Meets Vision Mamba for Image Dehazing
- Title(参考訳): WDMamba:Waveletの劣化に先駆けてVision Mambaが画像の劣化に挑戦
- Authors: Jie Sun, Heng Liu, Yongzhen Wang, Xiao-Ping Zhang, Mingqiang Wei,
- Abstract要約: 画像デハージングタスクを2段階に分解する新しいデハージングフレームワークWDMambaを提案する。
低周波回復段階において,我々はマンバブロックを統合し,大域構造を線形複雑に再構築し,全体ヘイズを効率的に除去する。
詳細化の段階では、前段階で見落とされたかもしれないきめ細かい情報を再保存し、最終的なデハズド出力に終止符を打つ。
- 参考スコア(独自算出の注目度): 28.199334898731646
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we reveal a novel haze-specific wavelet degradation prior observed through wavelet transform analysis, which shows that haze-related information predominantly resides in low-frequency components. Exploiting this insight, we propose a novel dehazing framework, WDMamba, which decomposes the image dehazing task into two sequential stages: low-frequency restoration followed by detail enhancement. This coarse-to-fine strategy enables WDMamba to effectively capture features specific to each stage of the dehazing process, resulting in high-quality restored images. Specifically, in the low-frequency restoration stage, we integrate Mamba blocks to reconstruct global structures with linear complexity, efficiently removing overall haze and producing a coarse restored image. Thereafter, the detail enhancement stage reinstates fine-grained information that may have been overlooked during the previous phase, culminating in the final dehazed output. Furthermore, to enhance detail retention and achieve more natural dehazing, we introduce a self-guided contrastive regularization during network training. By utilizing the coarse restored output as a hard negative example, our model learns more discriminative representations, substantially boosting the overall dehazing performance. Extensive evaluations on public dehazing benchmarks demonstrate that our method surpasses state-of-the-art approaches both qualitatively and quantitatively. Code is available at https://github.com/SunJ000/WDMamba.
- Abstract(参考訳): 本稿では,ウェーブレット変換解析によって観測される,ハウズ固有のウェーブレット劣化を新たに明らかにし,ハウズ関連情報が主に低周波成分に存在することを示す。
そこで本研究では, 画像デハージングタスクを低周波復元と詳細拡張の2段階に分解する新しいデハージングフレームワークWDMambaを提案する。
この粗粒化戦略により、WDMambaは脱湿工程の各段階に特有の特徴を効果的に捉え、高品質な復元画像が得られる。
具体的には、低周波復元段階において、マンバブロックを統合して、大域構造を線形複雑に再構築し、全体ヘイズを効率よく除去し、粗い復元画像を生成する。
その後、ディテールエンハンスメント段階は、前フェーズで見落とされたかもしれないきめ細かい情報を復元し、最終的なデハズド出力に終止符を打つ。
さらに, ネットワークトレーニング中に自己誘導型コントラスト正規化を導入することで, ディテールの保持を向上し, より自然な脱ヘイズを実現する。
粗い復元出力を強負の例として利用することにより、より識別的な表現を学習し、全体的な脱ハージング性能を大幅に向上させる。
パブリックデヘイジングベンチマークの大規模な評価は、我々の手法が定性的かつ定量的に最先端のアプローチを超越していることを示している。
コードはhttps://github.com/SunJ000/WDMamba.comで入手できる。
関連論文リスト
- "Principal Components" Enable A New Language of Images [79.45806370905775]
証明可能なPCAのような構造を潜在トークン空間に組み込む新しい視覚トークン化フレームワークを導入する。
提案手法は、最先端の再構築性能を実現し、人間の視覚システムとの整合性を向上する。
論文 参考訳(メタデータ) (2025-03-11T17:59:41Z) - Frequency-Guided Posterior Sampling for Diffusion-Based Image Restoration [32.50204554102937]
本稿では,既存の拡散型修復法に対する簡単な修正を提案する。
本手法では,周波数領域における時間変化の少ない低域通過フィルタを提案する。
本稿では,その基礎となるデータ分布に基づいて,この周波数スケジュールの適応カリキュラムを開発する。
論文 参考訳(メタデータ) (2024-11-22T18:31:02Z) - DRACO-DehazeNet: An Efficient Image Dehazing Network Combining Detail Recovery and a Novel Contrastive Learning Paradigm [3.649619954898362]
我々は,Detail Recovery and Contrastive DehazeNetを開発した。
濃密な拡張反転残差ブロックと、注意に基づく詳細回復ネットワークを介して、効率的で効果的な脱ハジングを提供する。
大きな革新は、新しい四重項損失に基づくコントラストデハージングパラダイムによって達成された、限られたデータで効果的にトレーニングできることである。
論文 参考訳(メタデータ) (2024-10-18T16:48:31Z) - SpikeReveal: Unlocking Temporal Sequences from Real Blurry Inputs with Spike Streams [44.02794438687478]
スパイクカメラは、動きの特徴を捉え、この不適切な問題を解くのに有効であることが証明されている。
既存の手法は教師付き学習パラダイムに陥り、現実のシナリオに適用した場合、顕著なパフォーマンス劣化に悩まされる。
本研究では,スパイク誘導動作の劣化に対する最初の自己教師型フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-14T15:29:09Z) - Reconstruct-and-Generate Diffusion Model for Detail-Preserving Image
Denoising [16.43285056788183]
再構成・生成拡散モデル(Reconstruct-and-Generate Diffusion Model, RnG)と呼ばれる新しい手法を提案する。
提案手法は, 再構成型復調ネットワークを利用して, 基礎となるクリーン信号の大半を復元する。
拡散アルゴリズムを用いて残留する高周波の詳細を生成し、視覚的品質を向上させる。
論文 参考訳(メタデータ) (2023-09-19T16:01:20Z) - DiffBIR: Towards Blind Image Restoration with Generative Diffusion Prior [70.46245698746874]
DiffBIRは、視覚の異なる画像復元タスクを処理できる一般的な修復パイプラインである。
DiffBIRは, ブラインド画像復元問題を, 1) 劣化除去: 画像に依存しない内容の除去; 2) 情報再生: 失われた画像内容の生成の2段階に分離する。
第1段階では, 修復モジュールを用いて劣化を除去し, 高忠実度復元結果を得る。
第2段階では、潜伏拡散モデルの生成能力を活用して現実的な詳細を生成するIRControlNetを提案する。
論文 参考訳(メタデータ) (2023-08-29T07:11:52Z) - SelfPromer: Self-Prompt Dehazing Transformers with Depth-Consistency [51.92434113232977]
本研究は,画像デハージングに有効な深度整合型セルフプロンプトトランスを提案する。
ヘイズ残像とその明確な像の深さが異なるという観測によって動機づけられた。
VQGANに基づくエンコーダ・デコーダネットワークにプロンプト、プロンプト埋め込み、そしてインタプリタを組み込むことにより、より優れた知覚品質を実現することができる。
論文 参考訳(メタデータ) (2023-03-13T11:47:24Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。