論文の概要: Semantics and Content Matter: Towards Multi-Prior Hierarchical Mamba for Image Deraining
- arxiv url: http://arxiv.org/abs/2511.13113v1
- Date: Mon, 17 Nov 2025 08:08:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-18 14:36:24.991474
- Title: Semantics and Content Matter: Towards Multi-Prior Hierarchical Mamba for Image Deraining
- Title(参考訳): セマンティックスとコンテンツマター:イメージデライニングのための多面的階層型マンバを目指して
- Authors: Zhaocheng Yu, Kui Jiang, Junjun Jiang, Xianming Liu, Guanglu Sun, Yi Xiao,
- Abstract要約: 画像デライニングのためのマルチPrior Hierarchical Mamba (MPHM) ネットワーク
MPHMは、タスクレベルのセマンティックガイダンスのためのマクロセマンティックテキスト先行(CLIP)と、シーン認識構造情報のためのマイクロ構造視覚先行(DINOv2)を統合している。
実験ではMPHMの最先端のパフォーマンスを実証し、Rain200Hデータセットで0.57dBのPSNRゲインを達成した。
- 参考スコア(独自算出の注目度): 95.00432497331583
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Rain significantly degrades the performance of computer vision systems, particularly in applications like autonomous driving and video surveillance. While existing deraining methods have made considerable progress, they often struggle with fidelity of semantic and spatial details. To address these limitations, we propose the Multi-Prior Hierarchical Mamba (MPHM) network for image deraining. This novel architecture synergistically integrates macro-semantic textual priors (CLIP) for task-level semantic guidance and micro-structural visual priors (DINOv2) for scene-aware structural information. To alleviate potential conflicts between heterogeneous priors, we devise a progressive Priors Fusion Injection (PFI) that strategically injects complementary cues at different decoder levels. Meanwhile, we equip the backbone network with an elaborate Hierarchical Mamba Module (HMM) to facilitate robust feature representation, featuring a Fourier-enhanced dual-path design that concurrently addresses global context modeling and local detail recovery. Comprehensive experiments demonstrate MPHM's state-of-the-art performance, achieving a 0.57 dB PSNR gain on the Rain200H dataset while delivering superior generalization on real-world rainy scenarios.
- Abstract(参考訳): 雨はコンピュータビジョンシステムの性能を著しく低下させ、特に自律運転やビデオ監視などのアプリケーションでは顕著である。
既存のデリーニング法はかなり進歩しているが、意味的・空間的詳細の忠実さに苦しむことが多い。
これらの制約に対処するため,画像デライニングのためのMPHM(Multi-Prior Hierarchical Mamba)ネットワークを提案する。
このアーキテクチャは、タスクレベルのセマンティックガイダンスのためのマクロセマンティックテキスト先行(CLIP)と、シーン認識構造情報のためのマイクロ構造視覚先行(DINOv2)を相乗的に統合する。
異種前駆体間の潜在的な衝突を軽減するため,異なるデコーダレベルで相補的手がかりを戦略的に注入するプログレッシブ先駆体核融合法(PFI)を考案した。
一方、バックボーンネットワークに階層型マンバモジュール(HMM)を設け、グローバルコンテキストモデリングと局所ディテールリカバリを同時に処理するフーリエ強化デュアルパス設計を特徴とする、堅牢な特徴表現を容易にする。
総合的な実験はMPHMの最先端性能を実証し、Rain200Hデータセットで0.57dBのPSNRゲインを達成し、実際の雨のシナリオにおいて優れた一般化を提供する。
関連論文リスト
- AFM-Net: Advanced Fusing Hierarchical CNN Visual Priors with Global Sequence Modeling for Remote Sensing Image Scene Classification [32.67944942908809]
AFM-Netは、2つの経路を通して効果的な局所的およびグローバルな共表現を実現する新しいフレームワークである。
AFM-Netの核となる革新は階層的融合機構(Hierarchical Fusion Mechanism)にある。
AID、NWPU-RESISC45、UC Mercedの実験では、AMM-Netは93.72、95.54、96.92パーセントの精度を得ており、性能と効率のバランスが取れた最先端の手法を上回っている。
論文 参考訳(メタデータ) (2025-10-31T03:55:16Z) - Towards Efficient General Feature Prediction in Masked Skeleton Modeling [59.46799426434277]
マスクスケルトンモデリングのための新しい汎用特徴予測フレームワーク(GFP)を提案する。
我々の重要な革新は、局所的な動きパターンからグローバルな意味表現にまたがる、従来の低レベルな再構築を高レベルな特徴予測に置き換えることです。
論文 参考訳(メタデータ) (2025-09-03T18:05:02Z) - GPSMamba: A Global Phase and Spectral Prompt-guided Mamba for Infrared Image Super-Resolution [7.842507196763463]
Infrared Image Super-Resolution is challenge by the low contrast and sparse textures of infrared data。
GPSMambaは、アーキテクチャガイダンスと非因果的な監視を併用するフレームワークである。
論文 参考訳(メタデータ) (2025-07-25T06:56:16Z) - PMA: Towards Parameter-Efficient Point Cloud Understanding via Point Mamba Adapter [54.33433051500349]
本稿では,事前学習モデルのすべての層から順序付き特徴系列を構成するPMAを提案する。
また、異なる層にまたがって共有される幾何学制約ゲートプロンプトジェネレータ(G2PG)を提案する。
論文 参考訳(メタデータ) (2025-05-27T09:27:16Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - SIGMA: Selective Gated Mamba for Sequential Recommendation [56.85338055215429]
最近の進歩であるMambaは、時系列予測において例外的なパフォーマンスを示した。
SIGMA(Selective Gated Mamba)と呼ばれる,シークエンシャルレコメンデーションのための新しいフレームワークを紹介する。
以上の結果から,SIGMAは5つの実世界のデータセットにおいて,現在のモデルよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-08-21T09:12:59Z) - Multi-Scale Hourglass Hierarchical Fusion Network for Single Image
Deraining [8.964751500091005]
雨のひもはサイズ、方向および密度で頻繁に変わる深刻なぼやけおよび視覚質の低下をもたらします。
現在のCNN方式は, 降雨特性の描写や, 可視性に乏しい環境下でのイメージの復元に限られている。
本稿では,マルチスケール抽出,階層蒸留,情報集約による雨天の特徴を正確に把握するために,マルチスケールのHH2F-Netを提案する。
論文 参考訳(メタデータ) (2021-04-25T08:27:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。