論文の概要: ECMamba: Consolidating Selective State Space Model with Retinex Guidance for Efficient Multiple Exposure Correction
- arxiv url: http://arxiv.org/abs/2410.21535v1
- Date: Mon, 28 Oct 2024 21:02:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:40:45.343791
- Title: ECMamba: Consolidating Selective State Space Model with Retinex Guidance for Efficient Multiple Exposure Correction
- Title(参考訳): ECMamba: 効率的な多重露光補正のための網膜誘導による選択状態空間モデルの統合
- Authors: Wei Dong, Han Zhou, Yulun Zhang, Xiaohong Liu, Jun Chen,
- Abstract要約: 本稿では,反射率と照明マップの復元を目的とした,二重経路を持つ露出補正のためのMamba(ECMamba)に基づく新しいフレームワークを提案する。
具体的には、Retinex理論を導出し、入力を2つの中間空間にマッピングできるRetinex推定器を訓練する。
我々は、ECMMのコア演算子として、Retinex情報(Retinex-SS2D)で案内される新しい2次元選択状態空間層を開発する。
- 参考スコア(独自算出の注目度): 48.77198487543991
- License:
- Abstract: Exposure Correction (EC) aims to recover proper exposure conditions for images captured under over-exposure or under-exposure scenarios. While existing deep learning models have shown promising results, few have fully embedded Retinex theory into their architecture, highlighting a gap in current methodologies. Additionally, the balance between high performance and efficiency remains an under-explored problem for exposure correction task. Inspired by Mamba which demonstrates powerful and highly efficient sequence modeling, we introduce a novel framework based on Mamba for Exposure Correction (ECMamba) with dual pathways, each dedicated to the restoration of reflectance and illumination map, respectively. Specifically, we firstly derive the Retinex theory and we train a Retinex estimator capable of mapping inputs into two intermediary spaces, each approximating the target reflectance and illumination map, respectively. This setup facilitates the refined restoration process of the subsequent Exposure Correction Mamba Module (ECMM). Moreover, we develop a novel 2D Selective State-space layer guided by Retinex information (Retinex-SS2D) as the core operator of ECMM. This architecture incorporates an innovative 2D scanning strategy based on deformable feature aggregation, thereby enhancing both efficiency and effectiveness. Extensive experiment results and comprehensive ablation studies demonstrate the outstanding performance and the importance of each component of our proposed ECMamba. Code is available at https://github.com/LowlevelAI/ECMamba.
- Abstract(参考訳): 露光補正(EC: Exposure Correction)は、過剰露光または露光のシナリオ下で撮影された画像の適切な露光条件を回復することを目的としている。
既存のディープラーニングモデルは有望な結果を示しているが、Retinex理論を完全にアーキテクチャに組み込んだものはほとんどなく、現在の方法論のギャップを浮き彫りにしている。
さらに, 高い性能と効率のバランスは, 露出補正タスクの未探索問題として残されている。
効率のよいシーケンスモデリングを実演するMambaに触発されて、両経路を持つMamba for Exposure Correction(ECMamba)に基づく新しいフレームワークを導入し、それぞれが反射率と照明マップの復元に特化している。
具体的には、まずRetinex理論を導出し、入力を2つの中間空間にマッピングできるRetinex推定器を訓練する。
このセットアップは、その後のExposure Correction Mamba Module (ECMM)の洗練された復元プロセスを促進する。
さらに、ECMMのコア演算子として、Retinex情報(Retinex-SS2D)で案内される2次元選択状態空間層を開発する。
このアーキテクチャは、変形可能な特徴集約に基づく革新的な2Dスキャン戦略を導入し、効率性と効率性を両立させる。
広範囲な実験結果と包括的アブレーション実験により,提案したECMambaの各コンポーネントの優れた性能と重要性が示された。
コードはhttps://github.com/LowlevelAI/ECMamba.comで入手できる。
関連論文リスト
- Dual-Domain CLIP-Assisted Residual Optimization Perception Model for Metal Artifact Reduction [9.028901322902913]
CT(Computed tomography)画像における金属遺物は,正確な臨床診断に重要な課題である。
深層学習に基づくアプローチ、特に生成モデルは、金属人工物還元(MAR)のために提案されている。
論文 参考訳(メタデータ) (2024-08-14T02:37:26Z) - Binarized Diffusion Model for Image Super-Resolution [61.963833405167875]
超圧縮アルゴリズムであるバイナリ化は、高度な拡散モデル(DM)を効果的に加速する可能性を提供する
既存の二項化法では性能が著しく低下する。
画像SRのための新しいバイナライズ拡散モデルBI-DiffSRを提案する。
論文 参考訳(メタデータ) (2024-06-09T10:30:25Z) - Retinexmamba: Retinex-based Mamba for Low-light Image Enhancement [4.88806532092118]
RetinexMambaは従来のRetinexメソッドの物理的直感性を捉え、Retinexformerのディープラーニングフレームワークを統合する。
このアーキテクチャは、イノベーティブな照明推定器と、エンハンスメント中の画質を維持する損傷回復機構を備えている。
論文 参考訳(メタデータ) (2024-05-06T10:59:15Z) - Learning Exposure Correction in Dynamic Scenes [24.302307771649232]
我々は、露光不足と露光過多の両方を含む、世界初の実世界のペアビデオデータセットを構築した。
両ストリームモジュールは、露光不足と露光過多の両方に対処するように設計されている。
論文 参考訳(メタデータ) (2024-02-27T08:19:51Z) - Harnessing Diffusion Models for Visual Perception with Meta Prompts [68.78938846041767]
本稿では,視覚知覚タスクの拡散モデルを用いた簡易かつ効果的な手法を提案する。
学習可能な埋め込み(メタプロンプト)を事前学習した拡散モデルに導入し、知覚の適切な特徴を抽出する。
提案手法は,NYU 深度 V2 と KITTI の深度推定タスク,および CityScapes のセマンティックセグメンテーションタスクにおいて,新しい性能記録を実現する。
論文 参考訳(メタデータ) (2023-12-22T14:40:55Z) - Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Retinex Image Enhancement Based on Sequential Decomposition With a
Plug-and-Play Framework [16.579397398441102]
画像強調とノイズ除去を同時に行うために,Retinex理論に基づくプラグイン・アンド・プレイ・フレームワークを設計する。
我々のフレームワークは、画像の強調とデノーミングの両面で最先端の手法に勝っている。
論文 参考訳(メタデータ) (2022-10-11T13:29:10Z) - Toward Fast, Flexible, and Robust Low-Light Image Enhancement [87.27326390675155]
我々は、現実の低照度シナリオにおいて、高速でフレキシブルで頑健な鮮明化のための新しい自己校正イルミネーション(SCI)学習フレームワークを開発した。
カスケードパターンの計算負担を考慮すると、各ステージの結果の収束を実現する自己校正モジュールを構築する。
我々は,SCI固有の特性について,操作不感適応性やモデル非関係の一般性を含む包括的探索を行う。
論文 参考訳(メタデータ) (2022-04-21T14:40:32Z) - Image-specific Convolutional Kernel Modulation for Single Image
Super-resolution [85.09413241502209]
本稿では,新しい画像特異的畳み込み変調カーネル(IKM)を提案する。
我々は、画像や特徴のグローバルな文脈情報を利用して、畳み込みカーネルを適応的に調整するための注意重みを生成する。
単一画像超解像実験により,提案手法は最先端手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-11-16T11:05:10Z) - Selective Spatio-Temporal Aggregation Based Pose Refinement System:
Towards Understanding Human Activities in Real-World Videos [8.571131862820833]
最先端のポーズ推定装置は、現実世界の無注釈ビデオにおいて、乱れと低解像度のために高品質な2Dまたは3Dポーズデータを取得するのに苦労している。
本稿では,複数の専門家のポーズ推定器によって抽出されたキーポイント位置を洗練・平滑化するSST-Aという選択的時空間アグリゲーション機構を提案する。
本研究では, Pose-Refinement System (SSTA-PRS) によって改良された骨格データが,既存の行動認識モデルの強化に有効であることを示す。
論文 参考訳(メタデータ) (2020-11-10T19:19:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。