論文の概要: MambaLLIE: Implicit Retinex-Aware Low Light Enhancement with Global-then-Local State Space
- arxiv url: http://arxiv.org/abs/2405.16105v1
- Date: Sat, 25 May 2024 07:31:49 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 01:00:23.553773
- Title: MambaLLIE: Implicit Retinex-Aware Low Light Enhancement with Global-then-Local State Space
- Title(参考訳): MambaLLIE:グローバル・テーマ・ローカル・ステート・スペースによるレチネックスを意識した低照度化
- Authors: Jiangwei Weng, Zhiqiang Yan, Ying Tai, Jianjun Qian, Jian Yang, Jun Li,
- Abstract要約: MambaLLIEは暗黙のRetinex対応の低照度エンハンサーで、グローバルなローカルな状態空間設計を特徴としている。
MambaLLIE は最先端の CNN や Transformer ベースの手法よりも優れていた。
- 参考スコア(独自算出の注目度): 38.506080114387764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in low light image enhancement have been dominated by Retinex-based learning framework, leveraging convolutional neural networks (CNNs) and Transformers. However, the vanilla Retinex theory primarily addresses global illumination degradation and neglects local issues such as noise and blur in dark conditions. Moreover, CNNs and Transformers struggle to capture global degradation due to their limited receptive fields. While state space models (SSMs) have shown promise in the long-sequence modeling, they face challenges in combining local invariants and global context in visual data. In this paper, we introduce MambaLLIE, an implicit Retinex-aware low light enhancer featuring a global-then-local state space design. We first propose a Local-Enhanced State Space Module (LESSM) that incorporates an augmented local bias within a 2D selective scan mechanism, enhancing the original SSMs by preserving local 2D dependency. Additionally, an Implicit Retinex-aware Selective Kernel module (IRSK) dynamically selects features using spatially-varying operations, adapting to varying inputs through an adaptive kernel selection process. Our Global-then-Local State Space Block (GLSSB) integrates LESSM and IRSK with LayerNorm as its core. This design enables MambaLLIE to achieve comprehensive global long-range modeling and flexible local feature aggregation. Extensive experiments demonstrate that MambaLLIE significantly outperforms state-of-the-art CNN and Transformer-based methods. Project Page: https://mamballie.github.io/anon/
- Abstract(参考訳): 低光画像強調の最近の進歩は、畳み込みニューラルネットワーク(CNN)とトランスフォーマーを活用するRetinexベースの学習フレームワークによって支配されている。
しかしながら、バニラ・レチネックス理論は、主に地球規模の照明劣化に対処し、暗い条件下でのノイズやぼやけなどの局所的な問題を無視する。
さらに、CNNとTransformersは、受容野が限られているため、グローバルな劣化を捉えるのに苦労している。
状態空間モデル(SSM)は、長いシーケンスモデリングにおいて有望であるが、局所不変量と視覚データにおけるグローバルコンテキストを組み合わせることの難しさに直面している。
本稿では,グローバルな局所状態空間設計を特徴とする暗黙のRetinex対応低照度エンハンサーであるMambaLLIEを紹介する。
まず,2次元選択走査機構に局所バイアスを付加したローカル拡張状態空間モジュール(LESSM)を提案する。
さらに、Implicit Retinex-aware Selective Kernelモジュール(IRSK)は、適応的なカーネル選択プロセスを通じて、様々な入力に適応して、空間的に変化する演算を用いて機能を動的に選択する。
我々のGlobal-then-Local State Space Block (GLSSB)は、LESSMとIRSKをLayerNormをコアとして統合しています。
この設計により、MambaLLIEは包括的なグローバルな長距離モデリングとフレキシブルな局所的特徴集約を実現することができる。
大規模な実験により、MambaLLIEは最先端のCNNやTransformerベースの手法よりも大幅に優れていた。
Project Page: https://mamballie.github.io/anon/
関連論文リスト
- Mamba-FSCIL: Dynamic Adaptation with Selective State Space Model for Few-Shot Class-Incremental Learning [113.89327264634984]
FSCIL(Few-shot class-incremental Learning)は、最小限のトレーニングサンプルを持つモデルに新しいクラスを統合するという課題に直面している。
動的適応を誘導するクラス感受性選択的スキャン機構を開発した。
miniImageNet, CUB-200, CIFAR-100 の実験により,我々のフレームワークは既存の最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-07-08T17:09:39Z) - HDMba: Hyperspectral Remote Sensing Imagery Dehazing with State Space Model [9.42497788563994]
ハイパースペクトルリモートセンシング画像(HSI)のヘイズは、空間的な可視性劣化とスペクトル歪みを引き起こす。
我々は、ウィンドウ内のローカル依存関係をキャプチャする新しいウィンドウ選択スキャンモジュール(WSSM)を開発した。
局所的および大域的スペクトル空間情報フローをモデル化することにより,ハジー領域の包括的解析を実現する。
Gaofen-5 HSIデータセットの実験結果から、HDMbaは他の最先端手法よりも性能が優れていることが示された。
論文 参考訳(メタデータ) (2024-06-09T08:53:02Z) - RSDehamba: Lightweight Vision Mamba for Remote Sensing Satellite Image Dehazing [19.89130165954241]
リモートセンシング画像デハージング(RSID)は、高品質な画像復元のための不均一かつ物理的に不規則なヘイズ要素を取り除くことを目的としている。
本稿では,RSID分野におけるRSDhambaと呼ばれるマンバモデル上での最初の軽量ネットワークを提案する。
論文 参考訳(メタデータ) (2024-05-16T12:12:07Z) - MambaUIE&SR: Unraveling the Ocean's Secrets with Only 2.8 GFLOPs [1.7648680700685022]
水中画像強調(UIE)技術は,光吸収・散乱による水中画像劣化問題に対処することを目的としている。
近年、畳み込みニューラルネットワーク(CNN)とトランスフォーマーベースの手法が広く研究されている。
MambaUIEは、グローバルおよびローカル情報を効率的に合成することができ、非常に少数のパラメータを高い精度で保持する。
論文 参考訳(メタデータ) (2024-04-22T05:12:11Z) - DGMamba: Domain Generalization via Generalized State Space Model [80.82253601531164]
ドメイン一般化(DG)は、様々な場面における分散シフト問題を解決することを目的としている。
Mambaは、新興状態空間モデル(SSM)として、より優れた線形複雑性と大域的受容場を持つ。
本稿では,DGMamba という新たな DG フレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-11T14:35:59Z) - Learning Enriched Features via Selective State Spaces Model for Efficient Image Deblurring [0.0]
Image Deblurringは、高品質な画像を、それに対応するぼやけた画像から復元することを目的としている。
本稿では、選択状態空間モデルを利用して、リッチで正確な特徴を集約する効率的な画像デブロアリングネットワークを提案する。
実験により,提案手法は広く用いられているベンチマークにおいて,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2024-03-29T10:40:41Z) - Salient Object Detection in Optical Remote Sensing Images Driven by
Transformer [69.22039680783124]
光リモートセンシング画像(ORSI-SOD)のためのGlobal extract Local Exploration Network(GeleNet)を提案する。
具体的には、GeleNetはまずトランスフォーマーバックボーンを採用し、グローバルな長距離依存関係を持つ4レベルの機能埋め込みを生成する。
3つの公開データセットに関する大規模な実験は、提案されたGeleNetが関連する最先端メソッドより優れていることを示している。
論文 参考訳(メタデータ) (2023-09-15T07:14:43Z) - Enhancing NeRF akin to Enhancing LLMs: Generalizable NeRF Transformer
with Mixture-of-View-Experts [88.23732496104667]
クロスシーンの一般化可能なNeRFモデルは、NeRFフィールドの新たなスポットライトとなっている。
我々は、大規模言語モデルから強力なMixture-of-Experts(MoE)のアイデアを"神経化"アーキテクチャにブリッジする。
提案手法は,GNT-MOVE (Mixture-of-View-Experts) とよばれるモデルで,未知のシーンに移動する際の最先端の結果を実験的に示す。
論文 参考訳(メタデータ) (2023-08-22T21:18:54Z) - LCTR: On Awakening the Local Continuity of Transformer for Weakly
Supervised Object Localization [38.376238216214524]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルのラベルだけでオブジェクトローカライザを学習することを目的としている。
本稿では,グローバルな特徴の局所認識能力を高めることを目的とした,LCTRと呼ばれるトランスフォーマー上に構築された新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-10T01:48:40Z) - Low Light Image Enhancement via Global and Local Context Modeling [164.85287246243956]
低照度画像強調のためのコンテキスト認識ディープネットワークを導入。
まず、全空間領域上の補完的な手がかりを見つけるために空間相関をモデル化するグローバルコンテキストモジュールを特徴とする。
第二に、比較的大きな受容フィールドで局所的なコンテキストをキャプチャする密な残留ブロックを導入する。
論文 参考訳(メタデータ) (2021-01-04T09:40:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。