論文の概要: Wave-Mamba: Wavelet State Space Model for Ultra-High-Definition Low-Light Image Enhancement
- arxiv url: http://arxiv.org/abs/2408.01276v1
- Date: Fri, 2 Aug 2024 14:01:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-05 13:17:55.967106
- Title: Wave-Mamba: Wavelet State Space Model for Ultra-High-Definition Low-Light Image Enhancement
- Title(参考訳): ウェーブマンバ:超高精細低光画像強調のためのウェーブレット状態空間モデル
- Authors: Wenbin Zou, Hongxia Gao, Weipeng Yang, Tongtong Liu,
- Abstract要約: ウェーブレット領域から導出される2つの重要な洞察に基づく新しいアプローチであるWave-Mambaを提案する。
提案手法は優れた性能を示し, 従来の先行技術を大きく上回っている。
- 参考スコア(独自算出の注目度): 7.891750065129094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ultra-high-definition (UHD) technology has attracted widespread attention due to its exceptional visual quality, but it also poses new challenges for low-light image enhancement (LLIE) techniques. UHD images inherently possess high computational complexity, leading existing UHD LLIE methods to employ high-magnification downsampling to reduce computational costs, which in turn results in information loss. The wavelet transform not only allows downsampling without loss of information, but also separates the image content from the noise. It enables state space models (SSMs) to avoid being affected by noise when modeling long sequences, thus making full use of the long-sequence modeling capability of SSMs. On this basis, we propose Wave-Mamba, a novel approach based on two pivotal insights derived from the wavelet domain: 1) most of the content information of an image exists in the low-frequency component, less in the high-frequency component. 2) The high-frequency component exerts a minimal influence on the outcomes of low-light enhancement. Specifically, to efficiently model global content information on UHD images, we proposed a low-frequency state space block (LFSSBlock) by improving SSMs to focus on restoring the information of low-frequency sub-bands. Moreover, we propose a high-frequency enhance block (HFEBlock) for high-frequency sub-band information, which uses the enhanced low-frequency information to correct the high-frequency information and effectively restore the correct high-frequency details. Through comprehensive evaluation, our method has demonstrated superior performance, significantly outshining current leading techniques while maintaining a more streamlined architecture. The code is available at https://github.com/AlexZou14/Wave-Mamba.
- Abstract(参考訳): 超高精細(UHD)技術は、視力の異常さから注目されているが、低照度画像強調(LLIE)技術に新たな課題も生じている。
UHD画像は本質的に高い計算複雑性を有しており、既存のUHD LLIE法では、計算コストを削減し、結果として情報損失をもたらす。
ウェーブレット変換は情報を失うことなくダウンサンプリングを可能にするだけでなく、画像の内容とノイズを分離する。
これにより、状態空間モデル(SSM)は、長いシーケンスをモデル化する際のノイズの影響を避けることができ、SSMの長いシーケンスモデリング機能を完全に活用することができる。
そこで本研究では,ウェーブレット領域から導出した2つの重要な洞察に基づく新しいアプローチであるWave-Mambaを提案する。
1) 画像の内容情報の大部分は低周波成分に存在し、高周波成分にはほとんど含まれない。
2) 高周波成分は低照度化の結果に最小限の影響を与える。
具体的には,UHD画像のグローバルなコンテント情報を効率的にモデル化するために,低周波サブバンド情報の復元に重点を置いた低周波状態空間ブロック(LFSSBlock)を提案する。
さらに,高周波数サブバンド情報に対する高周波数拡張ブロック (HFEBlock) を提案する。
網羅的な評価により,提案手法は優れた性能を示し,より合理化されたアーキテクチャを維持しつつ,現在の先行技術を大きく上回っている。
コードはhttps://github.com/AlexZou14/Wave-Mambaで入手できる。
関連論文リスト
- High-Frequency Enhanced Hybrid Neural Representation for Video Compression [32.38933743785333]
本稿では,高周波拡張型ハイブリッドニューラル表現ネットワークを提案する。
本手法は,ネットワークによる細部合成を改善するために,高周波情報を活用することに焦点を当てている。
BunnyおよびUVGデータセットの実験は、我々の手法が他の手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2024-11-11T03:04:46Z) - Local Implicit Wavelet Transformer for Arbitrary-Scale Super-Resolution [15.610136214020947]
暗黙の神経表現は、最近、画像の任意のスケールの超解像(SR)において有望な可能性を証明している。
既存のほとんどの手法は、クエリされた座標と近くの特徴のアンサンブルに基づいて、SR画像中のピクセルを予測する。
本稿では,高周波テクスチャの再現性を高めるために,LIWT(Local Implicit Wavelet Transformer)を提案する。
論文 参考訳(メタデータ) (2024-11-10T12:21:14Z) - WaveDH: Wavelet Sub-bands Guided ConvNet for Efficient Image Dehazing [20.094839751816806]
画像デハージングにおけるこの効率ギャップに対処するために設計された,新規でコンパクトなConvNetであるWaveDHを紹介する。
我々のWaveDHはウェーブレットサブバンドを利用して、誘導型アップ・アンド・ダウンサンプリングと周波数認識機能の改良を行う。
提案手法であるWaveDHは,計算コストを大幅に削減した画像デハージングベンチマークにおいて,最先端の多くの手法より優れている。
論文 参考訳(メタデータ) (2024-04-02T02:52:05Z) - Wavelet-based Fourier Information Interaction with Frequency Diffusion
Adjustment for Underwater Image Restoration [6.185197290440237]
本稿では,周波数領域情報と拡散モデルの特徴をフル活用するWF-Diffを提案する。
WF-Diffは、ウェーブレットベースのフーリエ情報インタラクションネットワーク(WFI2-net)と周波数残差拡散調整モジュール(FRDAM)の2つの分離可能なネットワークで構成されている。
提案アルゴリズムは,実世界の水中画像データセット上でのSOTA性能を示し,視覚的品質の競争性能を実現する。
論文 参考訳(メタデータ) (2023-11-28T14:58:32Z) - WaveNeRF: Wavelet-based Generalizable Neural Radiance Fields [149.2296890464997]
我々は、ウェーブレット周波数分解をMVSとNeRFに統合したWaveNeRFを設計する。
WaveNeRFは、3つの画像のみを入力として与えたときに、より優れた一般化可能な放射場モデリングを実現する。
論文 参考訳(メタデータ) (2023-08-09T09:24:56Z) - A High-Frequency Focused Network for Lightweight Single Image
Super-Resolution [16.264904771818507]
高周波の詳細は低周波情報よりも再構成が難しい。
ほとんどのSISRモデルは、低周波および高周波情報に等しい計算資源を割り当てる。
高周波情報を選択的に強化するHFFN(High-Frequency Focused Network)を提案する。
論文 参考訳(メタデータ) (2023-03-21T09:41:13Z) - Embedding Fourier for Ultra-High-Definition Low-Light Image Enhancement [78.67036949708795]
UHD(Ultra-High-Definition)写真は、高度な撮像装置の標準構成となっている。
本稿では,Fourier変換をカスケードネットワークに組み込む新しいソリューションUHDFourを提案する。
また,2,150個の低雑音/正規クラー4K画像ペアを含むUHD LLIEデータセットである textbfUHD-LL をコントリビュートした。
論文 参考訳(メタデータ) (2023-02-23T07:43:41Z) - Low-Light Hyperspectral Image Enhancement [90.84144276935464]
本研究は,暗黒領域に隠された空間スペクトル情報を明らかにすることを目的とした,低照度HSI強調タスクに焦点を当てた。
ラプラシアのピラミッドの分解と再構成に基づいて, エンド・ツー・エンドのデータ駆動型低照度HSIエンハンスメント(HSIE)手法を開発した。
定量的評価と視覚効果の両面でのHSIEの有効性と効果を実証した。
論文 参考訳(メタデータ) (2022-08-05T08:45:52Z) - Inception Transformer [151.939077819196]
インセプショントランスフォーマー(iFormer)は、視覚データ中の高周波数情報と低周波情報の両方で包括的特徴を学習する。
我々は、iFormerを一連の視覚タスクでベンチマークし、画像分類、COCO検出、ADE20Kセグメンテーションにおいて優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-05-25T17:59:54Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z) - Wavelet Integrated CNNs for Noise-Robust Image Classification [51.18193090255933]
我々は、離散ウェーブレット変換(DWT)により、最大プール、ストライド畳み込み、平均プールを置き換えることでCNNを強化する。
VGG、ResNets、DenseNetのウェーブレット統合バージョンであるWaveCNetsは、バニラバージョンよりも精度が高く、ノイズ・ロバスト性も向上している。
論文 参考訳(メタデータ) (2020-05-07T09:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。