論文の概要: Wavelet-based Decoupling Framework for low-light Stereo Image Enhancement
- arxiv url: http://arxiv.org/abs/2507.12188v1
- Date: Wed, 16 Jul 2025 12:42:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.386119
- Title: Wavelet-based Decoupling Framework for low-light Stereo Image Enhancement
- Title(参考訳): 低照度ステレオ画像強調のためのウェーブレットベースデカップリングフレームワーク
- Authors: Shuangli Du, Siming Yan, Zhenghao Shi, Zhenzhen You, Lu Sun,
- Abstract要約: 本稿では,特徴空間デカップリングを用いたウェーブレットを用いた低照度ステレオ画像強調手法を提案する。
ウェーブレット変換を用いて、照明調整のための低周波分岐とテクスチャ強化のための複数の高周波分岐に特徴空間を分解する。
高周波情報を強化するため,クロスアテンション機構に基づくディテール・テクスチャ・エンハンスメント・モジュール(DTEM)を提案する。
- 参考スコア(独自算出の注目度): 4.645709745803925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low-light images suffer from complex degradation, and existing enhancement methods often encode all degradation factors within a single latent space. This leads to highly entangled features and strong black-box characteristics, making the model prone to shortcut learning. To mitigate the above issues, this paper proposes a wavelet-based low-light stereo image enhancement method with feature space decoupling. Our insight comes from the following findings: (1) Wavelet transform enables the independent processing of low-frequency and high-frequency information. (2) Illumination adjustment can be achieved by adjusting the low-frequency component of a low-light image, extracted through multi-level wavelet decomposition. Thus, by using wavelet transform the feature space is decomposed into a low-frequency branch for illumination adjustment and multiple high-frequency branches for texture enhancement. Additionally, stereo low-light image enhancement can extract useful cues from another view to improve enhancement. To this end, we propose a novel high-frequency guided cross-view interaction module (HF-CIM) that operates within high-frequency branches rather than across the entire feature space, effectively extracting valuable image details from the other view. Furthermore, to enhance the high-frequency information, a detail and texture enhancement module (DTEM) is proposed based on cross-attention mechanism. The model is trained on a dataset consisting of images with uniform illumination and images with non-uniform illumination. Experimental results on both real and synthetic images indicate that our algorithm offers significant advantages in light adjustment while effectively recovering high-frequency information. The code and dataset are publicly available at: https://github.com/Cherisherr/WDCI-Net.git.
- Abstract(参考訳): 低照度画像は複雑な劣化に悩まされ、既存の拡張法はしばしば1つの潜在空間内のすべての分解因子を符号化する。
これは、非常に絡み合った特徴と強力なブラックボックス特性をもたらし、モデルは学習をショートカットしがちである。
上記の問題を緩和するために,特徴空間デカップリングを用いたウェーブレットを用いた低照度ステレオ画像強調手法を提案する。
1)ウェーブレット変換は低周波・高周波情報の独立処理を可能にする。
2)マルチレベルウェーブレット分解により抽出した低照度画像の低周波成分を調整することで照明調整を行うことができる。
これにより、ウェーブレット変換を用いて、照明調整のための低周波分岐と、テクスチャ強化のための複数の高周波分岐に特徴空間を分解する。
さらに、立体低照度画像強調は、他の視点から有用な手がかりを抽出し、強化を改善することができる。
そこで本稿では,特徴空間全体ではなく,高周波数分岐内で動作可能な新しい高周波数ガイド型クロスビュー・インタラクション・モジュール(HF-CIM)を提案し,他のビューから有用な画像の詳細を効果的に抽出する。
さらに、高周波情報を強化するために、クロスアテンション機構に基づいてディテール・テクスチャ・エンハンスメント・モジュール(DTEM)を提案する。
このモデルは、均一な照明を持つ画像と一様でない照明を持つ画像からなるデータセットに基づいて訓練される。
実画像と合成画像の両方における実験結果から,このアルゴリズムは高周波数情報を効果的に復元しつつ,光の調整に有意な利点をもたらすことが示唆された。
コードとデータセットは、https://github.com/Cherisherr/WDCI-Net.git.comで公開されている。
関連論文リスト
- Learning Multi-scale Spatial-frequency Features for Image Denoising [58.883244886588336]
本稿では,マルチスケール適応型デュアルドメインネットワーク(MADNet)を提案する。
画像ピラミッド入力を用いて低解像度画像からノイズのない結果を復元する。
高周波情報と低周波情報の相互作用を実現するために,適応型空間周波数学習ユニットを設計する。
論文 参考訳(メタデータ) (2025-06-19T13:28:09Z) - Freqformer: Image-Demoiréing Transformer via Efficient Frequency Decomposition [83.40450475728792]
本稿では,Freqformerについて述べる。Freqformerは,ターゲット周波数分離による画像復号化に特化して設計されたトランスフォーマーベースのフレームワークである。
本手法は,モワールパターンを高周波数空間局在化テクスチャと低周波数スケールローバスト色歪みに明確に分割する有効な周波数分解を行う。
様々なデモアのベンチマーク実験により、Freqformerは、コンパクトなモデルサイズで最先端のパフォーマンスを達成することを示した。
論文 参考訳(メタデータ) (2025-05-25T12:23:10Z) - DLEN: Dual Branch of Transformer for Low-Light Image Enhancement in Dual Domains [0.0]
低照度画像強調(LLE)は、低照度条件下で撮影された画像の視覚的品質を改善することを目的としている。
これらの問題は、物体検出、顔認識、自律運転などのコンピュータビジョンタスクのパフォーマンスを妨げる。
本稿では,2つの異なる注意機構を組み込んだ新しいアーキテクチャであるDual Light Enhance Network(DLEN)を提案する。
論文 参考訳(メタデータ) (2025-01-21T15:58:16Z) - DMFourLLIE: Dual-Stage and Multi-Branch Fourier Network for Low-Light Image Enhancement [3.2286595119663266]
本稿では,DMFourLLIE(Dual-Stage Multi-Branch Fourier Low-Light Image Enhancement)フレームワークを提案する。
第1段階は、赤外線画像からの構造情報を統合し、位相成分を増強する。
第2段階は、堅牢な画像再構成のために、マルチスケールとフーリエの畳み込み枝を組み合わせたものである。
論文 参考訳(メタデータ) (2024-12-01T05:44:50Z) - Wave-Mamba: Wavelet State Space Model for Ultra-High-Definition Low-Light Image Enhancement [7.891750065129094]
ウェーブレット領域から導出される2つの重要な洞察に基づく新しいアプローチであるWave-Mambaを提案する。
提案手法は優れた性能を示し, 従来の先行技術を大きく上回っている。
論文 参考訳(メタデータ) (2024-08-02T14:01:34Z) - CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [97.95330185793358]
低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。
既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。
我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文 参考訳(メタデータ) (2024-04-08T07:34:39Z) - You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Low-light Stereo Image Enhancement and De-noising in the Low-frequency
Information Enhanced Image Space [5.1569866461097185]
同時に高音化・低音化を行う手法が提案されている。
低周波情報拡張モジュール (IEM) は雑音を抑え, 新たな画像空間を創出するために提案される。
長距離空間依存を符号化するために,チャネル間および空間コンテキスト情報マイニングモジュール(CSM)を提案する。
エンコーダ-デコーダ構造が構築され、クロスビューとクロススケールな特徴相互作用が組み込まれている。
論文 参考訳(メタデータ) (2024-01-15T15:03:32Z) - Seeing Through The Noisy Dark: Toward Real-world Low-Light Image
Enhancement and Denoising [125.56062454927755]
現実の低照度環境は通常、光やハードウェアの限界が不足しているため、視界が低く、騒音が重い。
我々は、RLED-Net(Real-world Low-light Enhancement & Denoising Network)と呼ばれる新しいエンドツーエンド手法を提案する。
論文 参考訳(メタデータ) (2022-10-02T14:57:23Z) - Cycle-Interactive Generative Adversarial Network for Robust Unsupervised
Low-Light Enhancement [109.335317310485]
CIGAN(Cycle-Interactive Generative Adversarial Network)は、低照度画像間の照明分布の転送を改善できるだけでなく、詳細な信号も操作できる。
特に、提案した低照度誘導変換は、低照度GAN生成器から劣化GAN生成器へ、低照度画像の特徴をフォワードする。
論文 参考訳(メタデータ) (2022-07-03T06:37:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。