論文の概要: Structure-guided Diffusion Transformer for Low-Light Image Enhancement
- arxiv url: http://arxiv.org/abs/2504.15054v1
- Date: Mon, 21 Apr 2025 12:30:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-29 16:36:06.530442
- Title: Structure-guided Diffusion Transformer for Low-Light Image Enhancement
- Title(参考訳): 低光像強調のための構造誘導拡散変圧器
- Authors: Xiangchen Yin, Zhenda Yu, Longtao Jiang, Xin Gao, Xiao Sun, Zhi Liu, Xun Yang,
- Abstract要約: 我々は、低光強調タスクにDiTを導入し、新しい構造誘導拡散変換器に基づく低光強調フレームワークを設計する。
ウェーブレット変換により特徴量を圧縮し、モデルの推論効率を改善し、多方向周波数帯域を捕捉する。
さらに,構造誘導型注意ブロック(SAB)を提案し,テクスチャに富んだトークンに注意を払い,ノイズ予測におけるノイズ領域からの干渉を避ける。
- 参考スコア(独自算出の注目度): 19.90700077104533
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While the diffusion transformer (DiT) has become a focal point of interest in recent years, its application in low-light image enhancement remains a blank area for exploration. Current methods recover the details from low-light images while inevitably amplifying the noise in images, resulting in poor visual quality. In this paper, we firstly introduce DiT into the low-light enhancement task and design a novel Structure-guided Diffusion Transformer based Low-light image enhancement (SDTL) framework. We compress the feature through wavelet transform to improve the inference efficiency of the model and capture the multi-directional frequency band. Then we propose a Structure Enhancement Module (SEM) that uses structural prior to enhance the texture and leverages an adaptive fusion strategy to achieve more accurate enhancement effect. In Addition, we propose a Structure-guided Attention Block (SAB) to pay more attention to texture-riched tokens and avoid interference from noisy areas in noise prediction. Extensive qualitative and quantitative experiments demonstrate that our method achieves SOTA performance on several popular datasets, validating the effectiveness of SDTL in improving image quality and the potential of DiT in low-light enhancement tasks.
- Abstract(参考訳): 近年,拡散変圧器 (DiT) が注目されているが, 低照度画像強調への応用はいまだに探索の空白領域である。
現在の方法では、画像のノイズを増幅しながら、低照度画像から詳細を復元し、視覚的品質が低下する。
本稿では、まず、低光強調タスクにDiTを導入し、新しい構造誘導拡散変換器に基づく低光強調(SDTL)フレームワークを設計する。
ウェーブレット変換により特徴量を圧縮し、モデルの推論効率を改善し、多方向周波数帯域を捕捉する。
そこで我々は, テクスチャの強化に先立って構造を用いた構造拡張モジュール (SEM) を提案し, より正確な拡張効果を実現するために, 適応的な融合戦略を活用する。
付加法では,テクスチャに富んだトークンに注意を払い,ノイズ予測におけるノイズ領域からの干渉を避けるために,SAB(Structure-guided Attention Block)を提案する。
広汎な定性的および定量的実験により、SDTLが低照度化タスクにおける画質向上とDiTの可能性を向上させることの有効性を検証し、いくつかの一般的なデータセット上でSOTA性能を達成することを示した。
関連論文リスト
- DLEN: Dual Branch of Transformer for Low-Light Image Enhancement in Dual Domains [0.0]
低照度画像強調(LLE)は、低照度条件下で撮影された画像の視覚的品質を改善することを目的としている。
これらの問題は、物体検出、顔認識、自律運転などのコンピュータビジョンタスクのパフォーマンスを妨げる。
本稿では,2つの異なる注意機構を組み込んだ新しいアーキテクチャであるDual Light Enhance Network(DLEN)を提案する。
論文 参考訳(メタデータ) (2025-01-21T15:58:16Z) - Unveiling Advanced Frequency Disentanglement Paradigm for Low-Light Image Enhancement [61.22119364400268]
周波数不整合最適化を改良した新しい低周波整合性手法を提案する。
注目すべき改善点は5つの人気のあるベンチマークで示されており、6つの最先端モデルで達成されたPSNRの7.68dBのゲインである。
提案手法は,88K余剰パラメータで効率を保ち,低照度画像強調の挑戦的な領域に新たな標準を設定する。
論文 参考訳(メタデータ) (2024-09-03T06:19:03Z) - CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [97.95330185793358]
低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。
既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。
我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文 参考訳(メタデータ) (2024-04-08T07:34:39Z) - Low-light Image Enhancement via CLIP-Fourier Guided Wavelet Diffusion [28.049668999586583]
本稿では,CLIP-Fourier Guided Wavelet Diffusion(CFWD)による新しい低照度画像強調手法を提案する。
CFWDは、複数のウェーブレット変換によって生成される周波数領域空間におけるマルチモーダル視覚言語情報を活用して、拡張プロセスの導出を行う。
提案手法は既存の最先端手法よりも優れ,画像品質と雑音抑制の大幅な進歩を実現している。
論文 参考訳(メタデータ) (2024-01-08T10:08:48Z) - A Non-Uniform Low-Light Image Enhancement Method with Multi-Scale
Attention Transformer and Luminance Consistency Loss [11.585269110131659]
低照度画像強調は、薄暗い環境で収集された画像の知覚を改善することを目的としている。
既存の方法では、識別された輝度情報を適応的に抽出することができず、露光過多や露光過多を容易に引き起こすことができる。
MSATrというマルチスケールアテンション変換器を提案し,光バランスの局所的・グローバル的特徴を十分に抽出し,視覚的品質を向上させる。
論文 参考訳(メタデータ) (2023-12-27T10:07:11Z) - LDM-ISP: Enhancing Neural ISP for Low Light with Latent Diffusion Models [54.93010869546011]
本稿では,事前学習した潜伏拡散モデルを用いて,超低照度画像の高精細化のためのニューラルISPを実現することを提案する。
具体的には、RAWドメイン上で動作するために事前訓練された潜在拡散モデルを調整するために、軽量なテーミングモジュールのセットをトレーニングする。
遅延拡散モデルにおけるUNet復調と復号化の異なる役割を観察し、低照度画像強調タスクを遅延空間低周波コンテンツ生成と復号位相高周波ディテール保守に分解するきっかけとなる。
論文 参考訳(メタデータ) (2023-12-02T04:31:51Z) - Enhancing Low-light Light Field Images with A Deep Compensation Unfolding Network [52.77569396659629]
本稿では,低光環境下で撮像した光場(LF)画像の復元に,DCUNet(Deep compensation network openfolding)を提案する。
このフレームワークは、中間拡張結果を使用して照明マップを推定し、展開プロセスで新しい拡張結果を生成する。
本稿では,LF画像の特徴を適切に活用するために,擬似明示的特徴相互作用モジュールを提案する。
論文 参考訳(メタデータ) (2023-08-10T07:53:06Z) - Cycle-Interactive Generative Adversarial Network for Robust Unsupervised
Low-Light Enhancement [109.335317310485]
CIGAN(Cycle-Interactive Generative Adversarial Network)は、低照度画像間の照明分布の転送を改善できるだけでなく、詳細な信号も操作できる。
特に、提案した低照度誘導変換は、低照度GAN生成器から劣化GAN生成器へ、低照度画像の特徴をフォワードする。
論文 参考訳(メタデータ) (2022-07-03T06:37:46Z) - Unsupervised Low-light Image Enhancement with Decoupled Networks [103.74355338972123]
我々は、実世界の低照度画像を教師なしで拡張する2段階のGANベースのフレームワークを学習する。
提案手法は,照度向上と雑音低減の両面から,最先端の教師なし画像強調法より優れる。
論文 参考訳(メタデータ) (2020-05-06T13:37:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。