論文の概要: Towards Scale-Aware Low-Light Enhancement via Structure-Guided Transformer Design
- arxiv url: http://arxiv.org/abs/2504.14075v1
- Date: Fri, 18 Apr 2025 20:57:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-30 05:23:32.260673
- Title: Towards Scale-Aware Low-Light Enhancement via Structure-Guided Transformer Design
- Title(参考訳): 構造誘導型変圧器設計によるスケールアウェア低照度化に向けて
- Authors: Wei Dong, Yan Min, Han Zhou, Jun Chen,
- Abstract要約: 現在の低照度画像強調(LLIE)技術は、ローライト(LL)からノーマルライト(NL)へのマッピングや、セマンティックな特徴や照明マップからのガイダンスに依存している。
SG-LLIEはCNN-Transformerのマルチスケールなハイブリッドフレームワークである。
NTIRE 2025 Low-Light Enhancement Challengeで2位にランクインした。
- 参考スコア(独自算出の注目度): 13.587511215001115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current Low-light Image Enhancement (LLIE) techniques predominantly rely on either direct Low-Light (LL) to Normal-Light (NL) mappings or guidance from semantic features or illumination maps. Nonetheless, the intrinsic ill-posedness of LLIE and the difficulty in retrieving robust semantics from heavily corrupted images hinder their effectiveness in extremely low-light environments. To tackle this challenge, we present SG-LLIE, a new multi-scale CNN-Transformer hybrid framework guided by structure priors. Different from employing pre-trained models for the extraction of semantics or illumination maps, we choose to extract robust structure priors based on illumination-invariant edge detectors. Moreover, we develop a CNN-Transformer Hybrid Structure-Guided Feature Extractor (HSGFE) module at each scale with in the UNet encoder-decoder architecture. Besides the CNN blocks which excels in multi-scale feature extraction and fusion, we introduce a Structure-Guided Transformer Block (SGTB) in each HSGFE that incorporates structural priors to modulate the enhancement process. Extensive experiments show that our method achieves state-of-the-art performance on several LLIE benchmarks in both quantitative metrics and visual quality. Our solution ranks second in the NTIRE 2025 Low-Light Enhancement Challenge. Code is released at https://github.com/minyan8/imagine.
- Abstract(参考訳): 現在の低照度画像強調(LLIE)技術は、直接の低照度(LL)から標準照度(NL)マッピング、あるいは意味的特徴や照明マップからのガイダンスに大きく依存している。
それでも、LLIEの本質的な不備と、重く劣化した画像からロバストなセマンティクスを取得することの難しさは、極めて低照度環境での有効性を妨げている。
この課題に対処するために,構造先行によってガイドされる新しいマルチスケールCNN-TransformerハイブリッドフレームワークであるSG-LLIEを提案する。
セマンティクスや照明マップの抽出に事前学習したモデルと異なり、照明不変エッジ検出器に基づいて頑健な構造を抽出する。
さらに、UNetエンコーダ・デコーダアーキテクチャを用いて、CNN-Transformer Hybrid Structure-Guided Feature Extractor (HSGFE) モジュールを各スケールで開発する。
マルチスケールの特徴抽出と融合に優れるCNNブロックの他に,各HSGFEに構造先行を組み込んだ構造誘導変圧器ブロック(Structure-Guided Transformer Block, SGTB)を導入する。
広汎な実験により,数個のLLIEベンチマークにおいて,測定値と視覚的品質の両面で最先端の性能が得られた。
NTIRE 2025 Low-Light Enhancement Challengeで2位にランクインした。
コードはhttps://github.com/minyan8/imagine.comで公開されている。
関連論文リスト
- DLEN: Dual Branch of Transformer for Low-Light Image Enhancement in Dual Domains [0.0]
低照度画像強調(LLE)は、低照度条件下で撮影された画像の視覚的品質を改善することを目的としている。
これらの問題は、物体検出、顔認識、自律運転などのコンピュータビジョンタスクのパフォーマンスを妨げる。
本稿では,2つの異なる注意機構を組み込んだ新しいアーキテクチャであるDual Light Enhance Network(DLEN)を提案する。
論文 参考訳(メタデータ) (2025-01-21T15:58:16Z) - GLARE: Low Light Image Enhancement via Generative Latent Feature based Codebook Retrieval [80.96706764868898]
我々は、GLARE(Generative LAtent Feature based codebook Retrieval)を介して、新しい低照度画像強調(LLIE)ネットワークを提案する。
Invertible Latent Normalizing Flow (I-LNF) モジュールを開発し、LL特徴分布をNL潜在表現に整合させ、コードブック内の正しいコード検索を保証する。
さまざまなベンチマークデータセットと実世界のデータに対するGLAREの優れたパフォーマンスを確認する実験。
論文 参考訳(メタデータ) (2024-07-17T09:40:15Z) - Lumina-Next: Making Lumina-T2X Stronger and Faster with Next-DiT [120.39362661689333]
本稿では,Lumina-T2Xの改良版を提案する。
これらの改善により、Lumina-Nextは基本的なテキスト・ツー・イメージ生成の品質と効率を向上するだけでなく、優れた解像度の補間能力も示している。
論文 参考訳(メタデータ) (2024-06-05T17:53:26Z) - CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [97.95330185793358]
低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。
既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。
我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文 参考訳(メタデータ) (2024-04-08T07:34:39Z) - VQCNIR: Clearer Night Image Restoration with Vector-Quantized Codebook [16.20461368096512]
夜景撮影は、暗い環境や長時間の露光から生じる、暗い光やぼやけなどの課題に苦しむことが多い。
私たちは、データ駆動の高品質な事前処理の強みを信じ、手動による事前処理の制限を回避するために、信頼性と一貫性のある事前処理の提供に努めています。
VQCNIR(Vector-Quantized Codebook)を用いたClearer Night Image Restorationを提案する。
論文 参考訳(メタデータ) (2023-12-14T02:16:27Z) - Retinexformer: One-stage Retinex-based Transformer for Low-light Image
Enhancement [96.09255345336639]
低照度画像の高精細化のために,原理化された1段Retinex-based Framework (ORF) を定式化する。
ORFはまず照明情報を推定し、低照度画像を照らす。
我々のアルゴリズムであるRetinexformerは13のベンチマークで最先端の手法を大幅に上回っている。
論文 参考訳(メタデータ) (2023-03-12T16:54:08Z) - Ultra-High-Definition Low-Light Image Enhancement: A Benchmark and
Transformer-Based Method [51.30748775681917]
低照度画像強調(LLIE)の課題を考察し,4K解像度と8K解像度の画像からなる大規模データベースを導入する。
我々は、系統的なベンチマーク研究を行い、現在のLLIEアルゴリズムと比較する。
第2のコントリビューションとして,変換器をベースとした低照度化手法であるLLFormerを紹介する。
論文 参考訳(メタデータ) (2022-12-22T09:05:07Z) - Toward Fast, Flexible, and Robust Low-Light Image Enhancement [87.27326390675155]
我々は、現実の低照度シナリオにおいて、高速でフレキシブルで頑健な鮮明化のための新しい自己校正イルミネーション(SCI)学習フレームワークを開発した。
カスケードパターンの計算負担を考慮すると、各ステージの結果の収束を実現する自己校正モジュールを構築する。
我々は,SCI固有の特性について,操作不感適応性やモデル非関係の一般性を含む包括的探索を行う。
論文 参考訳(メタデータ) (2022-04-21T14:40:32Z) - Learning Deep Context-Sensitive Decomposition for Low-Light Image
Enhancement [58.72667941107544]
典型的なフレームワークは、照明と反射を同時に推定することであるが、特徴空間にカプセル化されたシーンレベルの文脈情報を無視する。
本研究では,空間スケールにおけるシーンレベルのコンテキスト依存を生かした,コンテキスト依存型分解ネットワークアーキテクチャを提案する。
チャネル数を減らして軽量なCSDNet(LiteCSDNet)を開発する。
論文 参考訳(メタデータ) (2021-12-09T06:25:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。