論文の概要: A Non-Uniform Low-Light Image Enhancement Method with Multi-Scale
Attention Transformer and Luminance Consistency Loss
- arxiv url: http://arxiv.org/abs/2312.16498v1
- Date: Wed, 27 Dec 2023 10:07:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-29 19:17:59.349927
- Title: A Non-Uniform Low-Light Image Enhancement Method with Multi-Scale
Attention Transformer and Luminance Consistency Loss
- Title(参考訳): マルチスケールアテンショントランスと輝度整合損失を考慮した非均一低光画像強調法
- Authors: Xiao Fang, Xin Gao, Baofeng Li, Feng Zhai, Yu Qin, Zhihang Meng,
Jiansheng Lu, Chun Xiao
- Abstract要約: 低照度画像強調は、薄暗い環境で収集された画像の知覚を改善することを目的としている。
既存の方法では、識別された輝度情報を適応的に抽出することができず、露光過多や露光過多を容易に引き起こすことができる。
MSATrというマルチスケールアテンション変換器を提案し,光バランスの局所的・グローバル的特徴を十分に抽出し,視覚的品質を向上させる。
- 参考スコア(独自算出の注目度): 11.585269110131659
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Low-light image enhancement aims to improve the perception of images
collected in dim environments and provide high-quality data support for image
recognition tasks. When dealing with photos captured under non-uniform
illumination, existing methods cannot adaptively extract the differentiated
luminance information, which will easily cause over-exposure and
under-exposure. From the perspective of unsupervised learning, we propose a
multi-scale attention Transformer named MSATr, which sufficiently extracts
local and global features for light balance to improve the visual quality.
Specifically, we present a multi-scale window division scheme, which uses
exponential sequences to adjust the window size of each layer. Within
different-sized windows, the self-attention computation can be refined,
ensuring the pixel-level feature processing capability of the model. For
feature interaction across windows, a global transformer branch is constructed
to provide comprehensive brightness perception and alleviate exposure problems.
Furthermore, we propose a loop training strategy, using the diverse images
generated by weighted mixing and a luminance consistency loss to improve the
model's generalization ability effectively. Extensive experiments on several
benchmark datasets quantitatively and qualitatively prove that our MSATr is
superior to state-of-the-art low-light image enhancement methods, and the
enhanced images have more natural brightness and outstanding details. The code
is released at https://github.com/fang001021/MSATr.
- Abstract(参考訳): 低照度画像強調は、薄暗い環境で収集された画像の知覚を改善し、画像認識タスクのための高品質なデータサポートを提供することを目的としている。
非均一照明下で撮影された写真を扱う場合、既存の方法では区別された輝度情報を適応的に抽出することはできない。
教師なし学習の観点からは,光バランスのための局所的特徴と全体的特徴を十分に抽出し,視覚品質を向上させるマルチスケールアテンショントランスフォーマを提案する。
具体的には,各層のウィンドウサイズを調整するために指数列を用いたマルチスケールウィンドウ分割スキームを提案する。
異なるサイズのウィンドウ内では、自己注意計算が洗練され、モデルのピクセルレベルの特徴処理能力が保証される。
ウィンドウ間の機能インタラクションのために、グローバルトランスフォーマーブランチが構築され、包括的な輝度知覚と露出問題を緩和する。
さらに,重み付き混合により生成された多彩な画像と輝度整合性損失を用いて,モデルの一般化能力を効果的に改善するループトレーニング戦略を提案する。
いくつかのベンチマークデータセットに対する大規模な実験は、我々のMSATrが最先端の低照度画像強調法よりも優れていることを定量的に定性的に証明している。
コードはhttps://github.com/fang001021/msatrでリリースされる。
関連論文リスト
- Semi-LLIE: Semi-supervised Contrastive Learning with Mamba-based Low-light Image Enhancement [59.17372460692809]
本研究は、平均教師による半教師付き低照度強化(Semi-LLIE)フレームワークを提案する。
照度分布を忠実に伝達するために、意味認識によるコントラスト損失を導入し、自然色による画像の強調に寄与する。
また,大規模な視覚言語認識モデル(RAM)に基づく新たな知覚損失を提案し,よりリッチなテキストによる画像生成を支援する。
論文 参考訳(メタデータ) (2024-09-25T04:05:32Z) - ALEN: A Dual-Approach for Uniform and Non-Uniform Low-Light Image Enhancement [6.191556429706728]
不適切な照明は、情報損失や画質の低下を招き、監視などの様々な応用に影響を及ぼす可能性がある。
現在のエンハンスメント技術は、しばしば特定のデータセットを使用して低照度画像を強化するが、様々な現実世界の条件に適応する際の課題は残る。
アダプティブ・ライト・エンハンスメント・ネットワーク (ALEN) を導入し、その主なアプローチは、ローカル照明とグローバル照明の強化が必要であるかどうかを決定するための分類機構を使用することである。
論文 参考訳(メタデータ) (2024-07-29T05:19:23Z) - CodeEnhance: A Codebook-Driven Approach for Low-Light Image Enhancement [97.95330185793358]
低照度画像強調(LLIE)は、低照度画像を改善することを目的としている。
既存の手法では、様々な明るさ劣化からの回復の不確実性と、テクスチャと色情報の喪失という2つの課題に直面している。
我々は、量子化された先行値と画像の精細化を利用して、新しいエンハンスメント手法、CodeEnhanceを提案する。
論文 参考訳(メタデータ) (2024-04-08T07:34:39Z) - Dimma: Semi-supervised Low Light Image Enhancement with Adaptive Dimming [0.728258471592763]
自然色を維持しながら低照度画像を強調することは、カメラ処理のバリエーションによって難しい問題である。
そこで我々はDimmaを提案する。Dimmaは、画像対の小さなセットを利用して、任意のカメラと整合する半教師付きアプローチである。
そこで我々は,照明の違いに基づいて,シーンの歪み色を生成する畳み込み混合密度ネットワークを導入することで実現した。
論文 参考訳(メタデータ) (2023-10-14T17:59:46Z) - Improving Lens Flare Removal with General Purpose Pipeline and Multiple
Light Sources Recovery [69.71080926778413]
フレアアーティファクトは、画像の視覚的品質と下流のコンピュータビジョンタスクに影響を与える。
現在の方法では、画像信号処理パイプラインにおける自動露光やトーンマッピングは考慮されていない。
本稿では、ISPを再検討し、より信頼性の高い光源回収戦略を設計することで、レンズフレア除去性能を向上させるソリューションを提案する。
論文 参考訳(メタデータ) (2023-08-31T04:58:17Z) - Low-Light Image Enhancement with Illumination-Aware Gamma Correction and
Complete Image Modelling Network [69.96295927854042]
低照度環境は通常、情報の少ない大規模な暗黒地帯に繋がる。
本稿では,ガンマ補正の有効性を深層ネットワークのモデリング能力と統合することを提案する。
指数関数演算は高い計算複雑性をもたらすので、Taylor Series を用いてガンマ補正を近似することを提案する。
論文 参考訳(メタデータ) (2023-08-16T08:46:51Z) - LRT: An Efficient Low-Light Restoration Transformer for Dark Light Field
Images [9.926231893220063]
近年の低照度化のための学習手法には欠点がある。
LF画像に対する効率的な低照度復元変換器(LRT)を提案する。
提案手法は,低照度かつノイズの多いLF画像の復元において,優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2022-09-06T03:23:58Z) - Degrade is Upgrade: Learning Degradation for Low-light Image Enhancement [52.49231695707198]
2段階の工程で細部と色を精錬しながら、内在的な劣化と低照度画像を照らし出す。
カラー画像の定式化に触発されて,まず低照度入力からの劣化を推定し,環境照明色の歪みをシミュレーションし,そのコンテンツを精錬して拡散照明色の損失を回復した。
LOL1000データセットではPSNRで0.95dB、ExDarkデータセットでは3.18%のmAPでSOTAを上回った。
論文 参考訳(メタデータ) (2021-03-19T04:00:27Z) - Unsupervised Low-light Image Enhancement with Decoupled Networks [103.74355338972123]
我々は、実世界の低照度画像を教師なしで拡張する2段階のGANベースのフレームワークを学習する。
提案手法は,照度向上と雑音低減の両面から,最先端の教師なし画像強調法より優れる。
論文 参考訳(メタデータ) (2020-05-06T13:37:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。