論文の概要: DEFormer: DCT-driven Enhancement Transformer for Low-light Image and
Dark Vision
- arxiv url: http://arxiv.org/abs/2309.06941v1
- Date: Wed, 13 Sep 2023 13:24:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 14:10:28.957085
- Title: DEFormer: DCT-driven Enhancement Transformer for Low-light Image and
Dark Vision
- Title(参考訳): DEFormer:低照度画像と暗視のためのDCT駆動強化トランス
- Authors: Xiangchen Yin, Zhenda Yu, Xin Gao, Ran Ju, Xiao Sun, Xinyu Zhang
- Abstract要約: ネットワークに新しい手がかりとして周波数を導入し、新しいDCT駆動拡張変換器(DEFormer)を提案する。
まず、DCT処理と曲率に基づく周波数強調(CFE)を含む周波数拡張のための学習可能な周波数分岐(LFB)を提案する。
さらに,RGB領域と周波数領域の差を低減するために,クロスドメイン融合(CDF)を提案する。
- 参考スコア(独自算出の注目度): 18.50322099227639
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The goal of low-light image enhancement is to restore the color and details
of the image and is of great significance for high-level visual tasks in
autonomous driving. However, it is difficult to restore the lost details in the
dark area by relying only on the RGB domain. In this paper we introduce
frequency as a new clue into the network and propose a novel DCT-driven
enhancement transformer (DEFormer). First, we propose a learnable frequency
branch (LFB) for frequency enhancement contains DCT processing and
curvature-based frequency enhancement (CFE). CFE calculates the curvature of
each channel to represent the detail richness of different frequency bands,
then we divides the frequency features, which focuses on frequency bands with
richer textures. In addition, we propose a cross domain fusion (CDF) for
reducing the differences between the RGB domain and the frequency domain. We
also adopt DEFormer as a preprocessing in dark detection, DEFormer effectively
improves the performance of the detector, bringing 2.1% and 3.4% improvement in
ExDark and DARK FACE datasets on mAP respectively.
- Abstract(参考訳): 低照度画像強調の目標は、画像の色と詳細を復元することであり、自律運転における高レベル視覚タスクにおいて非常に重要である。
しかし,rgbドメインのみに依存して暗黒領域の失われた詳細を復元することは困難である。
本稿では,ネットワークに新たな手がかりとして周波数を導入し,新しいDCT駆動拡張トランス (DEFormer) を提案する。
まず、DCT処理と曲率に基づく周波数強調(CFE)を含む周波数拡張のための学習可能な周波数分岐(LFB)を提案する。
CFEは、各チャネルの曲率を計算し、異なる周波数帯域の細部を表現し、より豊かなテクスチャを持つ周波数帯域に焦点を当てた周波数特徴を分割する。
さらに,RGB領域と周波数領域の差を低減するために,クロスドメイン融合(CDF)を提案する。
また,デフォーマをダーク検出の前処理として採用し,デフォーマは検出器の性能を効果的に向上させ,マップ上のexdarkとdark faceデータセットをそれぞれ2.1%,3.4%改善した。
関連論文リスト
- FreqINR: Frequency Consistency for Implicit Neural Representation with Adaptive DCT Frequency Loss [5.349799154834945]
本稿では、新しい任意スケール超解像法であるFreqINR(FreqINR)について述べる。
トレーニングでは,適応離散コサイン変換周波数損失(adaptive Discrete Cosine Transform Frequency Loss,ADFL)を用いて,HR画像と地絡画像の周波数ギャップを最小化する。
推論の際には,低分解能(LR)画像と地軸画像のスペクトルコヒーレンスを維持するために受容場を拡張した。
論文 参考訳(メタデータ) (2024-08-25T03:53:17Z) - FDCE-Net: Underwater Image Enhancement with Embedding Frequency and Dual Color Encoder [49.79611204954311]
水中画像は、低明度、色の変化、ぼやけた詳細、吸光光によるノイズ、水や懸濁粒子による散乱などの様々な問題に悩まされることが多い。
従来の水中画像強調法(UIE)は主に空間領域の強調に焦点を当てており、画像固有の周波数領域情報を無視している。
論文 参考訳(メタデータ) (2024-04-27T15:16:34Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Frequency Domain Modality-invariant Feature Learning for
Visible-infrared Person Re-Identification [79.9402521412239]
本稿では、周波数領域から見たモダリティの相違を低減するために、新しい周波数領域モダリティ不変特徴学習フレームワーク(FDMNet)を提案する。
我々のフレームワークでは、インスタンス適応振幅フィルタ(IAF)とPhrase-Preserving Normalization(PPNorm)という、2つの新しいモジュールを導入している。
論文 参考訳(メタデータ) (2024-01-03T17:11:27Z) - Low-Light Enhancement in the Frequency Domain [24.195131201768096]
低照度画像には、可視性、高密度ノイズ、偏光色がよく見られる。
周波数領域で学習した新しい残差多重ウェーブレット畳み込みニューラルネットワークR2-MWCNNを提案する。
このエンドツーエンドのトレーニング可能なネットワークは、マルチレベル離散ウェーブレット変換を使用して入力特徴写像を異なる周波数に分割し、より優れたノイズの影響をもたらす。
論文 参考訳(メタデータ) (2023-06-29T08:39:34Z) - Symmetric Uncertainty-Aware Feature Transmission for Depth
Super-Resolution [52.582632746409665]
カラー誘導DSRのためのSymmetric Uncertainty-aware Feature Transmission (SUFT)を提案する。
本手法は最先端の手法と比較して優れた性能を実現する。
論文 参考訳(メタデータ) (2023-06-01T06:35:59Z) - RSFDM-Net: Real-time Spatial and Frequency Domains Modulation Network
for Underwater Image Enhancement [5.3240763486073055]
水中画像における色や細部を効率的に拡張するためのリアルタイム空間・周波数領域変調ネットワーク(RSFDM-Net)を提案する。
提案した条件付きネットワークは,適応フーリエゲーティング機構 (AFGM) とマルチスケール・コントラルアテンションモジュール (MCAM) を用いて設計されている。
画像のカラーキャストと低彩度をより正確に補正するために、一次ネットに3分岐特徴抽出(TFE)ブロックを導入する。
論文 参考訳(メタデータ) (2023-02-23T17:27:05Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z) - Thermal Image Super-Resolution Using Second-Order Channel Attention with
Varying Receptive Fields [4.991042925292453]
熱画像の効率よく再構成するシステムを提案する。
熱画像の復元は、安全、捜索、救助、軍事活動を含む用途に不可欠である。
論文 参考訳(メタデータ) (2021-07-30T22:17:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。