論文の概要: FDCE-Net: Underwater Image Enhancement with Embedding Frequency and Dual Color Encoder
- arxiv url: http://arxiv.org/abs/2404.17936v1
- Date: Sat, 27 Apr 2024 15:16:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-30 18:32:14.063146
- Title: FDCE-Net: Underwater Image Enhancement with Embedding Frequency and Dual Color Encoder
- Title(参考訳): FDCE-Net:埋め込み周波数とデュアルカラーエンコーダによる水中画像強調
- Authors: Zheng Cheng, Guodong Fan, Jingchun Zhou, Min Gan, C. L. Philip Chen,
- Abstract要約: 水中画像は、低明度、色の変化、ぼやけた詳細、吸光光によるノイズ、水や懸濁粒子による散乱などの様々な問題に悩まされることが多い。
従来の水中画像強調法(UIE)は主に空間領域の強調に焦点を当てており、画像固有の周波数領域情報を無視している。
- 参考スコア(独自算出の注目度): 49.79611204954311
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater images often suffer from various issues such as low brightness, color shift, blurred details, and noise due to light absorption and scattering caused by water and suspended particles. Previous underwater image enhancement (UIE) methods have primarily focused on spatial domain enhancement, neglecting the frequency domain information inherent in the images. However, the degradation factors of underwater images are closely intertwined in the spatial domain. Although certain methods focus on enhancing images in the frequency domain, they overlook the inherent relationship between the image degradation factors and the information present in the frequency domain. As a result, these methods frequently enhance certain attributes of the improved image while inadequately addressing or even exacerbating other attributes. Moreover, many existing methods heavily rely on prior knowledge to address color shift problems in underwater images, limiting their flexibility and robustness. In order to overcome these limitations, we propose the Embedding Frequency and Dual Color Encoder Network (FDCE-Net) in our paper. The FDCE-Net consists of two main structures: (1) Frequency Spatial Network (FS-Net) aims to achieve initial enhancement by utilizing our designed Frequency Spatial Residual Block (FSRB) to decouple image degradation factors in the frequency domain and enhance different attributes separately. (2) To tackle the color shift issue, we introduce the Dual-Color Encoder (DCE). The DCE establishes correlations between color and semantic representations through cross-attention and leverages multi-scale image features to guide the optimization of adaptive color query. The final enhanced images are generated by combining the outputs of FS-Net and DCE through a fusion network. These images exhibit rich details, clear textures, low noise and natural colors.
- Abstract(参考訳): 水中画像は、低明度、色の変化、ぼやけた細部、水や懸濁粒子による光吸収や散乱によるノイズなど、様々な問題に悩まされることが多い。
従来の水中画像強調法(UIE)は主に空間領域の強調に焦点を当てており、画像固有の周波数領域情報を無視している。
しかし, 水中画像の劣化要因は空間領域に密接に絡み合っている。
特定の手法は周波数領域における画像の強調に重点を置いているが、画像劣化要因と周波数領域に存在する情報との固有の関係を見落としている。
その結果、これらの手法は他の属性に不適切な対応や悪化をしつつ、改善された画像の特定の属性を頻繁に強化する。
さらに、既存の多くの手法は、水中画像における色変化問題に対処するための事前知識に大きく依存しており、柔軟性と堅牢性を制限している。
これらの制約を克服するために,本論文では,埋め込み周波数とデュアルカラーエンコーダネットワーク(FDCE-Net)を提案する。
1)周波数空間ネットワーク(FS-Net)は、設計した周波数空間残留ブロック(FSRB)を利用して、周波数領域における画像劣化要因を分離し、異なる属性を別々に拡張することで、初期拡張を実現する。
2)カラーシフト問題に対処するため,デュアルカラーエンコーダ(DCE)を導入する。
DCEは、クロスアテンションを通じて色と意味表現の相関を確立し、適応的な色クエリの最適化を導くために、マルチスケールな画像特徴を活用する。
最終拡張画像は、融合ネットワークを介してFS-NetとDCEの出力を組み合わせて生成される。
これらの画像は、豊かな細部、鮮明なテクスチャ、低ノイズ、そして自然の色を示している。
関連論文リスト
- You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Wavelet-based Fourier Information Interaction with Frequency Diffusion
Adjustment for Underwater Image Restoration [6.185197290440237]
本稿では,周波数領域情報と拡散モデルの特徴をフル活用するWF-Diffを提案する。
WF-Diffは、ウェーブレットベースのフーリエ情報インタラクションネットワーク(WFI2-net)と周波数残差拡散調整モジュール(FRDAM)の2つの分離可能なネットワークで構成されている。
提案アルゴリズムは,実世界の水中画像データセット上でのSOTA性能を示し,視覚的品質の競争性能を実現する。
論文 参考訳(メタデータ) (2023-11-28T14:58:32Z) - Transmission and Color-guided Network for Underwater Image Enhancement [8.894719412298397]
水中画像強調のための適応透過・動的カラー誘導ネットワーク(ATDCnet)を提案する。
物理の知識を生かして,適応型トランスミッション指向モジュール(ATM)を設計し,ネットワークをより良く誘導する。
色偏差問題に対処するため,強調画像色を後処理する動的色誘導モジュール (DCM) を設計した。
論文 参考訳(メタデータ) (2023-08-09T11:43:54Z) - RSFDM-Net: Real-time Spatial and Frequency Domains Modulation Network
for Underwater Image Enhancement [5.3240763486073055]
水中画像における色や細部を効率的に拡張するためのリアルタイム空間・周波数領域変調ネットワーク(RSFDM-Net)を提案する。
提案した条件付きネットワークは,適応フーリエゲーティング機構 (AFGM) とマルチスケール・コントラルアテンションモジュール (MCAM) を用いて設計されている。
画像のカラーキャストと低彩度をより正確に補正するために、一次ネットに3分岐特徴抽出(TFE)ブロックを導入する。
論文 参考訳(メタデータ) (2023-02-23T17:27:05Z) - A Wavelet-based Dual-stream Network for Underwater Image Enhancement [11.178274779143209]
水中画像のカラーキャストやぼやけた細部に対処するウェーブレットベースのデュアルストリームネットワークを提案する。
離散ウェーブレット変換を用いて、入力画像を複数の周波数帯域に分解することで、これらのアーティファクトを別々に処理する。
提案手法を実環境および合成水中データセットの両方で検証し,計算複雑性の低い色補正およびぼかし除去におけるモデルの有効性を示した。
論文 参考訳(メタデータ) (2022-02-17T16:57:25Z) - TBNet:Two-Stream Boundary-aware Network for Generic Image Manipulation
Localization [49.521622399483846]
汎用画像操作のローカライゼーションのための新しいエンド・ツー・エンド2ストリーム境界対応ネットワーク(TBNet)を提案する。
提案したTBNetは、MCCとF1の両方の観点から、最先端の汎用画像操作のローカライズ手法を大幅に上回ることができる。
論文 参考訳(メタデータ) (2021-08-10T08:22:05Z) - WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。
WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。
低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文 参考訳(メタデータ) (2021-07-23T04:44:40Z) - Underwater Image Enhancement via Medium Transmission-Guided Multi-Color
Space Embedding [88.46682991985907]
本稿では,Ucolor と呼ばれる媒体透過誘導多色空間埋め込みによる水中画像強調ネットワークを提案する。
当社のネットワークは、複数の色空間を埋め込むことにより、水中画像の視覚的品質を効果的に改善できます。
論文 参考訳(メタデータ) (2021-04-27T07:35:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。