論文の概要: PDCFNet: Enhancing Underwater Images through Pixel Difference Convolution
- arxiv url: http://arxiv.org/abs/2409.19269v1
- Date: Sat, 28 Sep 2024 06:56:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-06 00:08:33.420318
- Title: PDCFNet: Enhancing Underwater Images through Pixel Difference Convolution
- Title(参考訳): PDCFNet: ピクセル差分畳み込みによる水中画像の強化
- Authors: Song Zhang, Daoliang Li, Ran Zhao,
- Abstract要約: 本稿では,Pixel Different Convolution (PDC) とクロスレベル機能融合に基づく水中画像強調ネットワークPDCFNetを提案する。
提案するPDCFNetは,UIEBデータセット上でのPSNR27.37とSSIM92.02を達成し,これまでで最高の性能を実現する。
- 参考スコア(独自算出の注目度): 6.784182824431334
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Majority of deep learning methods utilize vanilla convolution for enhancing underwater images. While vanilla convolution excels in capturing local features and learning the spatial hierarchical structure of images, it tends to smooth input images, which can somewhat limit feature expression and modeling. A prominent characteristic of underwater degraded images is blur, and the goal of enhancement is to make the textures and details (high-frequency features) in the images more visible. Therefore, we believe that leveraging high-frequency features can improve enhancement performance. To address this, we introduce Pixel Difference Convolution (PDC), which focuses on gradient information with significant changes in the image, thereby improving the modeling of enhanced images. We propose an underwater image enhancement network, PDCFNet, based on PDC and cross-level feature fusion. Specifically, we design a detail enhancement module based on PDC that employs parallel PDCs to capture high-frequency features, leading to better detail and texture enhancement. The designed cross-level feature fusion module performs operations such as concatenation and multiplication on features from different levels, ensuring sufficient interaction and enhancement between diverse features. Our proposed PDCFNet achieves a PSNR of 27.37 and an SSIM of 92.02 on the UIEB dataset, attaining the best performance to date. Our code is available at https://github.com/zhangsong1213/PDCFNet.
- Abstract(参考訳): 深層学習法の大部分は、水中画像の強化にバニラ畳み込みを利用している。
バニラ畳み込みは、局所的な特徴を捉え、画像の空間的階層構造を学ぶのに優れるが、スムーズな入力画像の傾向があり、特徴表現やモデリングを幾分制限する。
水中劣化画像の顕著な特徴はぼやけており、画像のテクスチャや細部(高周波の特徴)をより鮮明にすることを目的としている。
そのため,周波数特性の活用により性能の向上が期待できる。
これを解決するために、画像に重要な変化を伴う勾配情報に焦点を当てたPixel Difference Convolution (PDC)を導入し、改良された画像のモデリングを改善する。
PDCとクロスレベル特徴融合に基づく水中画像強調ネットワークPDCFNetを提案する。
具体的には、並列PDCを用いて高周波数特徴を捕捉し、ディテールとテクスチャを向上するPDCに基づくディテールエンハンスメントモジュールを設計する。
設計されたクロスレベル機能融合モジュールは、異なるレベルの機能に対する結合や乗算のような操作を行い、多様な機能間の十分な相互作用と強化を保証する。
提案するPDCFNetは,UIEBデータセット上でのPSNR27.37とSSIM92.02を達成し,これまでで最高の性能を実現する。
私たちのコードはhttps://github.com/zhangsong1213/PDCFNetで利用可能です。
関連論文リスト
- Multi-scale Frequency Enhancement Network for Blind Image Deblurring [7.198959621445282]
視覚障害者のためのマルチスケール周波数拡張ネットワーク(MFENet)を提案する。
ぼやけた画像のマルチスケール空間およびチャネル情報をキャプチャするために,深度的に分離可能な畳み込みに基づくマルチスケール特徴抽出モジュール(MS-FE)を導入する。
提案手法は,視覚的品質と客観的評価の両指標において,優れた劣化性能を達成できることを実証する。
論文 参考訳(メタデータ) (2024-11-11T11:49:18Z) - Multi-Level Feature Fusion Network for Lightweight Stereo Image Super-Resolution [12.066710423371559]
軽量ステレオ画像超解像(MFFSSR)のための効率的なマルチレベル特徴融合ネットワークを提案する。
MFFSSRは、ハイブリットアテンション特徴抽出ブロック(HAFEB)を使用して、マルチレベルなイントラビュー特徴を抽出する。
より少ないパラメータで優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-05-09T02:01:51Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - Pixel-Aware Stable Diffusion for Realistic Image Super-resolution and Personalized Stylization [23.723573179119228]
本稿では,高機能なReal-ISRとパーソナライズされた画像スタイリングを実現するために,画素対応安定拡散(PASD)ネットワークを提案する。
画素単位の画像局所構造を知覚する拡散モデルを実現するために、画素対応クロスアテンションモジュールを導入する。
補正可能なノイズスケジュールを導入し、画像復元結果をさらに改善する。
論文 参考訳(メタデータ) (2023-08-28T10:15:57Z) - Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。
また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文 参考訳(メタデータ) (2022-11-19T07:50:34Z) - Adaptive Local Implicit Image Function for Arbitrary-scale
Super-resolution [61.95533972380704]
局所暗黙画像関数(LIIF)は、対応する座標を入力として、画素値が拡張される連続関数として画像を表す。
LIIFは任意のスケールの超解像タスクに適用でき、その結果、様々なアップスケーリング要因に対して単一の効率的かつ効率的なモデルが得られる。
この問題を軽減するために,新しい適応型局所像関数(A-LIIF)を提案する。
論文 参考訳(メタデータ) (2022-08-07T11:23:23Z) - Controllable Image Enhancement [66.18525728881711]
いくつかのパラメータを制御して、複数のスタイルで高品質な画像を生成できる半自動画像強調アルゴリズムを提案する。
エンコーダ・デコーダフレームワークは、リタッチスキルを潜在コードにエンコードし、イメージ信号処理機能のパラメータにデコードする。
論文 参考訳(メタデータ) (2022-06-16T23:54:53Z) - Asymmetric CNN for image super-resolution [102.96131810686231]
深層畳み込みニューラルネットワーク(CNN)は、過去5年間で低レベルビジョンに広く適用されています。
画像超解像のための非対称ブロック(AB)、mem?ory拡張ブロック(MEB)、高周波数特徴強調ブロック(HFFEB)からなる非対称CNN(ACNet)を提案する。
我々のACNetは、ブラインドノイズの単一画像超解像(SISR)、ブラインドSISR、ブラインドSISRを効果的に処理できる。
論文 参考訳(メタデータ) (2021-03-25T07:10:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。