論文の概要: Underwater Image Restoration via Polymorphic Large Kernel CNNs
- arxiv url: http://arxiv.org/abs/2412.18459v1
- Date: Tue, 24 Dec 2024 14:32:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-25 15:54:12.406181
- Title: Underwater Image Restoration via Polymorphic Large Kernel CNNs
- Title(参考訳): 多相大カーネルCNNによる水中画像復元
- Authors: Xiaojiao Guo, Yihang Dong, Xuhang Chen, Weiwen Chen, Zimeng Li, FuChen Zheng, Chi-Man Pun,
- Abstract要約: 水中画像復元(UIR)は、水中環境における画像の複雑な劣化のため、コンピュータビジョンにおいて難しい課題である。
ポリモルフィック大型カーネルCNNを利用した水中画像復元手法であるUIR-Poly Kernelを紹介する。
以上の結果から,設計の整った純粋なCNNアーキテクチャは,より複雑なモデルと効果的に競合することを示す。
- 参考スコア(独自算出の注目度): 27.3614759555859
- License:
- Abstract: Underwater Image Restoration (UIR) remains a challenging task in computer vision due to the complex degradation of images in underwater environments. While recent approaches have leveraged various deep learning techniques, including Transformers and complex, parameter-heavy models to achieve significant improvements in restoration effects, we demonstrate that pure CNN architectures with lightweight parameters can achieve comparable results. In this paper, we introduce UIR-PolyKernel, a novel method for underwater image restoration that leverages Polymorphic Large Kernel CNNs. Our approach uniquely combines large kernel convolutions of diverse sizes and shapes to effectively capture long-range dependencies within underwater imagery. Additionally, we introduce a Hybrid Domain Attention module that integrates frequency and spatial domain attention mechanisms to enhance feature importance. By leveraging the frequency domain, we can capture hidden features that may not be perceptible to humans but are crucial for identifying patterns in both underwater and on-air images. This approach enhances the generalization and robustness of our UIR model. Extensive experiments on benchmark datasets demonstrate that UIR-PolyKernel achieves state-of-the-art performance in underwater image restoration tasks, both quantitatively and qualitatively. Our results show that well-designed pure CNN architectures can effectively compete with more complex models, offering a balance between performance and computational efficiency. This work provides new insights into the potential of CNN-based approaches for challenging image restoration tasks in underwater environments. The code is available at \href{https://github.com/CXH-Research/UIR-PolyKernel}{https://github.com/CXH-Research/UIR-PolyKernel}.
- Abstract(参考訳): 水中画像復元(UIR)は、水中環境における画像の複雑な劣化のため、コンピュータビジョンにおいて難しい課題である。
近年、トランスフォーマーや複雑なパラメータ重みモデルなど、さまざまなディープラーニング技術を活用して復元効果を大幅に向上させているが、軽量なパラメータを持つ純粋なCNNアーキテクチャは、同等の結果が得られることを実証している。
本稿では,ポリモルフィック大型カーネルCNNを利用した水中画像復元手法であるUIR-PolyKernelを紹介する。
我々のアプローチは、様々な大きさと形状の大きなカーネルの畳み込みを独自に組み合わせ、水中画像内の長距離依存関係を効果的に捉えます。
さらに,周波数・空間領域の注意機構を統合したハイブリット・ドメイン・アテンション・モジュールを導入し,機能の重要性を高める。
周波数領域を利用することで、人間には認識できないが水中と水中の両方の画像のパターンを特定するのに不可欠である隠れた特徴を捉えることができる。
このアプローチは、我々のUIRモデルの一般化とロバスト性を高める。
ベンチマークデータセットに対する大規模な実験により、UIR-PolyKernelは水中画像復元タスクにおいて、定量的かつ質的に、最先端のパフォーマンスを達成することが示された。
この結果から, 設計が整った純粋なCNNアーキテクチャは, 性能と計算効率のバランスを保ちながら, より複雑なモデルと効果的に競合できることが示唆された。
この研究は、水中環境における画像復元タスクに挑戦するCNNベースのアプローチの可能性に関する新たな洞察を提供する。
コードは \href{https://github.com/CXH-Research/UIR-PolyKernel}{https://github.com/CXH-Research/UIR-PolyKernel} で公開されている。
関連論文リスト
- Advanced Underwater Image Quality Enhancement via Hybrid Super-Resolution Convolutional Neural Networks and Multi-Scale Retinex-Based Defogging Techniques [0.0]
この研究は、提案されたアプローチの有効性をさらに説明するために、現実世界の水中データセットに関する広範な実験を行っている。
海洋探査、水中ロボティクス、自律水中車両といったリアルタイムの水中アプリケーションでは、ディープラーニングと従来の画像処理技術を組み合わせることで、計算効率の良いフレームワークと優れた結果が得られる。
論文 参考訳(メタデータ) (2024-10-18T08:40:26Z) - UIE-UnFold: Deep Unfolding Network with Color Priors and Vision Transformer for Underwater Image Enhancement [27.535028176427623]
水中画像強調(UIE)は様々な海洋用途において重要な役割を担っている。
現在の学習に基づくアプローチは、水中画像形成に関わる物理過程に関する明確な事前知識を欠いていることが多い。
そこで本稿では,UIEのカラープリエントとステージ間特徴付与を統合した新しいディープ・アンフォールディング・ネットワーク(DUN)を提案する。
論文 参考訳(メタデータ) (2024-08-20T08:48:33Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - UWFormer: Underwater Image Enhancement via a Semi-Supervised Multi-Scale Transformer [26.15238399758745]
水中画像は、品質が悪く、色調が歪んだり、コントラストが低かったりすることが多い。
現在のディープラーニング手法は、マルチスケール拡張に欠けるニューラル畳み込みネットワーク(CNN)に依存している。
半教師付き学習によって複数の周波数の画像を拡張するためのマルチスケールトランスフォーマーベースネットワークを提案する。
論文 参考訳(メタデータ) (2023-10-31T06:19:09Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Learning Heavily-Degraded Prior for Underwater Object Detection [59.5084433933765]
本稿では、検出器フレンドリーな画像から、転送可能な事前知識を求める。
これは、検出器フレンドリー(DFUI)と水中画像の高度に劣化した領域が、特徴分布のギャップがあることを統計的に観察したものである。
高速かつパラメータの少ない本手法は変圧器型検出器よりも優れた性能を保っている。
論文 参考訳(メタデータ) (2023-08-24T12:32:46Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。
また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文 参考訳(メタデータ) (2022-11-19T07:50:34Z) - Image Super-resolution with An Enhanced Group Convolutional Neural
Network [102.2483249598621]
学習能力の強いCNNは、超解像問題を解くために広く選択されている。
浅層構造を持つ超解像群CNN(ESRGCNN)を提案する。
ESRGCNNは、SISRの性能、複雑さ、実行速度、画質評価およびSISRの視覚効果の観点から、最先端技術を上回っていると報告されている。
論文 参考訳(メタデータ) (2022-05-29T00:34:25Z) - Wavelength-based Attributed Deep Neural Network for Underwater Image
Restoration [9.378355457555319]
本稿では,色チャネルの移動範囲に基づいて,適切な受容場サイズ(コンテキスト)を付与することで,大幅な性能向上が期待できることを示す。
第2の新規性として、学習したマルチコンテキスト特徴を適応的に洗練するための注意的スキップ機構を組み込んだ。
提案するフレームワークはDeep WaveNetと呼ばれ、従来のピクセル単位で機能ベースのコスト関数を使って最適化されている。
論文 参考訳(メタデータ) (2021-06-15T06:47:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。