論文の概要: LAFFNet: A Lightweight Adaptive Feature Fusion Network for Underwater
Image Enhancement
- arxiv url: http://arxiv.org/abs/2105.01299v2
- Date: Wed, 5 May 2021 02:16:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-06 13:01:11.302401
- Title: LAFFNet: A Lightweight Adaptive Feature Fusion Network for Underwater
Image Enhancement
- Title(参考訳): LAFFNet:水中画像強調のための軽量適応型特徴融合ネットワーク
- Authors: Hao-Hsiang Yang and Kuan-Chih Huang and Wei-Ting Chen
- Abstract要約: 水中画像強調のための軽量適応機能融合ネットワーク (LAFFNet) を提案する。
提案手法はパラメータ数を2.5Mから0.15Mに削減するが,実験により最先端のアルゴリズムよりも優れる。
- 参考スコア(独自算出の注目度): 6.338178373376447
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater image enhancement is an important low-level computer vision task
for autonomous underwater vehicles and remotely operated vehicles to explore
and understand the underwater environments. Recently, deep convolutional neural
networks (CNNs) have been successfully used in many computer vision problems,
and so does underwater image enhancement. There are many deep-learning-based
methods with impressive performance for underwater image enhancement, but their
memory and model parameter costs are hindrances in practical application. To
address this issue, we propose a lightweight adaptive feature fusion network
(LAFFNet). The model is the encoder-decoder model with multiple adaptive
feature fusion (AAF) modules. AAF subsumes multiple branches with different
kernel sizes to generate multi-scale feature maps. Furthermore, channel
attention is used to merge these feature maps adaptively. Our method reduces
the number of parameters from 2.5M to 0.15M (around 94% reduction) but
outperforms state-of-the-art algorithms by extensive experiments. Furthermore,
we demonstrate our LAFFNet effectively improves high-level vision tasks like
salience object detection and single image depth estimation.
- Abstract(参考訳): 水中画像の強化は、自律型水中車両および遠隔操作車両が水中環境を探索し理解するための重要な低レベルコンピュータビジョンタスクである。
近年,多くのコンピュータビジョン問題において深層畳み込みニューラルネットワーク(CNN)が成功しており,水中画像の強化も行われている。
水中画像強調に優れた性能を持つ深層学習手法は数多く存在するが、そのメモリとモデルパラメータのコストは実用上の障害となっている。
この問題に対処するために,軽量適応機能融合ネットワーク (LAFFNet) を提案する。
モデルは、複数の適応的特徴融合(AAF)モジュールを持つエンコーダ・デコーダモデルである。
AAFは、異なるカーネルサイズで複数のブランチを仮定し、マルチスケールの特徴マップを生成する。
さらに、チャネルアテンションはこれらの特徴マップを適応的にマージするために使用される。
提案手法はパラメータ数を2.5Mから0.15M(約94%削減)に削減するが,実験により最先端のアルゴリズムよりも優れる。
さらに,laffnetは,サリアンス物体検出や単一画像深度推定などの高レベル視覚タスクを効果的に改善することを示す。
関連論文リスト
- LU2Net: A Lightweight Network for Real-time Underwater Image Enhancement [4.353142366661057]
Lightweight Underwater Unet (LU2Net)は、水中画像のリアルタイムエンハンスメントのために設計された新しいU字型ネットワークである。
LU2Netは、現在最先端の水中画像強調法よりも8倍の速度で、十分に強化された水中画像を提供することができる。
論文 参考訳(メタデータ) (2024-06-21T08:33:13Z) - Multi-scale Unified Network for Image Classification [33.560003528712414]
CNNは、実世界のマルチスケール画像入力を扱う際に、性能と計算効率において顕著な課題に直面している。
本稿では,マルチスケール,統一ネットワーク,スケール不変制約からなるMultiscale Unified Network(MUSN)を提案する。
MUSNは精度が44.53%向上し、マルチスケールシナリオではFLOPを7.01-16.13%減少させる。
論文 参考訳(メタデータ) (2024-03-27T06:40:26Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - UWFormer: Underwater Image Enhancement via a Semi-Supervised Multi-Scale Transformer [26.15238399758745]
水中画像は、品質が悪く、色調が歪んだり、コントラストが低かったりすることが多い。
現在のディープラーニング手法は、マルチスケール拡張に欠けるニューラル畳み込みネットワーク(CNN)に依存している。
半教師付き学習によって複数の周波数の画像を拡張するためのマルチスケールトランスフォーマーベースネットワークを提案する。
論文 参考訳(メタデータ) (2023-10-31T06:19:09Z) - HAT: Hybrid Attention Transformer for Image Restoration [61.74223315807691]
トランスフォーマーに基づく手法は、画像の超解像や復調といった画像復元タスクにおいて顕著な性能を示している。
本稿では,新たなHAT(Hybrid Attention Transformer)を提案する。
我々のHATは,定量的かつ定性的に,最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-09-11T05:17:55Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。
また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文 参考訳(メタデータ) (2022-11-19T07:50:34Z) - EdgeNeXt: Efficiently Amalgamated CNN-Transformer Architecture for
Mobile Vision Applications [68.35683849098105]
入力テンソルを複数のチャネルグループに分割するSDTAエンコーダを導入する。
1.3Mパラメータを持つEdgeNeXtモデルでは、ImageNet-1Kで71.2%のTop-1精度を実現している。
パラメータ5.6MのEdgeNeXtモデルでは、ImageNet-1Kで79.4%のTop-1精度を実現しています。
論文 参考訳(メタデータ) (2022-06-21T17:59:56Z) - Wavelength-based Attributed Deep Neural Network for Underwater Image
Restoration [9.378355457555319]
本稿では,色チャネルの移動範囲に基づいて,適切な受容場サイズ(コンテキスト)を付与することで,大幅な性能向上が期待できることを示す。
第2の新規性として、学習したマルチコンテキスト特徴を適応的に洗練するための注意的スキップ機構を組み込んだ。
提案するフレームワークはDeep WaveNetと呼ばれ、従来のピクセル単位で機能ベースのコスト関数を使って最適化されている。
論文 参考訳(メタデータ) (2021-06-15T06:47:51Z) - Lightweight Single-Image Super-Resolution Network with Attentive
Auxiliary Feature Learning [73.75457731689858]
本稿では,SISR の注意補助機能 (A$2$F) に基づく計算効率が高く正確なネットワークを構築した。
大規模データセットを用いた実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-11-13T06:01:46Z) - MLFcGAN: Multi-level Feature Fusion based Conditional GAN for Underwater
Image Color Correction [35.16835830904171]
水中画像色補正のための条件付き生成逆数ネットワーク(GAN)に基づく深層マルチスケール機能融合ネットを提案する。
ネットワーク上では,まずマルチスケールの特徴を抽出し,各スケールの局所的特徴をグローバルな特徴で拡張する。
この設計は、より効率的で高速なネットワーク学習を促進するために検証され、色補正とディテール保存の両方の性能が向上した。
論文 参考訳(メタデータ) (2020-02-13T04:15:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。