論文の概要: Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement
- arxiv url: http://arxiv.org/abs/2211.10608v1
- Date: Sat, 19 Nov 2022 07:50:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 19:56:33.570324
- Title: Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement
- Title(参考訳): 水中画像強調のための意味認識型テクスチャ構造特徴協調
- Authors: Di Wang, Long Ma, Risheng Liu, Xin Fan
- Abstract要約: 水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。
また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
- 参考スコア(独自算出の注目度): 58.075720488942125
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Underwater image enhancement has become an attractive topic as a significant
technology in marine engineering and aquatic robotics. However, the limited
number of datasets and imperfect hand-crafted ground truth weaken its
robustness to unseen scenarios, and hamper the application to high-level vision
tasks. To address the above limitations, we develop an efficient and compact
enhancement network in collaboration with a high-level semantic-aware
pretrained model, aiming to exploit its hierarchical feature representation as
an auxiliary for the low-level underwater image enhancement. Specifically, we
tend to characterize the shallow layer features as textures while the deep
layer features as structures in the semantic-aware model, and propose a
multi-path Contextual Feature Refinement Module (CFRM) to refine features in
multiple scales and model the correlation between different features. In
addition, a feature dominative network is devised to perform channel-wise
modulation on the aggregated texture and structure features for the adaptation
to different feature patterns of the enhancement network. Extensive experiments
on benchmarks demonstrate that the proposed algorithm achieves more appealing
results and outperforms state-of-the-art methods by large margins. We also
apply the proposed algorithm to the underwater salient object detection task to
reveal the favorable semantic-aware ability for high-level vision tasks. The
code is available at STSC.
- Abstract(参考訳): 水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
しかし、限られたデータセットと不完全な手作りの地上真理は、その強固さを未知のシナリオに弱め、高レベルのビジョンタスクへの応用を妨げます。
上記の制約に対処するために,高レベル意味認識事前学習モデルと協調して効率良くコンパクトな拡張ネットワークを開発し,その階層的特徴表現を低レベル水中画像強調の補助として活用することを目的とした。
具体的には、浅い層の特徴をテクスチャとして特徴付け、深い層をセマンティクス・アウェアモデルの構造として特徴付け、複数のスケールで特徴を洗練し、異なる特徴間の相関をモデル化するマルチパス・コンテクスト・フィーチャー・リファインメント・モジュール(cfrm)を提案する。
さらに, 拡張ネットワークの異なる特徴パターンに適応するための, 集合テクスチャと構造特徴のチャネルワイズ変調を行うために, 特徴支配ネットワークを考案した。
ベンチマーク実験により、提案アルゴリズムはより魅力的な結果を得ることができ、最先端の手法を大きなマージンで上回ることを示した。
また,提案手法を水中サルエント物体検出タスクに適用し,高レベル視覚タスクに好適な意味認識能力を明らかにする。
コードはstscで入手できる。
関連論文リスト
- Lacunarity Pooling Layers for Plant Image Classification using Texture Analysis [0.38366697175402226]
ポーリング層は、画素強度及び/または特徴値の空間配置に符号化された重要な情報を見渡す。
そこで本研究では,特徴マップの空間的不均一性を,局所窓内における変動性の評価により捉えることを目的とした,新しいラキュナリティプーリング層を提案する。
ラキュナリティプーリング層は、任意の人工ニューラルネットワークアーキテクチャにシームレスに統合することができる。
論文 参考訳(メタデータ) (2024-04-25T00:34:52Z) - Fiducial Focus Augmentation for Facial Landmark Detection [4.433764381081446]
本稿では,モデルによる顔構造理解を高めるために,新しい画像強調手法を提案する。
我々は,Deep Canonical correlation Analysis (DCCA) に基づく損失を考慮した,シームズアーキテクチャに基づくトレーニング機構を採用している。
提案手法は,様々なベンチマークデータセットにおいて,最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2024-02-23T01:34:00Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - CM-GAN: Image Inpainting with Cascaded Modulation GAN and Object-Aware
Training [112.96224800952724]
複雑な画像に大きな穴をあける際の可視像構造を生成するためのカスケード変調GAN(CM-GAN)を提案する。
各デコーダブロックにおいて、まず大域変調を適用し、粗い意味認識合成構造を行い、次に大域変調の出力に空間変調を適用し、空間適応的に特徴写像を更に調整する。
さらに,ネットワークがホール内の新たな物体を幻覚させるのを防ぐため,実世界のシナリオにおける物体除去タスクのニーズを満たすために,オブジェクト認識型トレーニングスキームを設計する。
論文 参考訳(メタデータ) (2022-03-22T16:13:27Z) - Single Image Deraining via Scale-space Invariant Attention Neural
Network [58.5284246878277]
我々は,カメラに対するレインステーキの外観の視覚的変化に対処するスケールの概念に取り組む。
本稿では,画素領域よりもコンパクトでロバストな畳み込み特徴領域のマルチスケール相関を表現することを提案する。
このようにして、機能マップの最も活発な存在を、有能な特徴として要約する。
論文 参考訳(メタデータ) (2020-06-09T04:59:26Z) - Towards Analysis-friendly Face Representation with Scalable Feature and
Texture Compression [113.30411004622508]
普遍的で協調的な視覚情報表現は階層的な方法で実現できることを示す。
ディープニューラルネットワークの強力な生成能力に基づいて、基本特徴層と強化層の間のギャップは、特徴レベルのテクスチャ再構築によってさらに埋められる。
提案するフレームワークの効率を改善するために,ベース層ニューラルネットワークをマルチタスクでトレーニングする。
論文 参考訳(メタデータ) (2020-04-21T14:32:49Z) - MLFcGAN: Multi-level Feature Fusion based Conditional GAN for Underwater
Image Color Correction [35.16835830904171]
水中画像色補正のための条件付き生成逆数ネットワーク(GAN)に基づく深層マルチスケール機能融合ネットを提案する。
ネットワーク上では,まずマルチスケールの特徴を抽出し,各スケールの局所的特徴をグローバルな特徴で拡張する。
この設計は、より効率的で高速なネットワーク学習を促進するために検証され、色補正とディテール保存の両方の性能が向上した。
論文 参考訳(メタデータ) (2020-02-13T04:15:10Z) - Contextual Encoder-Decoder Network for Visual Saliency Prediction [42.047816176307066]
本稿では,大規模な画像分類タスクに基づいて事前学習した畳み込みニューラルネットワークに基づくアプローチを提案する。
得られた表現をグローバルなシーン情報と組み合わせて視覚的サリエンシを正確に予測する。
最先端技術と比較して、このネットワークは軽量な画像分類バックボーンに基づいている。
論文 参考訳(メタデータ) (2019-02-18T16:15:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。