論文の概要: UW-CVGAN: UnderWater Image Enhancement with Capsules Vectors
Quantization
- arxiv url: http://arxiv.org/abs/2302.01144v1
- Date: Thu, 2 Feb 2023 15:00:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-03 13:45:56.017772
- Title: UW-CVGAN: UnderWater Image Enhancement with Capsules Vectors
Quantization
- Title(参考訳): UW-CVGAN:カプセルベクトル量子化による水中画像強調
- Authors: Rita Pucci, Christian Micheloni, Niki Martinel
- Abstract要約: 本稿では,VQGANの離散的特徴量化パラダイムに基づく水中カプセルベクトルGAN UWCVGANを提案する。
提案したUWCVGANは、画像を潜在表現に圧縮する符号化ネットワークとデコードネットワークを結合し、唯一の潜在表現から画像の拡張を再構築する。
- 参考スコア(独自算出の注目度): 25.23797117677732
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The degradation in the underwater images is due to wavelength-dependent light
attenuation, scattering, and to the diversity of the water types in which they
are captured. Deep neural networks take a step in this field, providing
autonomous models able to achieve the enhancement of underwater images. We
introduce Underwater Capsules Vectors GAN UWCVGAN based on the discrete
features quantization paradigm from VQGAN for this task. The proposed UWCVGAN
combines an encoding network, which compresses the image into its latent
representation, with a decoding network, able to reconstruct the enhancement of
the image from the only latent representation. In contrast with VQGAN, UWCVGAN
achieves feature quantization by exploiting the clusterization ability of
capsule layer, making the model completely trainable and easier to manage. The
model obtains enhanced underwater images with high quality and fine details.
Moreover, the trained encoder is independent of the decoder giving the
possibility to be embedded onto the collector as compressing algorithm to
reduce the memory space required for the images, of factor $3\times$.
\myUWCVGAN{ }is validated with quantitative and qualitative analysis on
benchmark datasets, and we present metrics results compared with the state of
the art.
- Abstract(参考訳): 水中画像の劣化は、波長依存性の光減衰、散乱、そしてそれらが捕獲される水の種類の違いによるものである。
ディープニューラルネットワークはこの分野で一歩を踏み出し、水中画像の強化を達成できる自律型モデルを提供する。
本稿では,VQGANの離散的特徴量化パラダイムに基づく水中カプセルベクトルGAN UWCVGANを提案する。
提案したUWCVGANは、画像を潜在表現に圧縮する符号化ネットワークとデコードネットワークを組み合わせることで、唯一の潜在表現から画像の拡張を再構築することができる。
VQGANとは対照的に、UWCVGANはカプセル層のクラスタ化能力を利用して特徴量化を実現し、モデルを完全に訓練可能で管理しやすくする。
モデルでは、高品質で詳細な水中画像を得る。
さらに、トレーニングされたエンコーダはデコーダとは独立しており、イメージに必要なメモリスペースを3ドル以上削減する圧縮アルゴリズムとしてコレクタに埋め込まれる可能性がある。
ベンチマークデータセットの量的・質的分析によって検証され,その技術と比較した測定結果を示す。
関連論文リスト
- DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - UNIQA: A Unified Framework for Both Full-Reference and No-Reference
Image Quality Assessment [53.895598734070695]
完全参照(FR)と非参照(NR)のIQAのための統一ネットワークを提案する。
入力画像から多レベル特徴を抽出するためにエンコーダを用いる。
FRおよびNR入力のユニバーサルアダプタとして階層自己認識(HSA)モジュールを提案する。
HSA と CSCA を採用することにより,提案ネットワークは FR と NR IQA の両方を効果的に実行することができる。
論文 参考訳(メタデータ) (2023-10-14T11:03:04Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Adaptive Uncertainty Distribution in Deep Learning for Unsupervised
Underwater Image Enhancement [1.9249287163937976]
ディープラーニングベースの水中画像強化における大きな課題の1つは、高品質なトレーニングデータの可用性の制限である。
本研究では、条件付き変分オートエンコーダ(cVAE)を用いて、深層学習モデルのトレーニングを行う、新しい教師なし水中画像強調フレームワークを提案する。
提案手法は, 定量化と定性化の両面において, 他の最先端手法と比較して, 競争性能が向上することを示す。
論文 参考訳(メタデータ) (2022-12-18T01:07:20Z) - Semantic-aware Texture-Structure Feature Collaboration for Underwater
Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。
我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。
また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文 参考訳(メタデータ) (2022-11-19T07:50:34Z) - Wavelength-based Attributed Deep Neural Network for Underwater Image
Restoration [9.378355457555319]
本稿では,色チャネルの移動範囲に基づいて,適切な受容場サイズ(コンテキスト)を付与することで,大幅な性能向上が期待できることを示す。
第2の新規性として、学習したマルチコンテキスト特徴を適応的に洗練するための注意的スキップ機構を組み込んだ。
提案するフレームワークはDeep WaveNetと呼ばれ、従来のピクセル単位で機能ベースのコスト関数を使って最適化されている。
論文 参考訳(メタデータ) (2021-06-15T06:47:51Z) - Scalable Visual Transformers with Hierarchical Pooling [61.05787583247392]
本稿では,視覚的トークンを徐々にプールしてシーケンス長を縮小する階層的ビジュアルトランスフォーマ(hvt)を提案する。
計算の複雑さを増すことなく、深さ/幅/解像度/パッチサイズの寸法をスケールすることで、大きなメリットをもたらします。
当社のHVTはImageNetとCIFAR-100データセットの競合ベースラインを上回っています。
論文 参考訳(メタデータ) (2021-03-19T03:55:58Z) - Modeling Lost Information in Lossy Image Compression [72.69327382643549]
ロスシー画像圧縮は、デジタル画像の最もよく使われる演算子の1つである。
Invertible Lossy Compression (ILC) と呼ばれる新しい非可逆的フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-22T04:04:56Z) - Deep Attentive Generative Adversarial Network for Photo-Realistic Image
De-Quantization [25.805568996596783]
減量子化は、高ビット深度画面に表示するための低ビット深度画像の視覚的品質を改善することができる。
本稿では,画像強度分解能の超解像を実現するためのDAGANアルゴリズムを提案する。
DenseResAttモジュールは、自己保持機構を備えた密集した残留ブロックで構成されている。
論文 参考訳(メタデータ) (2020-04-07T06:45:01Z) - Toward a Controllable Disentanglement Network [22.968760397814993]
本稿では, 画像編集における歪みの程度を制御し, 歪み強度と復元品質のバランスをとることにより, 歪み画像表現を学習する2つの重要な問題に対処する。
ソフトターゲット表現の実際の値空間を探索することにより、指定された特性を持つ新規な画像を合成することができる。
論文 参考訳(メタデータ) (2020-01-22T16:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。