Fugu-MT 論文翻訳(概要): UW-CVGAN: UnderWater Image Enhancement with Capsules Vectors Quantization

論文の概要: UW-CVGAN: UnderWater Image Enhancement with Capsules Vectors Quantization

arxiv url: http://arxiv.org/abs/2302.01144v1
Date: Thu, 2 Feb 2023 15:00:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-03 13:45:56.017772
Title: UW-CVGAN: UnderWater Image Enhancement with Capsules Vectors Quantization
Title（参考訳）: UW-CVGAN:カプセルベクトル量子化による水中画像強調
Authors: Rita Pucci, Christian Micheloni, Niki Martinel
Abstract要約: 本稿では,VQGANの離散的特徴量化パラダイムに基づく水中カプセルベクトルGAN UWCVGANを提案する。提案したUWCVGANは、画像を潜在表現に圧縮する符号化ネットワークとデコードネットワークを結合し、唯一の潜在表現から画像の拡張を再構築する。
参考スコア（独自算出の注目度）: 25.23797117677732
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The degradation in the underwater images is due to wavelength-dependent light attenuation, scattering, and to the diversity of the water types in which they are captured. Deep neural networks take a step in this field, providing autonomous models able to achieve the enhancement of underwater images. We introduce Underwater Capsules Vectors GAN UWCVGAN based on the discrete features quantization paradigm from VQGAN for this task. The proposed UWCVGAN combines an encoding network, which compresses the image into its latent representation, with a decoding network, able to reconstruct the enhancement of the image from the only latent representation. In contrast with VQGAN, UWCVGAN achieves feature quantization by exploiting the clusterization ability of capsule layer, making the model completely trainable and easier to manage. The model obtains enhanced underwater images with high quality and fine details. Moreover, the trained encoder is independent of the decoder giving the possibility to be embedded onto the collector as compressing algorithm to reduce the memory space required for the images, of factor $3\times$. \myUWCVGAN{ }is validated with quantitative and qualitative analysis on benchmark datasets, and we present metrics results compared with the state of the art.
Abstract（参考訳）: 水中画像の劣化は、波長依存性の光減衰、散乱、そしてそれらが捕獲される水の種類の違いによるものである。ディープニューラルネットワークはこの分野で一歩を踏み出し、水中画像の強化を達成できる自律型モデルを提供する。本稿では,VQGANの離散的特徴量化パラダイムに基づく水中カプセルベクトルGAN UWCVGANを提案する。提案したUWCVGANは、画像を潜在表現に圧縮する符号化ネットワークとデコードネットワークを組み合わせることで、唯一の潜在表現から画像の拡張を再構築することができる。 VQGANとは対照的に、UWCVGANはカプセル層のクラスタ化能力を利用して特徴量化を実現し、モデルを完全に訓練可能で管理しやすくする。モデルでは、高品質で詳細な水中画像を得る。さらに、トレーニングされたエンコーダはデコーダとは独立しており、イメージに必要なメモリスペースを3ドル以上削減する圧縮アルゴリズムとしてコレクタに埋め込まれる可能性がある。ベンチマークデータセットの量的・質的分析によって検証され,その技術と比較した測定結果を示す。

関連論文リスト

DACA-Net: A Degradation-Aware Conditional Diffusion Network for Underwater Image Enhancement [16.719513778795367]
水中画像は通常、散乱や吸収といった複雑な光学効果により、激しい色歪み、視界の低さ、構造的明瞭さの低下に悩まされる。既存の拡張手法は、様々な劣化条件を適応的に扱うのに苦労し、水中固有の物理的前提を効果的に活用できないことが多い。本研究では,水中画像の適応的・堅牢性を高めるための劣化認識条件拡散モデルを提案する。
論文参考訳（メタデータ） (2025-07-30T09:16:07Z)
Bridging Knowledge Gap Between Image Inpainting and Large-Area Visible Watermark Removal [57.84348166457113]
本稿では,事前学習した画像の塗装モデルの表現能力を活用する新しい特徴適応フレームワークを提案する。本手法は, 透かしの残像の残像を塗布バックボーンモデルに流し込むことにより, 透かしと透かし除去の知識ギャップを埋めるものである。高品質な透かしマスクへの依存を緩和するために,粗い透かしマスクを用いて推論プロセスを導出する新たな訓練パラダイムを導入する。
論文参考訳（メタデータ） (2025-04-07T02:37:14Z)
UniUIR: Considering Underwater Image Restoration as An All-in-One Learner [62.65503609562905]
我々はUniUIRと呼ばれるユニバーサル水中画像復元手法を提案する。劣化固有の問題を分離し、UIRタスクにおける様々な劣化の相関関係を探るため、我々はMamba Mixture-of-Expertsモジュールを設計した。このモジュールは、空間領域と周波数領域の両方において劣化前の情報を抽出し、最適なタスク固有のプロンプトを適応的に選択する。
論文参考訳（メタデータ） (2025-01-22T16:10:42Z)
Quantum Down Sampling Filter for Variational Auto-encoder [0.504868948270058]
変分オートエンコーダ(VAE)は、生成モデリングと画像再構成の基礎となる。本研究では,量子変分オートエンコーダ(Q-VAE)のハイブリッドモデルを提案する。 Q-VAEはエンコーダに量子符号化を統合し、完全に接続された層を利用して意味のある表現を抽出する。
論文参考訳（メタデータ） (2025-01-09T11:08:55Z)
CE-VAE: Capsule Enhanced Variational AutoEncoder for Underwater Image Enhancement [8.16306466526838]
海面監視のための無人水中画像解析は、画質低下とハードウェアストレージ制約という2つの大きな課題に直面している。本稿では,劣化した水中画像の効率よく圧縮・拡張する新しいアーキテクチャであるCapsule Enhanced Variational AutoEncoder (CE-VAE)を紹介する。 CE-VAEは6つのベンチマークデータセットの水中画像強化において最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-06-03T13:04:42Z)
Once-for-All: Controllable Generative Image Compression with Dynamic Granularity Adaption [57.056311855630916]
本稿では,制御可能な生成画像圧縮フレームワークである制御-GICを提案する。高忠実度および一般性圧縮を確保しつつ、広帯域での微粒化適応を可能にする。我々は、歴史的符号化された多粒度表現に遡ることができる条件条件付き条件付けを開発する。
論文参考訳（メタデータ） (2024-06-02T14:22:09Z)
Diffusion-Based Hierarchical Image Steganography [60.69791384893602]
Hierarchical Image Steganographyは、複数のイメージを単一のコンテナに埋め込むセキュリティとキャパシティを高める新しい方法である。フローモデルの可逆性とともに拡散モデルの堅牢性を利用する。この革新的な構造は、コンテナイメージを自律的に生成し、複数の画像やテキストを安全かつ効率的に隠蔽することができる。
論文参考訳（メタデータ） (2024-05-19T11:29:52Z)
DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文参考訳（メタデータ） (2023-12-12T06:07:21Z)
PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。水中画像強調(UIE)の課題も、時間とともに現れた。本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文参考訳（メタデータ） (2023-06-15T07:41:12Z)
Adaptive Uncertainty Distribution in Deep Learning for Unsupervised Underwater Image Enhancement [1.9249287163937976]
ディープラーニングベースの水中画像強化における大きな課題の1つは、高品質なトレーニングデータの可用性の制限である。本研究では、条件付き変分オートエンコーダ(cVAE)を用いて、深層学習モデルのトレーニングを行う、新しい教師なし水中画像強調フレームワークを提案する。提案手法は, 定量化と定性化の両面において, 他の最先端手法と比較して, 競争性能が向上することを示す。
論文参考訳（メタデータ） (2022-12-18T01:07:20Z)
Semantic-aware Texture-Structure Feature Collaboration for Underwater Image Enhancement [58.075720488942125]
水中画像の強調は海洋工学や水生ロボット工学において重要な技術として注目されている。我々は,高レベルな意味認識事前学習モデルと協調して,効率的でコンパクトな拡張ネットワークを開発する。また,提案手法を水中の有意な物体検出タスクに適用し,高レベルの視覚タスクに適した意味認識能力を明らかにする。
論文参考訳（メタデータ） (2022-11-19T07:50:34Z)
Pixel Distillation: A New Knowledge Distillation Scheme for Low-Resolution Image Recognition [124.80263629921498]
アーキテクチャ制約を同時に破りながら知識蒸留を入力レベルまで拡張するPixel Distillationを提案する。このようなスキームは、ネットワークアーキテクチャと画像品質の両方をリソースの全体的な要求に応じて調整できるため、展開のための柔軟なコスト制御を実現することができる。
論文参考訳（メタデータ） (2021-12-17T14:31:40Z)
Wavelength-based Attributed Deep Neural Network for Underwater Image Restoration [9.378355457555319]
本稿では,色チャネルの移動範囲に基づいて,適切な受容場サイズ(コンテキスト)を付与することで,大幅な性能向上が期待できることを示す。第2の新規性として、学習したマルチコンテキスト特徴を適応的に洗練するための注意的スキップ機構を組み込んだ。提案するフレームワークはDeep WaveNetと呼ばれ、従来のピクセル単位で機能ベースのコスト関数を使って最適化されている。
論文参考訳（メタデータ） (2021-06-15T06:47:51Z)
Toward a Controllable Disentanglement Network [22.968760397814993]
本稿では, 画像編集における歪みの程度を制御し, 歪み強度と復元品質のバランスをとることにより, 歪み画像表現を学習する2つの重要な問題に対処する。ソフトターゲット表現の実際の値空間を探索することにより、指定された特性を持つ新規な画像を合成することができる。
論文参考訳（メタデータ） (2020-01-22T16:54:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。