論文の概要: Underwater Image Super-Resolution using Generative Adversarial
Network-based Model
- arxiv url: http://arxiv.org/abs/2211.03550v4
- Date: Sat, 23 Sep 2023 16:14:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 04:43:35.203148
- Title: Underwater Image Super-Resolution using Generative Adversarial
Network-based Model
- Title(参考訳): 生成型逆ネットワークモデルによる水中画像の超解像
- Authors: Alireza Aghelan, Modjtaba Rouhani
- Abstract要約: 単一画像超解像モデル(SISR)は、水中画像の解像度と視覚的品質を向上させることができる。
本稿では,水中画像の超解像のための事前訓練されたReal-ESRGANモデルを微調整する。
- 参考スコア(独自算出の注目度): 3.127436744845925
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single image super-resolution (SISR) models are able to enhance the
resolution and visual quality of underwater images and contribute to a better
understanding of underwater environments. The integration of these models in
Autonomous Underwater Vehicles (AUVs) can improve their performance in
vision-based tasks. Real-Enhanced Super-Resolution Generative Adversarial
Network (Real-ESRGAN) is an efficient model that has shown remarkable
performance among SISR models. In this paper, we fine-tune the pre-trained
Real-ESRGAN model for underwater image super-resolution. To fine-tune and
evaluate the performance of the model, we use the USR-248 dataset. The
fine-tuned model produces more realistic images with better visual quality
compared to the Real-ESRGAN model.
- Abstract(参考訳): 単一画像超解像モデル(SISR)は、水中画像の解像度と視覚的品質を高め、水中環境のより良い理解に寄与する。
これらのモデルをAUV(Autonomous Underwater Vehicles)に統合することで、視覚ベースのタスクのパフォーマンスを向上させることができる。
Real-Enhanced Super-Resolution Generative Adversarial Network (Real-ESRGAN)は、SISRモデル間で顕著な性能を示す効率的なモデルである。
本稿では,水中画像の超解像のための事前訓練されたReal-ESRGANモデルを微調整する。
モデルの性能を微調整し評価するために,USR-248データセットを用いる。
微調整されたモデルは、実際のesrganモデルよりも優れた視覚品質を持つより現実的な画像を生成する。
関連論文リスト
- IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution [2.009766774844269]
本稿では,CFATモデルをIG-CFATと呼ばれる改良型GANモデルに拡張する。
IG-CFATはセマンティック・アウェア・ディスクリミネーターを組み込んで細部をより正確に再構築する。
提案手法は,GANを用いた超解像モデルにおける従来の損失関数にウェーブレット損失を加え,より効率的に高周波の詳細を復元する。
論文 参考訳(メタデータ) (2024-06-19T20:21:26Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - A comparative analysis of SRGAN models [0.0]
実世界の画像のベンチマークデータセットを用いて,SRGAN(Super Resolution Generative Adversarial Network)モデル,ESRGAN,Real-ESRGAN,EDSRの性能評価を行った。
いくつかのモデルは、視覚的品質を維持しながら入力画像の解像度を著しく向上させるように見えるが、これはTesseract OCRエンジンを用いて評価される。
論文 参考訳(メタデータ) (2023-07-18T17:35:45Z) - ACDMSR: Accelerated Conditional Diffusion Models for Single Image
Super-Resolution [84.73658185158222]
本稿では,ACDMSRと呼ばれる拡散モデルに基づく超解像法を提案する。
提案手法は, 決定論的反復分解過程を通じて超解像を行うために, 標準拡散モデルに適応する。
提案手法は,低解像度画像に対してより視覚的に現実的な表現を生成し,現実的なシナリオにおけるその有効性を強調した。
論文 参考訳(メタデータ) (2023-07-03T06:49:04Z) - PUGAN: Physical Model-Guided Underwater Image Enhancement Using GAN with
Dual-Discriminators [120.06891448820447]
鮮明で視覚的に快適な画像を得る方法は、人々の共通の関心事となっている。
水中画像強調(UIE)の課題も、時間とともに現れた。
本稿では,UIE のための物理モデル誘導型 GAN モデルを提案する。
我々のPUGANは質的および定量的な測定値において最先端の手法より優れています。
論文 参考訳(メタデータ) (2023-06-15T07:41:12Z) - Fine-tuned Generative Adversarial Network-based Model for Medical Image Super-Resolution [2.647302105102753]
The Real-Enhanced Super-Resolution Generative Adversarial Network (Real-ESRGAN) is a practical model for recovery HR images from real-world LR images。
実世界の画像劣化をシミュレートするReal-ESRGANの高次劣化モデルを用いる。
提案モデルでは,Real-ESRGANモデルに比べて知覚品質が優れ,細部を効果的に保存し,より現実的なテクスチャで画像を生成する。
論文 参考訳(メタデータ) (2022-11-01T16:48:04Z) - Advancing Plain Vision Transformer Towards Remote Sensing Foundation
Model [97.9548609175831]
約1億のパラメータを持つプレーンビジョントランスフォーマーを利用して、リモートセンシングタスク用にカスタマイズされた大規模なビジョンモデルを提案する。
具体的には、RS画像における大きな画像サイズと様々な向きのオブジェクトを扱うために、回転する様々なウィンドウアテンションを提案する。
検出タスクの実験は、DOTA-V1.0データセット上で81.16%のmAPを達成したすべての最先端モデルよりも、我々のモデルの方が優れていることを示す。
論文 参考訳(メタデータ) (2022-08-08T09:08:40Z) - DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder [73.1010640692609]
本稿では,拡散デコーダ(DiVAE)を用いたVQ-VAEアーキテクチャモデルを提案する。
我々のモデルは最先端の成果を達成し、さらに多くのフォトリアリスティックな画像を生成する。
論文 参考訳(メタデータ) (2022-06-01T10:39:12Z) - Image Super-Resolution With Deep Variational Autoencoders [10.62560651449376]
VDVAE-SRは,最新の深部VAE手法を利用して画像超解像を改善することを目的とした新しいモデルである。
提案手法は他の最先端手法と競合することを示す。
論文 参考訳(メタデータ) (2022-03-17T17:05:14Z) - A Generic Approach for Enhancing GANs by Regularized Latent Optimization [79.00740660219256]
本稿では,事前学習したGANを効果的かつシームレスに拡張できる,エミュレーティブモデル推論と呼ばれる汎用フレームワークを提案する。
我々の基本的な考え方は、ワッサーシュタイン勾配流法を用いて与えられた要求に対する最適潜時分布を効率的に推算することである。
論文 参考訳(メタデータ) (2021-12-07T05:22:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。