論文の概要: Image Deblurring using GAN
- arxiv url: http://arxiv.org/abs/2312.09496v1
- Date: Fri, 15 Dec 2023 02:43:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-18 17:26:08.286331
- Title: Image Deblurring using GAN
- Title(参考訳): GANを用いた画像劣化
- Authors: Zhengdong Li
- Abstract要約: 本研究は,GAN(Generative Adversarial Network)の画像処理への応用に焦点を当てた。
プロジェクトはGANモデルのインフローを定義し、GoPROデータセットでトレーニングする。
ネットワークは画像のシャープなピクセルを取得でき、平均29.3ピーク信号対雑音比(PSNR)と0.72構造類似度評価(SSIM)を実現している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, deep generative models, such as Generative Adversarial
Network (GAN), has grabbed significant attention in the field of computer
vision. This project focuses on the application of GAN in image deblurring with
the aim of generating clearer images from blurry inputs caused by factors such
as motion blur. However, traditional image restoration techniques have
limitations in handling complex blurring patterns. Hence, a GAN-based framework
is proposed as a solution to generate high-quality deblurred images. The
project defines a GAN model in Tensorflow and trains it with GoPRO dataset. The
Generator will intake blur images directly to create fake images to convince
the Discriminator which will receive clear images at the same time and
distinguish between the real image and the fake image. After obtaining the
trained parameters, the model was used to deblur motion-blur images taken in
daily life as well as testing set for validation. The result shows that the
pretrained network of GAN can obtain sharper pixels in image, achieving an
average of 29.3 Peak Signal-to-Noise Ratio (PSNR) and 0.72 Structural
Similarity Assessment (SSIM). This help to effectively address the challenges
posed by image blurring, leading to the generation of visually pleasing and
sharp images. By exploiting the adversarial learning framework, the proposed
approach enhances the potential for real-world applications in image
restoration.
- Abstract(参考訳): 近年、GAN(Generative Adversarial Network)のような深層生成モデルは、コンピュータビジョンの分野で大きな注目を集めている。
本研究は,動きのぼやけなどの要因によるぼやけた入力から,より鮮明な画像を生成することを目的とした,画像劣化へのGANの適用に焦点を当てる。
しかし、従来の画像復元技術は複雑なぼやけたパターンを扱うのに限界がある。
したがって、高品質なデブロワー画像を生成するソリューションとして、GANベースのフレームワークが提案されている。
プロジェクトはTensorflowでGANモデルを定義し、GoPROデータセットでトレーニングする。
ジェネレータは、ぼやけた画像を直接入力して偽画像を生成し、識別者が同時に明快な画像を受け取り、実際の画像と偽画像を区別するように説得する。
トレーニングされたパラメータを得た後、モデルは、日常生活で撮影されたモーションブラル画像と検証のためのテストセットの分離に使用された。
その結果、ganの事前学習したネットワークは画像中のシャープな画素を得ることができ、平均29.3 ピーク信号対雑音比(psnr)と 0.72 構造類似度評価(ssim)が得られる。
これは、画像のぼやけによって生じる課題を効果的に解決し、視覚的な快感と鋭い画像を生成するのに役立つ。
敵対的学習フレームワークを利用することにより,提案手法は,画像復元における実世界応用の可能性を高める。
関連論文リスト
- Self-Supervised Multi-Scale Network for Blind Image Deblurring via Alternating Optimization [12.082424048578753]
本稿では,遅延画像とぼやけたカーネルを共同で推定する,自己監督型マルチスケールブラインド画像デブロアリング手法を提案する。
複数スケールにわたる協調的推定により,計算集約的な粗大な伝播や画像の劣化を回避できる。
論文 参考訳(メタデータ) (2024-09-02T07:08:17Z) - How to Trace Latent Generative Model Generated Images without Artificial Watermark? [88.04880564539836]
潜在生成モデルによって生成された画像に関する潜在的な誤用に関する懸念が持ち上がっている。
検査されたモデルの生成された画像をトレースするために,レイトタントトラッカーと呼ばれる潜時反転に基づく手法を提案する。
提案手法は,検査したモデルと他の画像から生成された画像とを高精度かつ効率的に識別できることを示す。
論文 参考訳(メタデータ) (2024-05-22T05:33:47Z) - Active Generation for Image Classification [45.93535669217115]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z) - Unlocking Pre-trained Image Backbones for Semantic Image Synthesis [29.688029979801577]
本稿では,現実的な画像を生成するセマンティック画像合成のための新しい種類のGAN識別器を提案する。
DP-SIMSをダブした本モデルでは,ADE-20K,COCO-Stuff,Cityscapesの入力ラベルマップと画像品質と一貫性の両面から,最新の結果が得られる。
論文 参考訳(メタデータ) (2023-12-20T09:39:19Z) - DGNet: Dynamic Gradient-Guided Network for Water-Related Optics Image
Enhancement [77.0360085530701]
水中画像強調(UIE)は、水中環境によって引き起こされる複雑な劣化のために難しい課題である。
従来の手法では、劣化過程を理想化し、中音や物体の動きが画像の特徴の分布に与える影響を無視することが多い。
提案手法では,予測画像を用いて疑似ラベルを動的に更新し,動的勾配を加えてネットワークの勾配空間を最適化する。
論文 参考訳(メタデータ) (2023-12-12T06:07:21Z) - Image Inpainting via Tractable Steering of Diffusion Models [54.13818673257381]
本稿では,トラクタブル確率モデル(TPM)の制約後部を正確に,かつ効率的に計算する能力を活用することを提案する。
具体的には、確率回路(PC)と呼ばれる表現型TPMのクラスを採用する。
提案手法は, 画像の全体的な品質とセマンティックコヒーレンスを, 計算オーバーヘッドを10%加えるだけで一貫的に改善できることを示す。
論文 参考訳(メタデータ) (2023-11-28T21:14:02Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - Progressively Unfreezing Perceptual GAN [28.330940021951438]
画像生成にはGAN(Generative Adversarial Network)が広く用いられているが、生成した画像はテクスチャの詳細が欠如している。
本稿では,テクスチャの細かい画像を生成するための一般的なフレームワークであるProgressively Unfreezing Perceptual GAN(PUPGAN)を提案する。
論文 参考訳(メタデータ) (2020-06-18T03:12:41Z) - Deblurring by Realistic Blurring [110.54173799114785]
本稿では,BGAN(Learning-to-blurr GAN)とDBGAN(Learning-to-DeBlur GAN)の2つのモデルを組み合わせた新しい手法を提案する。
第1のモデルであるBGANは、未ペアのシャープでぼやけた画像セットでシャープな画像をぼやかす方法を学習し、第2のモデルであるDBGANをガイドして、そのような画像を正しくデブロアする方法を学ぶ。
さらなる貢献として,多様なぼやけた画像を含むRWBIデータセットについても紹介する。
論文 参考訳(メタデータ) (2020-04-04T05:25:15Z) - Self-Supervised Linear Motion Deblurring [112.75317069916579]
深層畳み込みニューラルネットワークは、画像の劣化の最先端技術である。
本稿では,自己監督型動作遅延に対する識別可能なreblurモデルを提案する。
我々の実験は、自己監督された単一画像の劣化が本当に実現可能であることを実証した。
論文 参考訳(メタデータ) (2020-02-10T20:15:21Z) - Pixel-wise Conditioned Generative Adversarial Networks for Image
Synthesis and Completion [3.8807073304999355]
GAN(Generative Adversarial Networks)は、教師なし画像生成に成功している。
画素数が少ない場合, GANの条件付けの有効性について検討する。
本稿では,GAN目標関数に明示的なコスト項を付加し,画素単位の条件を強制するモデリングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-02-04T13:49:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。