論文の概要: Blur, Noise, and Compression Robust Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2003.07849v2
- Date: Wed, 23 Jun 2021 14:49:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 20:18:33.770326
- Title: Blur, Noise, and Compression Robust Generative Adversarial Networks
- Title(参考訳): ぼやけ、ノイズ、圧縮ロバストな生成型逆ネットワーク
- Authors: Takuhiro Kaneko, Tatsuya Harada
- Abstract要約: 劣化画像から直接クリーンな画像生成装置を学習するために, ぼかし, ノイズ, 圧縮堅牢なGAN(BNCR-GAN)を提案する。
NR-GANにインスパイアされたBNCR-GANは、画像、ぼやけたカーネル、ノイズ、品質要素ジェネレータで構成される多重ジェネレータモデルを使用する。
CIFAR-10の大規模比較とFFHQの一般性解析によるBNCR-GANの有効性を実証する。
- 参考スコア(独自算出の注目度): 85.68632778835253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial networks (GANs) have gained considerable attention
owing to their ability to reproduce images. However, they can recreate training
images faithfully despite image degradation in the form of blur, noise, and
compression, generating similarly degraded images. To solve this problem, the
recently proposed noise robust GAN (NR-GAN) provides a partial solution by
demonstrating the ability to learn a clean image generator directly from noisy
images using a two-generator model comprising image and noise generators.
However, its application is limited to noise, which is relatively easy to
decompose owing to its additive and reversible characteristics, and its
application to irreversible image degradation, in the form of blur,
compression, and combination of all, remains a challenge. To address these
problems, we propose blur, noise, and compression robust GAN (BNCR-GAN) that
can learn a clean image generator directly from degraded images without
knowledge of degradation parameters (e.g., blur kernel types, noise amounts, or
quality factor values). Inspired by NR-GAN, BNCR-GAN uses a multiple-generator
model composed of image, blur-kernel, noise, and quality-factor generators.
However, in contrast to NR-GAN, to address irreversible characteristics, we
introduce masking architectures adjusting degradation strength values in a
data-driven manner using bypasses before and after degradation. Furthermore, to
suppress uncertainty caused by the combination of blur, noise, and compression,
we introduce adaptive consistency losses imposing consistency between
irreversible degradation processes according to the degradation strengths. We
demonstrate the effectiveness of BNCR-GAN through large-scale comparative
studies on CIFAR-10 and a generality analysis on FFHQ. In addition, we
demonstrate the applicability of BNCR-GAN in image restoration.
- Abstract(参考訳): generative adversarial networks (gans) は、画像の再現能力によってかなりの注目を集めている。
しかし、画像がぼやけ、ノイズ、圧縮という形で劣化しているにもかかわらず、トレーニング画像を忠実に再現することができ、同様に劣化した画像を生成する。
この問題を解決するために、最近提案されたノイズロバストGAN(NR-GAN)は、画像とノイズジェネレータからなる2世代モデルを用いて、ノイズの多い画像から直接クリーンな画像ジェネレータを学習できることを示し、部分解を提供する。
しかし、その応用はノイズに限定されており、その付加的・可逆的特性により比較的分解が容易であり、ぼかし、圧縮、そしてすべての組み合わせという形で可逆的画像劣化への応用は依然として課題である。
これらの問題に対処するために,劣化パラメータ(ぼかしカーネルタイプ,ノイズ量,品質係数値など)を知らずに,劣化画像から直接クリーン画像生成器を学習できる,ぼかし,ノイズ,圧縮頑健 gan (bncr-gan) を提案する。
NR-GANにインスパイアされたBNCR-GANは、画像、ボケカーネル、ノイズ、品質要素ジェネレータで構成される多重ジェネレータモデルを使用する。
しかし,nr-ganとは対照的に,非可逆的な特性に対処するために,劣化前後のバイパスを用いてデータ駆動方式で劣化強度値を調整するマスキングアーキテクチャを導入する。
さらに, ボケ, ノイズ, 圧縮の組み合わせによる不確実性を抑制するため, 劣化強度に応じて可逆的劣化過程間の一貫性を規定する適応的一貫性損失を導入する。
CIFAR-10の大規模比較とFFHQの一般性解析によるBNCR-GANの有効性を示す。
さらに,画像復元におけるBNCR-GANの適用性を示す。
関連論文リスト
- Diffusion-based Extreme Image Compression with Compressed Feature Initialization [29.277211609920155]
Relay Residual Diffusion Extreme Image Compression (RDEIC)を提案する。
まず, 純雑音ではなく, 付加雑音を付加した画像の圧縮潜時特徴を出発点として, 復調過程の不要な初期段階を除去する。
提案手法は,最先端の視覚的品質を達成し,既存の拡散に基づく極端画像圧縮手法よりも忠実度と効率性が優れていることを示す。
論文 参考訳(メタデータ) (2024-10-03T16:24:20Z) - Restoration of the JPEG Maximum Lossy Compressed Face Images with
Hourglass Block based on Early Stopping Discriminator [0.0]
本稿では,GAN-based net-work法による最大圧縮により大きな損失を被ったJPEG画像の復元について述べる。
このネットワークは、自然と高性能の画像を生成するために、LFロスとHFロスという2つの損失関数を組み込んでいる。
その結果,圧縮画像のブロックフェノメノンが除去され,識別可能なアイデンティティが生成されることがわかった。
論文 参考訳(メタデータ) (2023-06-22T09:21:48Z) - DR2: Diffusion-based Robust Degradation Remover for Blind Face
Restoration [66.01846902242355]
ブラインド顔復元は通常、トレーニングのための事前定義された劣化モデルで劣化した低品質データを合成する。
トレーニングデータに現実のケースをカバーするために、あらゆる種類の劣化を含めることは、高価で実現不可能である。
本稿では、まず、劣化した画像を粗いが劣化不変な予測に変換し、次に、粗い予測を高品質な画像に復元するために拡張モジュールを使用するロバスト劣化再帰法(DR2)を提案する。
論文 参考訳(メタデータ) (2023-03-13T06:05:18Z) - SAR Despeckling using a Denoising Diffusion Probabilistic Model [52.25981472415249]
スペックルの存在は画像品質を劣化させ、SAR画像理解アプリケーションの性能に悪影響を及ぼす。
本稿では,SAR脱種のための拡散確率モデルであるSAR-DDPMを紹介する。
提案手法は, 最先端の切り離し法と比較して, 定量化と定性化の両面で有意な改善を実現している。
論文 参考訳(メタデータ) (2022-06-09T14:00:26Z) - Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis [148.16279746287452]
本研究では,残差畳み込み層の局所モデリング能力とスウィントランスブロックの非局所モデリング能力を組み込むスウィンコンブブロックを提案する。
トレーニングデータ合成のために,異なる種類のノイズを考慮した実用的なノイズ劣化モデルの設計を行う。
AGWN除去と実画像復号化の実験は、新しいネットワークアーキテクチャ設計が最先端の性能を達成することを実証している。
論文 参考訳(メタデータ) (2022-03-24T18:11:31Z) - Designing a Practical Degradation Model for Deep Blind Image
Super-Resolution [134.9023380383406]
単一画像スーパーレゾリューション (sisr) 法は, 推定劣化モデルが実画像から逸脱した場合はうまく動作しない。
本稿では, ランダムにシャッフルされたブラー, ダウンサンプリング, ノイズ劣化からなる, より複雑で実用的な劣化モデルを提案する。
論文 参考訳(メタデータ) (2021-03-25T17:40:53Z) - Super-Resolution of Real-World Faces [3.4376560669160394]
実の低解像度 (LR) の顔画像は、変わらず複雑で既知のダウンサンプリングカーネルによってキャプチャされる劣化を含んでいる。
本稿では,特徴抽出モジュールがLR画像からロバストな特徴を抽出する2つのモジュール超解像ネットワークを提案する。
我々は、劣化GANを訓練し、双対的に縮小されたクリーン画像を実際の劣化画像に変換し、得られた劣化LR画像と、そのクリーンLR画像とを補間する。
論文 参考訳(メタデータ) (2020-11-04T17:25:54Z) - Reconstructing the Noise Manifold for Image Denoising [56.562855317536396]
本稿では,画像ノイズ空間の構造を明示的に活用するcGANを提案する。
画像ノイズの低次元多様体を直接学習することにより、この多様体にまたがる情報のみをノイズ画像から除去する。
我々の実験に基づいて、我々のモデルは既存の最先端アーキテクチャを大幅に上回っている。
論文 参考訳(メタデータ) (2020-02-11T00:31:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。