論文の概要: One Model to Reconstruct Them All: A Novel Way to Use the Stochastic
Noise in StyleGAN
- arxiv url: http://arxiv.org/abs/2010.11113v1
- Date: Wed, 21 Oct 2020 16:24:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 23:43:12.140463
- Title: One Model to Reconstruct Them All: A Novel Way to Use the Stochastic
Noise in StyleGAN
- Title(参考訳): すべてを再構築する1つのモデル:スタイルガンの確率的ノイズを使う新しい方法
- Authors: Christian Bartz, Joseph Bethge, Haojin Yang, Christoph Meinel
- Abstract要約: 本稿では,複数のデータ領域にまたがる非常に高品質な画像を再構成可能な,新しいスタイルGANベースのオートエンコーダアーキテクチャを提案する。
提案アーキテクチャでは,従来のアプローチの約28倍高速な単一GPU上で,毎秒40イメージを処理可能である。
- 参考スコア(独自算出の注目度): 10.810541849249821
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative Adversarial Networks (GANs) have achieved state-of-the-art
performance for several image generation and manipulation tasks. Different
works have improved the limited understanding of the latent space of GANs by
embedding images into specific GAN architectures to reconstruct the original
images. We present a novel StyleGAN-based autoencoder architecture, which can
reconstruct images with very high quality across several data domains. We
demonstrate a previously unknown grade of generalizablility by training the
encoder and decoder independently and on different datasets. Furthermore, we
provide new insights about the significance and capabilities of noise inputs of
the well-known StyleGAN architecture. Our proposed architecture can handle up
to 40 images per second on a single GPU, which is approximately 28x faster than
previous approaches. Finally, our model also shows promising results, when
compared to the state-of-the-art on the image denoising task, although it was
not explicitly designed for this task.
- Abstract(参考訳): Generative Adversarial Networks (GAN) は、複数の画像生成および操作タスクに対して最先端のパフォーマンスを達成した。
異なる作業により、元のイメージを再構築するために特定のGANアーキテクチャにイメージを埋め込むことにより、GANの潜伏空間の限られた理解が向上した。
本稿では,複数のデータ領域にまたがる非常に高品質な画像を再構成可能な,新しいスタイルGANベースのオートエンコーダアーキテクチャを提案する。
我々は、エンコーダとデコーダを独立して異なるデータセット上でトレーニングすることにより、これまで知られていなかった一般性の評価を示す。
さらに、よく知られたStyleGANアーキテクチャのノイズ入力の意義と能力に関する新たな知見を提供する。
提案するアーキテクチャは,1つのgpu上で最大40イメージを処理可能で,従来手法の約28倍高速である。
最後に、このモデルは、画像のデノイジングタスクの最先端と比較すると、このタスクのために明示的に設計されたものではないが、有望な結果も示しています。
関連論文リスト
- EGAIN: Extended GAn INversion [5.602947425285195]
GAN(Generative Adversarial Networks)は近年大きな進歩を遂げている。
近年のGANは、非絡み合った潜在空間の機能を符号化することが証明されている。
GANインバージョンは、実際の顔画像の顔意味論を操作するための扉を開く。
論文 参考訳(メタデータ) (2023-12-22T23:25:17Z) - Unlocking Pre-trained Image Backbones for Semantic Image Synthesis [29.688029979801577]
本稿では,現実的な画像を生成するセマンティック画像合成のための新しい種類のGAN識別器を提案する。
DP-SIMSをダブした本モデルでは,ADE-20K,COCO-Stuff,Cityscapesの入力ラベルマップと画像品質と一貫性の両面から,最新の結果が得られる。
論文 参考訳(メタデータ) (2023-12-20T09:39:19Z) - Practical Blind Image Denoising via Swin-Conv-UNet and Data Synthesis [148.16279746287452]
本研究では,残差畳み込み層の局所モデリング能力とスウィントランスブロックの非局所モデリング能力を組み込むスウィンコンブブロックを提案する。
トレーニングデータ合成のために,異なる種類のノイズを考慮した実用的なノイズ劣化モデルの設計を行う。
AGWN除去と実画像復号化の実験は、新しいネットワークアーキテクチャ設計が最先端の性能を達成することを実証している。
論文 参考訳(メタデータ) (2022-03-24T18:11:31Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Self-Denoising Neural Networks for Few Shot Learning [66.38505903102373]
既存のニューラルアーキテクチャの複数の段階でノイズを追加すると同時に、この付加ノイズに対して堅牢であるように学習する新しいトレーニングスキームを提案する。
このアーキテクチャは、SDNN(Self-Denoising Neural Network)と呼ばれ、現代の畳み込みニューラルネットワークに容易に適用できます。
論文 参考訳(メタデータ) (2021-10-26T03:28:36Z) - Generating Diverse Structure for Image Inpainting With Hierarchical
VQ-VAE [74.29384873537587]
本稿では,異なる構造を持つ複数の粗い結果を第1段階で生成し,第2段階ではテクスチャを増補して各粗い結果を別々に洗練する,多彩な塗布用2段階モデルを提案する。
CelebA-HQ, Places2, ImageNetデータセットによる実験結果から,本手法は塗布ソリューションの多様性を向上するだけでなく,生成した複数の画像の視覚的品質も向上することが示された。
論文 参考訳(メタデータ) (2021-03-18T05:10:49Z) - Multi-Stage Progressive Image Restoration [167.6852235432918]
本稿では、これらの競合する目標を最適にバランスできる新しい相乗的設計を提案する。
本提案では, 劣化した入力の復元関数を段階的に学習する多段階アーキテクチャを提案する。
MPRNetという名前の密接な相互接続型マルチステージアーキテクチャは、10のデータセットに対して強力なパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2021-02-04T18:57:07Z) - Spectrally Consistent UNet for High Fidelity Image Transformations [5.494315657902533]
畳み込みニューラルネットワーク(CNN)は、多くのイメージングタスクで使われている現在のデファクトモデルである。
本研究では、UNetsの構造バイアスとそれらが出力に与える影響を評価する方法を提案する。
スペクトル的に一貫した出力を提供する Guided Image Filter の新たな使用法に基づき,新しいアップサンプリングモジュールを提案する。
論文 参考訳(メタデータ) (2020-04-22T17:04:02Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z) - GAN Compression: Efficient Architectures for Interactive Conditional
GANs [45.012173624111185]
最近のコンディショナル・ジェネレーティブ・アドバイサル・ネットワーク(cGAN)は、現代の認識CNNよりも1~2桁の計算集約性がある。
本稿では,cGANにおけるジェネレータの推論時間とモデルサイズを低減するための汎用圧縮フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-19T17:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。