論文の概要: Creating High Resolution Images with a Latent Adversarial Generator
- arxiv url: http://arxiv.org/abs/2003.02365v1
- Date: Wed, 4 Mar 2020 23:23:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-26 12:42:16.254768
- Title: Creating High Resolution Images with a Latent Adversarial Generator
- Title(参考訳): 遅延逆数発生器による高分解能画像の作成
- Authors: David Berthelot, Peyman Milanfar, Ian Goodfellow
- Abstract要約: 自然画像の特定の「部分空間」から、同じ部分空間から低解像度の画像に向けて、画像のサンプルを作成することを提案する。
本手法は, 知覚的損失を用いて, 敵の潜伏空間でのみ学習する。
- 参考スコア(独自算出の注目度): 16.592419949648082
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating realistic images is difficult, and many formulations for this task
have been proposed recently. If we restrict the task to that of generating a
particular class of images, however, the task becomes more tractable. That is
to say, instead of generating an arbitrary image as a sample from the manifold
of natural images, we propose to sample images from a particular "subspace" of
natural images, directed by a low-resolution image from the same subspace. The
problem we address, while close to the formulation of the single-image
super-resolution problem, is in fact rather different. Single image
super-resolution is the task of predicting the image closest to the ground
truth from a relatively low resolution image. We propose to produce samples of
high resolution images given extremely small inputs with a new method called
Latent Adversarial Generator (LAG). In our generative sampling framework, we
only use the input (possibly of very low-resolution) to direct what class of
samples the network should produce. As such, the output of our algorithm is not
a unique image that relates to the input, but rather a possible se} of related
images sampled from the manifold of natural images. Our method learns
exclusively in the latent space of the adversary using perceptual loss -- it
does not have a pixel loss.
- Abstract(参考訳): 近年,現実的な画像の生成は困難であり,多くの定式化が提案されている。
しかし、特定の画像のクラスを生成するタスクに制限を加えると、タスクはよりトラクタブルになる。
すなわち、自然画像の多様体から標本として任意の画像を生成する代わりに、同じ部分空間から低解像度の画像によって指示される自然画像の特定の「部分空間」から画像をサンプリングすることを提案する。
私たちが取り組んでいる問題は、シングルイメージのスーパーレゾリューション問題の定式化に近いが、実際にはかなり異なる。
単一画像超解像は、比較的低解像度の画像から地上の真理に最も近い画像を予測するタスクである。
本稿では,Latent Adversarial Generator (LAG) と呼ばれる新しい手法を用いて,非常に小さな入力を与えられた高解像度画像のサンプルを作成する。
生成サンプリングフレームワークでは、入力(おそらく非常に低解像度)のみを使用して、ネットワークが生成すべきサンプルのクラスを指示します。
このように、我々のアルゴリズムの出力は、入力に関連するユニークな画像ではなく、自然画像の多様体からサンプリングされた関連する画像のSe}である。
本手法は知覚的損失を用いて敵の潜在空間でのみ学習するが、画素損失は持たない。
関連論文リスト
- Prompt Recovery for Image Generation Models: A Comparative Study of Discrete Optimizers [58.50071292008407]
本稿では,近年の離散最適化手法の突発的逆転問題に対する直接比較について述べる。
逆プロンプトと基底真理画像とのCLIP類似性に着目し, 逆プロンプトが生成する画像と基底真理画像との類似性について検討した。
論文 参考訳(メタデータ) (2024-08-12T21:35:59Z) - High-Resolution GAN Inversion for Degraded Images in Large Diverse
Datasets [39.21692649763314]
本稿では,StyleGAN-XLの強力な生成能力を利用した新しいGANインバージョンフレームワークを提案する。
StyleGAN-XLによる逆問題を軽減するために、Clustering & Regularize Inversion (CRI)を提案する。
我々は、複雑な自然画像の複数の復元作業(例えば、塗装、着色、超解像)において、CRI方式を検証し、定量的および定性的な結果を示す。
論文 参考訳(メタデータ) (2023-02-07T11:24:11Z) - Any-resolution Training for High-resolution Image Synthesis [55.19874755679901]
生成モデルは、様々な大きさの自然画像であっても、一定の解像度で動作します。
すべてのピクセルが重要であり、そのネイティブ解像度で収集された可変サイズのイメージを持つデータセットを作成する、と我々は主張する。
ランダムなスケールでパッチをサンプリングし、可変出力解像度で新しいジェネレータを訓練するプロセスである。
論文 参考訳(メタデータ) (2022-04-14T17:59:31Z) - InfinityGAN: Towards Infinite-Resolution Image Synthesis [92.40782797030977]
任意の解像度画像を生成するinfinityganを提案する。
少ない計算資源でパッチバイパッチをシームレスに訓練し、推論する方法を示す。
論文 参考訳(メタデータ) (2021-04-08T17:59:30Z) - Invertible Image Rescaling [118.2653765756915]
Invertible Rescaling Net (IRN) を開発した。
我々は、ダウンスケーリングプロセスにおいて、指定された分布に従う潜在変数を用いて、失われた情報の分布をキャプチャする。
論文 参考訳(メタデータ) (2020-05-12T09:55:53Z) - Feature Super-Resolution Based Facial Expression Recognition for
Multi-scale Low-Resolution Faces [7.634398926381845]
超解像法はしばしば低分解能画像の高精細化に使用されるが、FERタスクの性能は極低分解能画像では制限される。
本研究では,物体検出のための特徴的超解像法に触発されて,頑健な表情認識のための新たな生成逆ネットワークに基づく超解像法を提案する。
論文 参考訳(メタデータ) (2020-04-05T15:38:47Z) - PULSE: Self-Supervised Photo Upsampling via Latent Space Exploration of
Generative Models [77.32079593577821]
PULSE (Photo Upsampling via Latent Space Exploration) は、それまで文献になかった解像度で高解像度でリアルな画像を生成する。
本手法は, 従来よりも高分解能, スケールファクターの知覚品質において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-08T16:44:31Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。