論文の概要: Toward Spatially Unbiased Generative Models
- arxiv url: http://arxiv.org/abs/2108.01285v1
- Date: Tue, 3 Aug 2021 04:13:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2021-08-04 14:06:34.801522
- Title: Toward Spatially Unbiased Generative Models
- Title(参考訳): 空間的偏りのない生成モデルに向けて
- Authors: Jooyoung Choi, Jungbeom Lee, Yonghyun Jeong, Sungroh Yoon
- Abstract要約: 最近の画像生成モデルは顕著な生成性能を示している。
しかし、それらは、空間バイアスと呼ばれるデータセットの強い位置優先を反映している。
生成元は空間的コンテンツを描画するために暗黙的な位置エンコーディングに頼っていると論じる。
- 参考スコア(独自算出の注目度): 19.269719158344508
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent image generation models show remarkable generation performance.
However, they mirror strong location preference in datasets, which we call
spatial bias. Therefore, generators render poor samples at unseen locations and
scales. We argue that the generators rely on their implicit positional encoding
to render spatial content. From our observations, the generator's implicit
positional encoding is translation-variant, making the generator spatially
biased. To address this issue, we propose injecting explicit positional
encoding at each scale of the generator. By learning the spatially unbiased
generator, we facilitate the robust use of generators in multiple tasks, such
as GAN inversion, multi-scale generation, generation of arbitrary sizes and
aspect ratios. Furthermore, we show that our method can also be applied to
denoising diffusion probabilistic models.
- Abstract(参考訳): 最近の画像生成モデルは顕著な生成性能を示している。
しかしそれらは、私たちが空間バイアスと呼ぶデータセットの強い位置選好を反映している。
そのため、発電機は見えない場所やスケールでサンプルをレンダリングする。
生成者は空間的コンテンツを描画するために暗黙的な位置エンコーディングに頼る。
我々の観測から、発電機の暗黙的な位置符号化は翻訳変種であり、発電機は空間的に偏っている。
この問題に対処するために、生成器の各スケールで明示的な位置エンコーディングを注入することを提案する。
空間的偏りのないジェネレータを学習することにより,ganインバージョン,マルチスケール生成,任意のサイズの生成,アスペクト比など,複数のタスクにおけるジェネレータの堅牢な使用が促進される。
さらに,本手法は拡散確率モデルのデノベーションにも適用可能であることを示す。
関連論文リスト
- Improving Out-of-Distribution Robustness of Classifiers via Generative
Interpolation [56.620403243640396]
ディープニューラルネットワークは、独立かつ同一に分散されたデータ(すなわち、d)から学習する上で、優れたパフォーマンスを達成する。
しかし、アウト・オブ・ディストリビューション(OoD)データを扱う場合、その性能は著しく低下する。
多様なOoDサンプルを合成するために,複数のドメインから学習した生成モデルを融合するための生成補間法(Generative Interpolation)を開発した。
論文 参考訳(メタデータ) (2023-07-23T03:53:53Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Self-Conditioned Generative Adversarial Networks for Image Editing [61.50205580051405]
Generative Adversarial Networks (GAN) はバイアスの影響を受けやすい。
我々は、このバイアスが公平性だけでなく、分布のコアから逸脱する際の潜在トラバース編集手法の崩壊に重要な役割を果たしていると論じる。
論文 参考訳(メタデータ) (2022-02-08T18:08:24Z) - AE-StyleGAN: Improved Training of Style-Based Auto-Encoders [21.51697087024866]
StyleGANは、近年、データ生成と操作に関して印象的な成果を上げている。
本稿では, 画像から潜伏空間への逆転過程を容易にし, 実際のデータ再構成を強制することは, より不整合な潜伏空間へと導かれるか?
本稿では,エンコーダとジェネレータをエンドツーエンドに最適化したスタイルベースのオートエンコーダをトレーニングする手法について述べる。
論文 参考訳(メタデータ) (2021-10-17T04:25:51Z) - Slimmable Generative Adversarial Networks [54.61774365777226]
近年、GAN(Generative adversarial Network)は目覚ましい進歩を遂げていますが、モデルの継続的な拡大は、実用的なアプリケーションに広く展開することを困難にしています。
本稿では,実行時の各種品質効率トレードオフに対応するため,発電機の幅を柔軟に切り替えることのできるスリムブルGANを提案する。
論文 参考訳(メタデータ) (2020-12-10T13:35:22Z) - Positional Encoding as Spatial Inductive Bias in GANs [97.6622154941448]
SinGANは限られた有効な受容器分野にもかかわらず内部パッチ配分の学習の印象的な機能を示します。
本研究では,発電機のパディングゼロ時における暗黙的位置符号化によって,このような能力が大幅にもたらされることを示した。
本稿では,新しいマルチスケール学習戦略を提案し,その効果を最新型無条件発電機stylegan2で実証する。
論文 参考訳(メタデータ) (2020-12-09T18:27:16Z) - Mode Penalty Generative Adversarial Network with adapted Auto-encoder [0.15229257192293197]
本稿では,事前学習した自動エンコーダと組み合わされたモードペナルティGANを提案する。
提案手法をGANに適用することにより, ジェネレータの最適化がより安定し, 実験による収束が早くなることを示す。
論文 参考訳(メタデータ) (2020-11-16T03:39:53Z) - Generative models with kernel distance in data space [10.002379593718471]
LCWジェネレータはガウスノイズをデータ空間に変換する際に古典的なGANに似ている。
第一に、カーネル測度を用いたオートエンコーダに基づくアーキテクチャは、データの多様体をモデル化するために構築される。
最終モデルを得るために、ガウスからラテンへのラテントトリック写像を提案する。
論文 参考訳(メタデータ) (2020-09-15T19:11:47Z) - Improving Inversion and Generation Diversity in StyleGAN using a
Gaussianized Latent Space [41.20193123974535]
現代のジェネレーティブ・アドバイサル・ネットワークは、低次元の学習された潜伏空間に住む潜伏ベクトルから、人工的で写実的な画像を作成することができる。
単純な非線形演算の下では、データ分布はガウス的としてモデル化でき、したがって十分な統計量を用いて表されることを示す。
得られた投影は、実際の画像と生成された画像の両方のパフォーマンスを用いて示されているように、潜在空間のより滑らかでより良い振る舞いの領域にある。
論文 参考訳(メタデータ) (2020-09-14T15:45:58Z) - Discriminator Contrastive Divergence: Semi-Amortized Generative Modeling
by Exploring Energy of the Discriminator [85.68825725223873]
GAN(Generative Adversarial Networks)は、高次元データのモデリングにおいて大きな可能性を秘めている。
本稿では,WGANの識別器の特性を活かした識別器コントラストの多様性について紹介する。
我々は、合成データと実世界の画像生成ベンチマークの両方において、大幅に改善された生成の利点を実証する。
論文 参考訳(メタデータ) (2020-04-05T01:50:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。