論文の概要: Improving GAN Equilibrium by Raising Spatial Awareness
- arxiv url: http://arxiv.org/abs/2112.00718v1
- Date: Wed, 1 Dec 2021 18:55:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 14:53:34.454236
- Title: Improving GAN Equilibrium by Raising Spatial Awareness
- Title(参考訳): 空間意識向上によるgan均衡の改善
- Authors: Jianyuan Wang, Ceyuan Yang, Yinghao Xu, Yujun Shen, Hongdong Li, Bolei
Zhou
- Abstract要約: ジェネレータ(G)とディスクリミネータ(D)の対向トレーニングに基づいてGAN(Generative Adversarial Networks)を構築する
実際には、GANトレーニングにおいてそのような平衡を達成することは困難であり、代わりにDは常にGを超える。
本稿では,Gの空間認識とDから誘導される注意マップの整合性を提案する。
- 参考スコア(独自算出の注目度): 80.71970464638585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of Generative Adversarial Networks (GANs) is largely built upon
the adversarial training between a generator (G) and a discriminator (D). They
are expected to reach a certain equilibrium where D cannot distinguish the
generated images from the real ones. However, in practice it is difficult to
achieve such an equilibrium in GAN training, instead, D almost always surpasses
G. We attribute this phenomenon to the information asymmetry between D and G.
Specifically, we observe that D learns its own visual attention when
determining whether an image is real or fake, but G has no explicit clue on
which regions to focus on for a particular synthesis. To alleviate the issue of
D dominating the competition in GANs, we aim to raise the spatial awareness of
G. Randomly sampled multi-level heatmaps are encoded into the intermediate
layers of G as an inductive bias. Thus G can purposefully improve the synthesis
of certain image regions. We further propose to align the spatial awareness of
G with the attention map induced from D. Through this way we effectively lessen
the information gap between D and G. Extensive results show that our method
pushes the two-player game in GANs closer to the equilibrium, leading to a
better synthesis performance. As a byproduct, the introduced spatial awareness
facilitates interactive editing over the output synthesis. Demo video and more
results are at https://genforce.github.io/eqgan/.
- Abstract(参考訳): GAN(Generative Adversarial Networks)の成功は、ジェネレータ(G)とディスクリミネーター(D)の間の敵の訓練に基づいて構築されている。
D が生成した画像と実画像とを区別できないような一定の平衡に達することが期待されている。
しかし、実際には、GANトレーニングにおいてそのような平衡を達成することは困難であり、代わりに、D は G をほぼ常に上回る。我々はこの現象を、D と G の間の情報非対称性に帰着する。
我々は,ganにおける競争をdで支配する問題を軽減するため,g の中間層にランダムにサンプリングされたマルチレベルヒートマップをインダクティブバイアスとして符号化するなど,g の空間的意識を高めることを目的としている。
したがって、Gは特定の画像領域の合成を意図的に改善することができる。
我々はさらに,G の空間認識を D から誘導される注意マップに合わせることを提案する。この方法では,D と G の間の情報ギャップを効果的に小さくする。
副産物として導入される空間認識は、出力合成よりもインタラクティブな編集を容易にする。
デモビデオはhttps://genforce.github.io/eqgan/。
関連論文リスト
- GeoGuide: Geometric guidance of diffusion models [8.34616719984217]
GeoGuideは、データ多様体から拡散モデルの軌道距離をトレースするガイダンスモデルである。
FIDスコアと生成された画像の品質の両方に関して、確率論的アプローチ ADM-G を超えている。
論文 参考訳(メタデータ) (2024-07-17T07:56:27Z) - Spatial Steerability of GANs via Self-Supervision from Discriminator [123.27117057804732]
本稿では,GANの空間的ステアビリティを向上させるための自己教師型アプローチを提案する。
具体的には、空間帰納バイアスとして生成モデルの中間層に符号化されるランダムなガウス熱マップを設計する。
推論中、ユーザは直感的に空間のヒートマップと対話し、シーンのレイアウトを調整したり、移動したり、オブジェクトを削除したりすることで、出力画像を編集することができる。
論文 参考訳(メタデータ) (2023-01-20T07:36:29Z) - GLeaD: Improving GANs with A Generator-Leading Task [44.14659523033865]
ジェネレータ(G)とディスクリミネータ(D)の2プレーヤゲームとしてGAN(Generative Adversarial Network)を定式化する
本稿では,G が D にタスクを割り当てる新たなパラダイムを提案する。
論文 参考訳(メタデータ) (2022-12-07T16:25:19Z) - DGL-GAN: Discriminator Guided Learning for GAN Compression [57.6150859067392]
高計算コストのGAN(Generative Adversarial Networks)は、ランダムノイズから高分解能画像を合成する際、顕著な成果を上げている。
本稿では,bf DGL-GAN と呼ばれるバニラ bf GAN を圧縮するための,新しい単純な bf 識別器 bf 誘導 bf 学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-13T09:24:45Z) - Positional Encoding as Spatial Inductive Bias in GANs [97.6622154941448]
SinGANは限られた有効な受容器分野にもかかわらず内部パッチ配分の学習の印象的な機能を示します。
本研究では,発電機のパディングゼロ時における暗黙的位置符号化によって,このような能力が大幅にもたらされることを示した。
本稿では,新しいマルチスケール学習戦略を提案し,その効果を最新型無条件発電機stylegan2で実証する。
論文 参考訳(メタデータ) (2020-12-09T18:27:16Z) - Interpreting Galaxy Deblender GAN from the Discriminator's Perspective [50.12901802952574]
本研究は、ネットワークの主要なコンポーネントである識別器の動作に焦点を当てるが、しばしば見落とされがちな役割を担っている。
本手法は, 生成銀河画像と地中真理画像とを区別する際に, 識別器の注意領域を明確に明らかにする。
論文 参考訳(メタデータ) (2020-01-17T04:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。