論文の概要: Disentangled Image Generation Through Structured Noise Injection
- arxiv url: http://arxiv.org/abs/2004.12411v2
- Date: Tue, 5 May 2020 15:41:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 13:35:01.499518
- Title: Disentangled Image Generation Through Structured Noise Injection
- Title(参考訳): 構造ノイズ注入による遠絡画像生成
- Authors: Yazeed Alharbi, Peter Wonka
- Abstract要約: 生成ネットワークの第1層における乱れは生成した画像の乱れにつながることを示す。
本研究では,前景の空間的ゆがみ,空間的ゆがみ,空間的ゆがみ,背景からの物体のゆがみを実現する。
これは、FFHQデータセットの最先端のメソッドよりも、実証的に不整合スコアが向上する。
- 参考スコア(独自算出の注目度): 48.956122902434444
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We explore different design choices for injecting noise into generative
adversarial networks (GANs) with the goal of disentangling the latent space.
Instead of traditional approaches, we propose feeding multiple noise codes
through separate fully-connected layers respectively. The aim is restricting
the influence of each noise code to specific parts of the generated image. We
show that disentanglement in the first layer of the generator network leads to
disentanglement in the generated image. Through a grid-based structure, we
achieve several aspects of disentanglement without complicating the network
architecture and without requiring labels. We achieve spatial disentanglement,
scale-space disentanglement, and disentanglement of the foreground object from
the background style allowing fine-grained control over the generated images.
Examples include changing facial expressions in face images, changing beak
length in bird images, and changing car dimensions in car images. This
empirically leads to better disentanglement scores than state-of-the-art
methods on the FFHQ dataset.
- Abstract(参考訳): 潜在空間を分離することを目的として,gans(generative adversarial network)にノイズを注入する異なる設計選択について検討する。
従来の手法の代わりに,完全連結層を分割して複数のノイズコードを供給する。
目的は、生成した画像の特定部分に対する各ノイズコードの影響を制限することである。
生成ネットワークの第1層における乱れは生成した画像の乱れにつながることを示す。
グリッドベースの構造により,ネットワークアーキテクチャを複雑にすることなく,ラベルを必要とせず,複数の非絡み合いを実現する。
生成した画像のきめ細かい制御が可能な背景形状から、空間的ゆがみ、空間的ゆがみ、空間的ゆがみ、および前景オブジェクトのゆがみを実現する。
例えば、顔画像における表情の変化、鳥の画像におけるくちばしの長さの変化、車の画像における車の寸法の変化などである。
これにより、ffhqデータセットの最先端のメソッドよりも、経験上、ジエンタグルメントスコアが向上する。
関連論文リスト
- Compressive Sensing with Tensorized Autoencoder [22.89029876274012]
多くの場合、コレクション内の異なるイメージは互いに明瞭なバージョンである。
本研究の目的は,データに先行する構造として,接地木(クリーン)画像にアクセスすることなく画像の復元を行うことである。
本稿では,データに構造的制約を課すために,埋め込み空間上でテンソルリングの分解を施したオートエンコーダを学習することを提案する。
論文 参考訳(メタデータ) (2023-03-10T22:59:09Z) - Dual Pyramid Generative Adversarial Networks for Semantic Image
Synthesis [94.76988562653845]
セマンティック画像合成の目標は、セマンティックラベルマップからフォトリアリスティック画像を生成することである。
しかし、現在の最先端のアプローチは、さまざまなスケールで画像で現実的なオブジェクトを生成するのに依然として苦労している。
本研究では,空間適応型正規化ブロックの条件付けを各スケールで同時に学習するDual Pyramid Generative Adversarial Network (DP-GAN)を提案する。
論文 参考訳(メタデータ) (2022-10-08T18:45:44Z) - BlobGAN: Spatially Disentangled Scene Representations [67.60387150586375]
本研究では,シーン生成モデルのための教師なし中間レベル表現を提案する。
この表現は、ピクセル単位でもイメージ単位でもなく、むしろ空間的に、奥行き順に並べられた特徴の「ブロブ」の集合としてモデル化されている。
論文 参考訳(メタデータ) (2022-05-05T17:59:55Z) - Alias-Free Generative Adversarial Networks [48.09216521763342]
生成的敵ネットワークは 絶対的なピクセル座標に依存します 不健全な方法で
我々は、生成ネットワーク内でエイリアスを引き起こす不注意な信号処理に根本原因を辿る。
我々の結果は、ビデオやアニメーションに適した生成モデルを作るための道を開いた。
論文 参考訳(メタデータ) (2021-06-23T14:20:01Z) - Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。
そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。
StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文 参考訳(メタデータ) (2021-04-29T17:58:35Z) - LatentKeypointGAN: Controlling Images via Latent Keypoints [23.670795505376336]
古典的なGAN目標に対して,2段階のGAN訓練を施したエンドツーエンドであるLatntKeypointGANを紹介する。
LatentKeypointGANは、生成されたイメージの再配列に使用できる解釈可能な潜在空間を提供する。
さらに、キーポイントとマッチング画像の明示的な生成により、教師なしキーポイント検出のための新しいGANベースの方法が可能になる。
論文 参考訳(メタデータ) (2021-03-29T17:59:10Z) - Deep-Masking Generative Network: A Unified Framework for Background
Restoration from Superimposed Images [36.7646332887842]
本稿では,重畳画像からの背景復元のための統合フレームワークであるDeep-Masking Generative Network(DMGN)を提案する。
まず、粗い背景画像とノイズ画像とを並列に生成し、さらにノイズ画像を利用して背景画像を洗練する。
我々の実験によると、DMGNは各タスクに特化して設計された最先端の手法を一貫して上回っている。
論文 参考訳(メタデータ) (2020-10-09T01:47:52Z) - Reconstructing the Noise Manifold for Image Denoising [56.562855317536396]
本稿では,画像ノイズ空間の構造を明示的に活用するcGANを提案する。
画像ノイズの低次元多様体を直接学習することにより、この多様体にまたがる情報のみをノイズ画像から除去する。
我々の実験に基づいて、我々のモデルは既存の最先端アーキテクチャを大幅に上回っている。
論文 参考訳(メタデータ) (2020-02-11T00:31:31Z) - OneGAN: Simultaneous Unsupervised Learning of Conditional Image
Generation, Foreground Segmentation, and Fine-Grained Clustering [100.32273175423146]
本研究では、教師なしの方法で、条件付き画像生成装置、前景抽出とセグメンテーション、オブジェクトの削除と背景補完を同時に学習する方法を提案する。
Geneversarative Adrial Network と Variational Auto-Encoder を組み合わせることで、複数のエンコーダ、ジェネレータ、ディスクリミネータを組み合わせ、全てのタスクを一度に解くことができる。
論文 参考訳(メタデータ) (2019-12-31T18:15:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。