論文の概要: Diverse Similarity Encoder for Deep GAN Inversion
- arxiv url: http://arxiv.org/abs/2108.10201v3
- Date: Wed, 11 Dec 2024 16:03:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-12 13:58:45.527969
- Title: Diverse Similarity Encoder for Deep GAN Inversion
- Title(参考訳): 深部GANインバージョンのための逆類似性エンコーダ
- Authors: Cheng Yu, Wenmin Wang, Roberto Bugiolacchi,
- Abstract要約: 現在のGAN(Deep Generative Adversarial Network)は高品質な(HQ)画像を合成できるため、GANによる学習表現が好ましい。
GANインバージョンは、イメージを潜在空間に反転させる方法を研究する新しいアプローチの1つである。
既存のGANエンコーダはStyleGANの画像を反転させることができるが、他の深いGANに適応することはできない。
我々はこの問題に対処する新しいアプローチを提案する。潜在ベクトルと画像の多様な類似性を評価することにより、適応型エンコーダを設計し、多種多様な類似性エンコーダ(DSE)を設計する。
- 参考スコア(独自算出の注目度): 16.458842819785822
- License:
- Abstract: Current deep generative adversarial networks (GANs) can synthesize high-quality (HQ) images, so learning representation with GANs is favorable. GAN inversion is one of emerging approaches that study how to invert images into latent space. Existing GAN encoders can invert images on StyleGAN, but cannot adapt to other deep GANs. We propose a novel approach to address this issue. By evaluating diverse similarity in latent vectors and images, we design an adaptive encoder, named diverse similarity encoder (DSE), that can be expanded to a variety of state-of-the-art GANs. DSE makes GANs reconstruct higher fidelity images from HQ images, no matter whether they are synthesized or real images. DSE has unified convolutional blocks and adapts well to mainstream deep GANs, e.g., PGGAN, StyleGAN, and BigGAN.
- Abstract(参考訳): 現在のGAN(Deep Generative Adversarial Network)は高品質な(HQ)画像を合成できるため、GANによる学習表現が好ましい。
GANインバージョンは、イメージを潜在空間に反転させる方法を研究する新しいアプローチの1つである。
既存のGANエンコーダはStyleGANのイメージを反転させることができるが、他の深いGANに適応することはできない。
我々はこの問題に対処するための新しいアプローチを提案する。
遅延ベクトルと画像の多彩な類似性を評価することにより,多様類似性エンコーダ(DSE)と呼ばれる適応型エンコーダを設計し,様々な最先端のGANに拡張する。
DSEは、合成された画像や実際の画像であっても、本社画像から高い忠実度画像を再構成する。
DSEは統合された畳み込みブロックを持ち、主流の深いGAN(例えば、PGGAN、StyleGAN、BigGAN)に順応する。
関連論文リスト
- In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Towards Accurate Image Coding: Improved Autoregressive Image Generation
with Dynamic Vector Quantization [73.52943587514386]
既存のベクトル量子化(VQ)ベースの自己回帰モデルは、2段階生成パラダイムに従う。
画像領域を可変長符号に符号化する動的量子化VAE(DQ-VAE)を提案する。
論文 参考訳(メタデータ) (2023-05-19T14:56:05Z) - 3D-Aware Encoding for Style-based Neural Radiance Fields [50.118687869198716]
我々は、入力画像をNeRFジェネレータの潜時空間に投影する反転関数を学び、潜時符号に基づいて原画像の新しいビューを合成する。
2次元生成モデルのGANインバージョンと比較して、NeRFインバージョンは、1)入力画像の同一性を維持するだけでなく、2)生成した新規なビューにおいて3D一貫性を確保する必要がある。
スタイルベースNeRFインバージョンのための2段階エンコーダを提案する。
論文 参考訳(メタデータ) (2022-11-12T06:14:12Z) - Feature-Style Encoder for Style-Based GAN Inversion [1.9116784879310027]
本稿では,特徴型エンコーダ(Feature-Style encoder)と呼ばれる,GANインバージョンのための新しいアーキテクチャを提案する。
本モデルは,事前学習したスタイルベースGANモデルの潜在空間から,実画像の正確な逆変換を実現する。
エンコーダ構造のおかげで、モデルは高速で正確な画像編集を可能にする。
論文 参考訳(メタデータ) (2022-02-04T15:19:34Z) - Less is More: Pre-training a Strong Siamese Encoder Using a Weak Decoder [75.84152924972462]
多くの実世界のアプリケーションはSiameseネットワークを使用して、テキストシーケンスを大規模に効率的にマッチングします。
本稿では,シームズアーキテクチャにおけるシーケンスマッチング専用の言語モデルを事前学習する。
論文 参考訳(メタデータ) (2021-02-18T08:08:17Z) - GLEAN: Generative Latent Bank for Large-Factor Image Super-Resolution [85.53811497840725]
我々は,大因子画像超解像(SR)の復元品質を向上させるために,GAN(Generative Adversarial Networks),例えばStyleGAN(StyleGAN)が潜時バンクとして使用できることを示す。
我々の手法であるGenerative LatEnt bANk(GLEAN)は、事前訓練されたGANにカプセル化されているリッチで多様な事前情報を直接活用することで、既存のプラクティスを越えている。
GLEANによってアップスケールされた画像は、既存の方法と比較して忠実さとテクスチャ忠実さの点で明らかに改善されている。
論文 参考訳(メタデータ) (2020-12-01T18:56:14Z) - Encoding in Style: a StyleGAN Encoder for Image-to-Image Translation [42.62624182740679]
一般的な画像から画像への変換フレームワークであるピクセル2スタイル2ピクセル(pSp)を提案する。
我々のpSpフレームワークは、事前訓練されたStyleGANジェネレータに供給される一連のスタイルベクトルを直接生成する新しいエンコーダネットワークに基づいている。
論文 参考訳(メタデータ) (2020-08-03T15:30:38Z) - Adversarial Latent Autoencoders [7.928094304325116]
我々は共同で問題に取り組むオートエンコーダを導入し、それをAdversarial Latent Autoencoder (ALAE) と呼ぶ。
ALAEは、ジェネレータのみのアーキテクチャの能力を超えて、比較可能な最初のオートエンコーダである。
論文 参考訳(メタデータ) (2020-04-09T10:33:44Z) - In-Domain GAN Inversion for Real Image Editing [56.924323432048304]
トレーニング済みのGANジェネレータに実際のイメージを送出する一般的な方法は、遅延コードに戻すことである。
既存の反転法は、通常、画素値によってターゲット画像の再構成にフォーカスするが、反転したコードは元の潜伏空間のセマンティックドメインに着陸しない。
本稿では、入力画像を忠実に再構成し、変換されたコードが編集に意味のある意味を持つようにするためのドメイン内GAN逆変換手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T18:20:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。