論文の概要: Adversarial Latent Autoencoders
- arxiv url: http://arxiv.org/abs/2004.04467v1
- Date: Thu, 9 Apr 2020 10:33:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 02:18:55.958059
- Title: Adversarial Latent Autoencoders
- Title(参考訳): 逆潜在オートエンコーダ
- Authors: Stanislav Pidhorskyi, Donald Adjeroh, Gianfranco Doretto
- Abstract要約: 我々は共同で問題に取り組むオートエンコーダを導入し、それをAdversarial Latent Autoencoder (ALAE) と呼ぶ。
ALAEは、ジェネレータのみのアーキテクチャの能力を超えて、比較可能な最初のオートエンコーダである。
- 参考スコア(独自算出の注目度): 7.928094304325116
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoencoder networks are unsupervised approaches aiming at combining
generative and representational properties by learning simultaneously an
encoder-generator map. Although studied extensively, the issues of whether they
have the same generative power of GANs, or learn disentangled representations,
have not been fully addressed. We introduce an autoencoder that tackles these
issues jointly, which we call Adversarial Latent Autoencoder (ALAE). It is a
general architecture that can leverage recent improvements on GAN training
procedures. We designed two autoencoders: one based on a MLP encoder, and
another based on a StyleGAN generator, which we call StyleALAE. We verify the
disentanglement properties of both architectures. We show that StyleALAE can
not only generate 1024x1024 face images with comparable quality of StyleGAN,
but at the same resolution can also produce face reconstructions and
manipulations based on real images. This makes ALAE the first autoencoder able
to compare with, and go beyond the capabilities of a generator-only type of
architecture.
- Abstract(参考訳): オートエンコーダネットワークは、エンコーダ・ジェネレータマップを同時に学習することにより、生成特性と表現特性を組み合わせることを目的とした教師なしアプローチである。
広範に研究されているが、それらがGANの同じ生成力を持つか、あるいは非絡み合った表現を学ぶかという問題は、完全には解決されていない。
我々はこれらの問題に共同で取り組むオートエンコーダを導入し、それをAdversarial Latent Autoencoder (ALAE) と呼ぶ。
これはganトレーニング手順の最近の改善を活用できる一般的なアーキテクチャである。
MLPエンコーダをベースとしたオートエンコーダと,StyleGANジェネレータをベースとした「StyleALAE」という2つのオートエンコーダを設計した。
両アーキテクチャの絡み合い特性を検証する。
StyleALAEはStyleGANに匹敵する品質の1024×1024の顔画像を生成するだけでなく、同じ解像度で実際の画像に基づいて顔の再構成や操作を生成できることを示す。
これにより、alaeは、ジェネレータのみのアーキテクチャの能力を超えて、比較可能な最初のオートエンコーダになります。
関連論文リスト
- ARTEMIS: Using GANs with Multiple Discriminators to Generate Art [0.0]
本稿では,抽象芸術を創出する新しい手法を提案する。
まず、事前訓練されたVGGネットワークでソース画像から抽出された画像のスタイル表現を符号化し、復号するオートエンコーダを訓練する。
オートエンコーダのデコーダ成分を抽出し、GANのジェネレータとして使用する。
論文 参考訳(メタデータ) (2023-11-14T16:19:29Z) - In-Domain GAN Inversion for Faithful Reconstruction and Editability [132.68255553099834]
ドメイン誘導型ドメイン正規化とエンコーダで構成されたドメイン内GANインバージョンを提案し、事前学習されたGANモデルのネイティブ潜在空間における反転コードを正規化する。
エンコーダ構造,開始反転点,および逆パラメータ空間の効果を総合的に解析し,再構成品質と編集特性とのトレードオフを観察する。
論文 参考訳(メタデータ) (2023-09-25T08:42:06Z) - Towards Accurate Image Coding: Improved Autoregressive Image Generation
with Dynamic Vector Quantization [73.52943587514386]
既存のベクトル量子化(VQ)ベースの自己回帰モデルは、2段階生成パラダイムに従う。
画像領域を可変長符号に符号化する動的量子化VAE(DQ-VAE)を提案する。
論文 参考訳(メタデータ) (2023-05-19T14:56:05Z) - ALAP-AE: As-Lite-as-Possible Auto-Encoder [6.244939945140818]
本稿では,条件付き画像生成オートエンコーダが必要とするテンソル計算を削減するアルゴリズムを提案する。
条件付き画像生成タスクの性能向上を示す。
画像品質を維持しつつ、CPUのみのデバイス上で様々なオートエンコーダのリアルタイムバージョンを実現する。
論文 参考訳(メタデータ) (2022-03-19T18:03:08Z) - LoopITR: Combining Dual and Cross Encoder Architectures for Image-Text
Retrieval [117.15862403330121]
共同学習のためのネットワークにおいて,デュアルエンコーダとクロスエンコーダを組み合わせたLoopITRを提案する。
具体的には、二重エンコーダをクロスエンコーダに強陰性を与え、より識別性の高いクロスエンコーダを用いてその予測を二重エンコーダに戻す。
論文 参考訳(メタデータ) (2022-03-10T16:41:12Z) - Adversarial Neural Networks for Error Correcting Codes [76.70040964453638]
機械学習(ML)モデルの性能と適用性を高めるための一般的なフレームワークを紹介する。
本稿では,MLデコーダと競合する識別器ネットワークを組み合わせることを提案する。
我々のフレームワークはゲーム理論であり、GAN(Generative Adversarial Network)によって動機付けられている。
論文 参考訳(メタデータ) (2021-12-21T19:14:44Z) - AE-StyleGAN: Improved Training of Style-Based Auto-Encoders [21.51697087024866]
StyleGANは、近年、データ生成と操作に関して印象的な成果を上げている。
本稿では, 画像から潜伏空間への逆転過程を容易にし, 実際のデータ再構成を強制することは, より不整合な潜伏空間へと導かれるか?
本稿では,エンコーダとジェネレータをエンドツーエンドに最適化したスタイルベースのオートエンコーダをトレーニングする手法について述べる。
論文 参考訳(メタデータ) (2021-10-17T04:25:51Z) - Adaptable GAN Encoders for Image Reconstruction via Multi-type Latent
Vectors with Two-scale Attentions [24.308432688431996]
このような問題に対処する新しい手法(MTV-TSA)を提案する。
遅延空間からMTV(Multi-type Latent vector)、画像から2スケールアテンション(TSA)を作成することで、エンコーダのセットを設計することができる。
デザインされたエンコーダは、ほとんどの合成された本社画像から高忠実度画像を再構成することを可能にする。
論文 参考訳(メタデータ) (2021-08-23T14:37:58Z) - Autoencoders for unsupervised anomaly detection in high energy physics [105.54048699217668]
QCDジェット画像の背景にあるトップジェット画像のタグ付けについて検討する。
標準オートエンコーダ設定をモデル非依存の異常タガーとはみなせないことを示す。
モデル非依存異常検出の課題に対する性能改善策を提案する。
論文 参考訳(メタデータ) (2021-04-19T05:06:57Z) - GMM-Based Generative Adversarial Encoder Learning [39.57350884615545]
GANのジェネレーション機能とエンコーダを組み合わせたシンプルなアーキテクチャのセットアップを紹介します。
GMMを介してエンコーダ潜時空間の出力をモデル化し、この潜時空間を用いた良好なクラスタリングとGANによる画像生成の改善の両方をもたらす。
論文 参考訳(メタデータ) (2020-12-08T16:12:16Z) - Learning Autoencoders with Relational Regularization [89.53065887608088]
データ分散のオートエンコーダを学習するための新しいフレームワークを提案する。
エンフレレーショナル正規化によるモデルと対象分布の差を最小限にする
我々はこのフレームワークを2つのスケーラブルアルゴリズムで実装し、確率的および決定論的オートエンコーダの両方に適用する。
論文 参考訳(メタデータ) (2020-02-07T17:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。