論文の概要: Improved StyleGAN Embedding: Where are the Good Latents?
- arxiv url: http://arxiv.org/abs/2012.09036v2
- Date: Mon, 5 Apr 2021 00:01:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-09 15:07:07.313240
- Title: Improved StyleGAN Embedding: Where are the Good Latents?
- Title(参考訳): stylegan埋め込みの改善: 優れた潜在勢力はどこにあるか?
- Authors: Peihao Zhu, Rameen Abdal, Yipeng Qin, John Femiani, Peter Wonka
- Abstract要約: StyleGANは、実際の画像とほとんど区別できない写実的画像を生成することができる。
与えられた画像の埋め込みを見つけるというリバース問題は、問題となる。
本稿では,画像再構成と画像編集タスクのサポートを兼ね備えた埋め込みを見つけるという課題に対処する。
- 参考スコア(独自算出の注目度): 43.780075713984935
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: StyleGAN is able to produce photorealistic images that are almost
indistinguishable from real ones. The reverse problem of finding an embedding
for a given image poses a challenge. Embeddings that reconstruct an image well
are not always robust to editing operations. In this paper, we address the
problem of finding an embedding that both reconstructs images and also supports
image editing tasks. First, we introduce a new normalized space to analyze the
diversity and the quality of the reconstructed latent codes. This space can
help answer the question of where good latent codes are located in latent
space. Second, we propose an improved embedding algorithm using a novel
regularization method based on our analysis. Finally, we analyze the quality of
different embedding algorithms. We compare our results with the current
state-of-the-art methods and achieve a better trade-off between reconstruction
quality and editing quality.
- Abstract(参考訳): StyleGANは、実際の画像とほとんど区別できない写実的画像を生成することができる。
与えられた画像の埋め込みを見つけるというリバース問題は、問題となる。
画像をうまく再構築する埋め込みは、必ずしも編集操作にロバストではない。
本稿では,画像再構成と画像編集タスクのサポートを兼ね備えた埋め込みを見つけるという課題に対処する。
まず,復元された潜在コードの多様性と品質を分析するための新しい正規化空間を提案する。
この空間は、潜伏空間に良質な潜伏コードがあるかという疑問に答えるのに役立つ。
第2に,本解析に基づく新しい正規化手法を用いた埋め込みアルゴリズムの改良を提案する。
最後に,様々な組込みアルゴリズムの品質を分析する。
この結果と現在の最先端の手法を比較し,再構築品質と編集品質のトレードオフを改善する。
関連論文リスト
- ENTED: Enhanced Neural Texture Extraction and Distribution for
Reference-based Blind Face Restoration [51.205673783866146]
我々は,高品質でリアルな肖像画を復元することを目的とした,ブラインドフェイス修復のための新しいフレームワークであるENTEDを提案する。
劣化した入力画像と参照画像の間で高品質なテクスチャ特徴を伝達するために,テクスチャ抽出と分布の枠組みを利用する。
われわれのフレームワークにおけるStyleGANのようなアーキテクチャは、現実的な画像を生成するために高品質な潜伏符号を必要とする。
論文 参考訳(メタデータ) (2024-01-13T04:54:59Z) - Warping the Residuals for Image Editing with StyleGAN [5.733811543584874]
StyleGANモデルは、意味論的に解釈可能な潜在組織を通して編集機能を示す。
StyleGANの潜伏空間に画像を反転させる多くの研究が提案されている。
本稿では,高速遅延特徴を抽出し,フロー推定モジュールを含む新しい画像インバージョンアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-12-18T18:24:18Z) - Diverse Inpainting and Editing with GAN Inversion [4.234367850767171]
近年の逆転法では、実画像はStyleGANの潜伏空間に逆転可能であることが示されている。
本稿では,より困難な課題に取り組み,消去された画像をGANの潜伏空間に逆転させ,リアルな塗り絵や編集を行う。
論文 参考訳(メタデータ) (2023-07-27T17:41:36Z) - StyleDiffusion: Prompt-Embedding Inversion for Text-Based Editing [86.92711729969488]
我々は、画像の編集に事前訓練された拡散モデルの驚くべき能力を利用する。
彼らはモデルを微調整するか、事前訓練されたモデルの潜在空間で画像を反転させる。
選択された地域に対する不満足な結果と、非選択された地域における予期せぬ変化の2つの問題に悩まされている。
論文 参考訳(メタデータ) (2023-03-28T00:16:45Z) - StyleRes: Transforming the Residuals for Real Image Editing with
StyleGAN [4.7590051176368915]
実画像をStyleGANの潜伏空間に変換することは、広く研究されている問題である。
画像再構成の忠実さと画像編集の質とのトレードオフは、依然としてオープンな課題である。
高品質な編集による高忠実度画像インバージョンを実現するための新しい画像インバージョンフレームワークとトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-12-29T16:14:09Z) - Overparameterization Improves StyleGAN Inversion [66.8300251627992]
既存の反転アプローチは、有望だが不完全な結果が得られる。
これにより、エンコーダを必要とせずに、ほぼ完璧な画像再構成が得られることを示す。
われわれのアプローチは、画像間の現実的な補間による編集可能性も維持する。
論文 参考訳(メタデータ) (2022-05-12T18:42:43Z) - ARCH++: Animation-Ready Clothed Human Reconstruction Revisited [82.83445332309238]
任意の服装スタイルで3Dアバターを再構成する画像ベースARCH++を提案する。
再建されたアバターは、入力ビューから見える領域と見えない領域の両方において、アニメーションに対応しており、非常にリアルである。
論文 参考訳(メタデータ) (2021-08-17T19:27:12Z) - Using latent space regression to analyze and leverage compositionality
in GANs [33.381584322411626]
GANの組成特性を理解するためのプローブとして潜在空間への回帰を研究する。
reressorとプリトレーニングされたジェネレータを組み合わせることで、強いイメージを事前に提供し、複合イメージを作成できることが分かりました。
回帰アプローチは,潜在空間での直接編集と比較して,個々の画像部分の局所的な編集を可能にする。
論文 参考訳(メタデータ) (2021-03-18T17:58:01Z) - Designing an Encoder for StyleGAN Image Manipulation [38.909059126878354]
最先端の無条件発電機であるStyleGANの潜伏空間について検討する。
そこで我々は,StyleGAN潜在空間における歪み依存性トレードオフと歪み知覚トレードオフの存在を同定し,解析する。
本稿では,実画像の編集を容易にするための2つの原理に基づくエンコーダを提案する。
論文 参考訳(メタデータ) (2021-02-04T17:52:38Z) - In-Domain GAN Inversion for Real Image Editing [56.924323432048304]
トレーニング済みのGANジェネレータに実際のイメージを送出する一般的な方法は、遅延コードに戻すことである。
既存の反転法は、通常、画素値によってターゲット画像の再構成にフォーカスするが、反転したコードは元の潜伏空間のセマンティックドメインに着陸しない。
本稿では、入力画像を忠実に再構成し、変換されたコードが編集に意味のある意味を持つようにするためのドメイン内GAN逆変換手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T18:20:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。