論文の概要: Do Not Escape From the Manifold: Discovering the Local Coordinates on
the Latent Space of GANs
- arxiv url: http://arxiv.org/abs/2106.06959v1
- Date: Sun, 13 Jun 2021 10:29:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-15 16:01:32.771039
- Title: Do Not Escape From the Manifold: Discovering the Local Coordinates on
the Latent Space of GANs
- Title(参考訳): マンニフォルドから抜け出さない:GANの潜在空間における局所座標の発見
- Authors: Jaewoong Choi, Changyeon Yoon, Junho Lee, Jung Ho Park, Geonho Hwang,
Myungjoo Kang
- Abstract要約: 本稿では,GAN(Generative Adversarial Networks)の中間潜伏空間上での局所幾何学的軌道方向を求める手法を提案する。
潜在空間の内在的な間隔によって動機づけられた基礎は、部分ネットワークの微分の低ランク近似問題を解くことによって発見される。
- 参考スコア(独自算出の注目度): 7.443321740418409
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we propose a method to find local-geometry-aware traversal
directions on the intermediate latent space of Generative Adversarial Networks
(GANs). These directions are defined as an ordered basis of tangent space at a
latent code. Motivated by the intrinsic sparsity of the latent space, the basis
is discovered by solving the low-rank approximation problem of the differential
of the partial network. Moreover, the local traversal basis leads to a natural
iterative traversal on the latent space. Iterative Curve-Traversal shows stable
traversal on images, since the trajectory of latent code stays close to the
latent space even under the strong perturbations compared to the linear
traversal. This stability provides far more diverse variations of the given
image. Although the proposed method can be applied to various GAN models, we
focus on the W-space of the StyleGAN2, which is renowned for showing the better
disentanglement of the latent factors of variation. Our quantitative and
qualitative analysis provides evidence showing that the W-space is still
globally warped while showing a certain degree of global consistency of
interpretable variation. In particular, we introduce some metrics on the
Grassmannian manifolds to quantify the global warpage of the W-space and the
subspace traversal to test the stability of traversal directions.
- Abstract(参考訳): 本稿では,GAN(Generative Adversarial Networks)の中間潜伏空間における局所幾何学的軌道方向を求める手法を提案する。
これらの方向は、潜在符号における接空間の順序基底として定義される。
潜在空間の固有スパース性によって動機づけられた基礎は、部分ネットワークの微分の低ランク近似問題を解くことによって発見される。
さらに、局所トラバーサル基底は、潜在空間上の自然な反復トラバーサルをもたらす。
反復曲線トラバーサルは、線形トラバーサルに比べて強い摂動下でも、潜在コードの軌道が潜在空間に近いため、画像上で安定したトラバーサルを示す。
この安定性は、与えられた画像のより多様なバリエーションをもたらす。
提案手法は,様々なGANモデルに適用可能であるが,変動の潜伏因子のより良い非絡み合いを示すことで有名なStyleGAN2のW空間に着目した。
定量的・定性的な分析により、w-空間は、解釈可能な変動のある程度のグローバル一貫性を示す一方で、まだグローバルに歪められていることを示す証拠が得られる。
特に、W-空間と部分空間トラバーサルの大域的ワープページを定量化するためにグラスマン多様体上のいくつかのメトリクスを導入し、トラバーサル方向の安定性をテストする。
関連論文リスト
- Unsupervised Panoptic Interpretation of Latent Spaces in GANs Using Space-Filling Vector Quantization [9.181917968017258]
GAN(Generative Adversarial Network)は、サンプルを現実世界の画像にマッピングできる潜在空間を学習する。
初期の教師付き手法は、解釈可能な潜在空間を作成したり、解釈可能な方向を発見することを目的としていた。
本研究では,空間充足ベクトル量子化 (SFVQ) と呼ばれるベクトル量子化の修正手法を提案する。
論文 参考訳(メタデータ) (2024-10-27T19:56:02Z) - SGFormer: Spherical Geometry Transformer for 360 Depth Estimation [54.13459226728249]
パノラマ歪みは360度深度推定において大きな課題となる。
本稿では,SGFormer という球面形状変換器を提案し,上記の問題に対処する。
また、様々な解像度で空間構造を補うために、クエリベースの大域的条件位置埋め込みを提案する。
論文 参考訳(メタデータ) (2024-04-23T12:36:24Z) - Locality-preserving Directions for Interpreting the Latent Space of
Satellite Image GANs [20.010911311234718]
本稿では,ウェーブレットをベースとしたGAN(Generative Adversarial Networks)の潜伏空間を解釈する局所性認識手法を提案する。
局所性を保存することに集中して,提案手法は事前学習したGANの重み空間を分解し,解釈可能な方向を復元することができる。
論文 参考訳(メタデータ) (2023-09-26T12:29:36Z) - Discovering Class-Specific GAN Controls for Semantic Image Synthesis [73.91655061467988]
本稿では,事前訓練されたSISモデルの潜在空間において,空間的に不整合なクラス固有方向を求める新しい手法を提案する。
提案手法によって検出される潜在方向は,セマンティッククラスの局所的な外観を効果的に制御できることを示す。
論文 参考訳(メタデータ) (2022-12-02T21:39:26Z) - Analyzing the Latent Space of GAN through Local Dimension Estimation [4.688163910878411]
高忠実度画像合成におけるスタイルベースGAN(StyleGAN)は、それらの潜在空間の意味的特性を理解するために研究の動機となっている。
事前学習したGANモデルにおける任意の中間層に対する局所次元推定アルゴリズムを提案する。
提案した計量はDistortionと呼ばれ、学習された潜在空間上の内在空間の不整合を測定する。
論文 参考訳(メタデータ) (2022-05-26T06:36:06Z) - Dencentralized learning in the presence of low-rank noise [57.18977364494388]
ネットワーク内のエージェントが収集した観測は、観測ノイズや干渉のために信頼性が低い。
本稿では,各ノードが自身の観測の信頼性を向上させる分散アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-03-18T09:13:57Z) - Few Shot Generative Model Adaption via Relaxed Spatial Structural
Alignment [130.84010267004803]
限られたデータでGAN(Generative Adversarial Network)を訓練することは難しい課題である。
実現可能な解決策は、大規模なソースドメインで十分に訓練されたGANから始め、ターゲットドメインにいくつかのサンプルで適応することである。
本研究では,適応時の対象生成モデルのキャリブレーションを行うための緩和された空間構造アライメント手法を提案する。
論文 参考訳(メタデータ) (2022-03-06T14:26:25Z) - WarpedGANSpace: Finding non-linear RBF paths in GAN latent space [44.7091944340362]
この研究は、事前訓練されたGANの潜在空間における解釈可能な経路を、教師なしの方法で発見する問題に対処する。
我々は、RBFベースの潜時空間ワープ関数の集合によってパラメトリズされた潜時空間上の非線形ワープを学習する。
本手法の特殊な場合として線形経路を導出できることを示すとともに, 遅延空間における非線形経路が画像空間におけるより急勾配, ゆがみ, 解釈可能な変化をもたらすことを実験的に示す。
論文 参考訳(メタデータ) (2021-09-27T21:29:35Z) - The Geometry of Deep Generative Image Models and its Applications [0.0]
generative adversarial networks (gans) は、実世界のデータセットの統計パターンをモデル化する強力な教師なし手法として登場した。
これらのネットワークは、潜在空間内のランダムな入力を学習データを表す新しいサンプルにマップするように訓練される。
潜在空間の構造は、その高い寸法性と発電機の非線形性のために内挿しが困難である。
論文 参考訳(メタデータ) (2021-01-15T07:57:33Z) - Manifold Learning via Manifold Deflation [105.7418091051558]
次元削減法は、高次元データの可視化と解釈に有用な手段を提供する。
多くの一般的な手法は単純な2次元のマニフォールドでも劇的に失敗する。
本稿では,グローバルな構造を座標として組み込んだ,新しいインクリメンタルな空間推定器の埋め込み手法を提案する。
実験により,本アルゴリズムは実世界および合成データセットに新規で興味深い埋め込みを復元することを示した。
論文 参考訳(メタデータ) (2020-07-07T10:04:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。