論文の概要: Finding the global semantic representation in GAN through Frechet Mean
- arxiv url: http://arxiv.org/abs/2210.05509v1
- Date: Tue, 11 Oct 2022 15:01:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 16:31:27.280464
- Title: Finding the global semantic representation in GAN through Frechet Mean
- Title(参考訳): Frechet MeanによるGANのグローバル意味表現の探索
- Authors: Jaewoong Choi, Geonho Hwang, Hyunsoo Cho, Myungjoo Kang
- Abstract要約: GANにおける中間潜伏空間におけるこの大域的意味基底を求めるための教師なし手法を提案する。
この意味ベースは、潜伏空間全体における画像の同じ意味的属性を変更するサンプル非依存の有意義な摂動を表す。
- 参考スコア(独自算出の注目度): 4.688163910878411
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The ideally disentangled latent space in GAN involves the global
representation of latent space using semantic attribute coordinates. In other
words, in this disentangled space, there exists the global semantic basis as a
vector space where each basis component describes one attribute of generated
images. In this paper, we propose an unsupervised method for finding this
global semantic basis in the intermediate latent space in GANs. This semantic
basis represents sample-independent meaningful perturbations that change the
same semantic attribute of an image on the entire latent space. The proposed
global basis, called Fr\'echet basis, is derived by introducing Fr\'echet mean
to the local semantic perturbations in a latent space. Fr\'echet basis is
discovered in two stages. First, the global semantic subspace is discovered by
the Fr\'echet mean in the Grassmannian manifold of the local semantic
subspaces. Second, Fr\'echet basis is found by optimizing a basis of the
semantic subspace via the Fr\'echet mean in the Special Orthogonal Group.
Experimental results demonstrate that Fr\'echet basis provides better semantic
factorization and robustness compared to the previous methods. Moreover, we
suggest the basis refinement scheme for the previous methods. The quantitative
experiments show that the refined basis achieves better semantic factorization
while generating the same semantic subspace as the previous method.
- Abstract(参考訳): GAN の理想的に非絡み合うラテント空間は、意味属性座標を用いたラテント空間の大域的表現を含む。
言い換えれば、この不整合空間には、各基底成分が生成された画像の1つの属性を記述するベクトル空間として、大域的意味基底が存在する。
本稿では,GANの中間潜在空間において,この大域的意味基底を求める教師なし手法を提案する。
この意味ベースは、潜伏空間全体における画像の同じ意味的属性を変更するサンプル非依存の有意義な摂動を表す。
提案された大域基底は Fr'echet 基底と呼ばれ、潜在空間における局所的意味摂動に Fr'echet 平均を導入することによって導かれる。
fr\'echet基底は2つの段階で発見される。
まず、大域意味部分空間は局所意味部分空間のグラスマン多様体において Fr\'echet 平均によって発見される。
第二に、Fr'echet 基底は特殊直交群における Fr'echet 平均を通して意味部分空間の基底を最適化することによって得られる。
実験の結果,fr\'echet基底は,従来の手法よりも優れた意味的因子分解とロバスト性をもたらすことがわかった。
さらに,従来の手法に対する基礎改良手法を提案する。
定量的実験により,従来法と同じ意味的部分空間を生成しつつ,より優れた意味的因子化を実現することが示された。
関連論文リスト
- Spatial Semantic Recurrent Mining for Referring Image Segmentation [63.34997546393106]
高品質なクロスモーダリティ融合を実現するために,Stextsuperscript2RMを提案する。
これは、言語特徴の分散、空間的意味的再帰的分離、パーセマンティック・セマンティック・バランシングという三部作の作業戦略に従う。
提案手法は他の最先端アルゴリズムに対して好適に機能する。
論文 参考訳(メタデータ) (2024-05-15T00:17:48Z) - Semantic-Rearrangement-Based Multi-Level Alignment for Domain Generalized Segmentation [11.105659621713855]
異なるローカルセマンティック領域は、ソースドメインからターゲットドメインへの異なる視覚的特性を示す。
本稿では,Semantic-Rearrangement-based Multi-Level Alignment (SRMA)を提案する。
論文 参考訳(メタデータ) (2024-04-21T16:05:38Z) - Adaptive Betweenness Clustering for Semi-Supervised Domain Adaptation [108.40945109477886]
分類領域アライメントを実現するために,G-ABC (Adaptive Betweenness Clustering) と呼ばれる新しいSSDA手法を提案する。
提案手法は従来のSSDA手法よりも優れており,提案したG-ABCアルゴリズムの優位性を示している。
論文 参考訳(メタデータ) (2024-01-21T09:57:56Z) - Analyzing the Latent Space of GAN through Local Dimension Estimation [4.688163910878411]
高忠実度画像合成におけるスタイルベースGAN(StyleGAN)は、それらの潜在空間の意味的特性を理解するために研究の動機となっている。
事前学習したGANモデルにおける任意の中間層に対する局所次元推定アルゴリズムを提案する。
提案した計量はDistortionと呼ばれ、学習された潜在空間上の内在空間の不整合を測定する。
論文 参考訳(メタデータ) (2022-05-26T06:36:06Z) - Region-Based Semantic Factorization in GANs [67.90498535507106]
本稿では,任意の画像領域についてGAN(Generative Adversarial Networks)が学習した潜在意味を分解するアルゴリズムを提案する。
適切に定義された一般化されたレイリー商を通して、アノテーションや訓練なしにそのような問題を解く。
様々な最先端のGANモデルに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-02-19T17:46:02Z) - HSVA: Hierarchical Semantic-Visual Adaptation for Zero-Shot Learning [74.76431541169342]
ゼロショット学習(ZSL)は、目に見えないクラス認識の問題に取り組み、目に見えないクラスから目に見えないクラスに意味的な知識を移す。
本稿では,意味領域と視覚領域を協調させる新しい階層型意味視覚適応(HSVA)フレームワークを提案する。
4つのベンチマークデータセットの実験では、HSVAは従来のZSLと一般的なZSLの両方で優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-30T14:27:50Z) - Do Not Escape From the Manifold: Discovering the Local Coordinates on
the Latent Space of GANs [7.443321740418409]
本稿では,GAN(Generative Adversarial Networks)の中間潜伏空間上での局所幾何学的軌道方向を求める手法を提案する。
潜在空間の内在的な間隔によって動機づけられた基礎は、部分ネットワークの微分の低ランク近似問題を解くことによって発見される。
論文 参考訳(メタデータ) (2021-06-13T10:29:42Z) - Generalizable Representation Learning for Mixture Domain Face
Anti-Spoofing [53.82826073959756]
ドメイン一般化(DG)に基づく対スプーフィングアプローチは、予期せぬシナリオの堅牢性のために注目を集めています。
ドメインダイナミック調整メタラーニング(D2AM)についてドメインラベルを使わずに提案する。
この制限を克服するため,ドメインダイナミック調整メタラーニング(D2AM)を提案する。
論文 参考訳(メタデータ) (2021-05-06T06:04:59Z) - Alleviating Semantic-level Shift: A Semi-supervised Domain Adaptation
Method for Semantic Segmentation [97.8552697905657]
このタスクの重要な課題は、ソースとターゲットドメイン間のデータ分散の相違を緩和する方法である。
本稿では,グローバルな視点とローカルな視点の両方から分布の整合性を促進できるASS(Alleviating Semantic-level Shift)を提案する。
GTA5、Cityscapes、Synthia、Cityscapesの2つのドメイン適応タスクにASSを適用します。
論文 参考訳(メタデータ) (2020-04-02T03:25:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。