論文の概要: Multi-Attribute Balanced Sampling for Disentangled GAN Controls
- arxiv url: http://arxiv.org/abs/2111.00909v1
- Date: Thu, 28 Oct 2021 08:44:13 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-02 14:34:19.834435
- Title: Multi-Attribute Balanced Sampling for Disentangled GAN Controls
- Title(参考訳): 分散GAN制御のためのマルチ属性バランスサンプリング
- Authors: Perla Doubinsky (CEDRIC - VERTIGO, CNAM), Nicolas Audebert (CEDRIC -
VERTIGO, CNAM), Michel Crucianu (CEDRIC - VERTIGO, CNAM), Herv\'e Le Borgne
(LIST)
- Abstract要約: 予め訓練されたGANの潜伏空間から、生成されたデータに対する様々な制御を抽出することができる。
提案手法は,非絡み付き後処理の不要さを回避しつつ,最先端の分類器に基づく手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Various controls over the generated data can be extracted from the latent
space of a pre-trained GAN, as it implicitly encodes the semantics of the
training data. The discovered controls allow to vary semantic attributes in the
generated images but usually lead to entangled edits that affect multiple
attributes at the same time. Supervised approaches typically sample and
annotate a collection of latent codes, then train classifiers in the latent
space to identify the controls. Since the data generated by GANs reflects the
biases of the original dataset, so do the resulting semantic controls. We
propose to address disentanglement by subsampling the generated data to remove
over-represented co-occuring attributes thus balancing the semantics of the
dataset before training the classifiers. We demonstrate the effectiveness of
this approach by extracting disentangled linear directions for face
manipulation on two popular GAN architectures, PGGAN and StyleGAN, and two
datasets, CelebAHQ and FFHQ. We show that this approach outperforms
state-of-the-art classifier-based methods while avoiding the need for
disentanglement-enforcing post-processing.
- Abstract(参考訳): トレーニングデータのセマンティクスを暗黙的にエンコードするので、生成されたデータに対する様々な制御は、事前訓練されたGANの潜在空間から抽出することができる。
検出されたコントロールは、生成された画像のセマンティック属性を変更できるが、通常、複数の属性に同時に影響する絡み合った編集につながる。
監視されたアプローチは典型的には潜伏コードの集合をサンプリングして注釈付けし、次に潜伏空間の分類器を訓練して制御を識別する。
GANによって生成されたデータは、元のデータセットのバイアスを反映するので、結果として生じるセマンティックコントロールも行う。
生成したデータをサブサンプリングして、過剰に表現された共起属性を除去し、分類器を訓練する前にデータセットのセマンティクスのバランスをとることで、歪みに対処することを提案する。
PGGANとStyleGANという2つの一般的なGANアーキテクチャと,CelebAHQとFFHQという2つのデータセットに対して,顔操作のための不整合線形方向を抽出することにより,このアプローチの有効性を示す。
本手法は,非絡み付き後処理の必要性を回避しつつ,最先端の分類器に基づく手法よりも優れていることを示す。
関連論文リスト
- DGInStyle: Domain-Generalizable Semantic Segmentation with Image Diffusion Models and Stylized Semantic Control [68.14798033899955]
大規模で事前訓練された潜伏拡散モデル(LDM)は、創造的コンテンツを生成できる異常な能力を示した。
しかし、それらは例えば、セマンティックセグメンテーションのような知覚スタックのタスクを改善するために、大規模なデータジェネレータとして使用できますか?
自律運転の文脈でこの疑問を考察し、「はい」という言い換えで答える。
論文 参考訳(メタデータ) (2023-12-05T18:34:12Z) - Fascinating Supervisory Signals and Where to Find Them: Deep Anomaly
Detection with Scale Learning [11.245813423781415]
我々は、データラベルとして特性-スケール-を導入することで、データのための新しいデータ駆動監視を考案する。
スケールは変換された表現にアタッチされたラベルとして機能し、ニューラルネットワークのトレーニングに十分なラベル付きデータを提供する。
本稿では,大規模学習に基づく異常検出手法を提案する。
論文 参考訳(メタデータ) (2023-05-25T14:48:00Z) - Wasserstein Loss for Semantic Editing in the Latent Space of GANs [0.0]
異なる手法は、意味的属性に対応する潜在空間で編集を学習することを提案する。
ほとんどの教師付きメソッドは、そのような編集を生成するために分類器のガイダンスに依存している。
そのような問題を避けるために、ワッサーシュタイン損失に基づく別の定式化を提案する。
論文 参考訳(メタデータ) (2023-03-22T08:15:27Z) - Linking data separation, visual separation, and classifier performance
using pseudo-labeling by contrastive learning [125.99533416395765]
最終分類器の性能は、潜在空間に存在するデータ分離と、射影に存在する視覚的分離に依存すると論じる。
本研究は,ヒト腸管寄生虫の5つの現実的課題の画像データセットを1%の教師付きサンプルで分類し,その結果を実証する。
論文 参考訳(メタデータ) (2023-02-06T10:01:38Z) - Divide and Contrast: Source-free Domain Adaptation via Adaptive
Contrastive Learning [122.62311703151215]
Divide and Contrast (DaC) は、それぞれの制限を回避しつつ、両方の世界の善良な端を接続することを目的としている。
DaCは、ターゲットデータをソースライクなサンプルとターゲット固有なサンプルに分割する。
さらに、ソースライクなドメインと、メモリバンクベースの最大平均離散性(MMD)損失を用いて、ターゲット固有のサンプルとを整合させて、分散ミスマッチを低減する。
論文 参考訳(メタデータ) (2022-11-12T09:21:49Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Self-Conditioned Generative Adversarial Networks for Image Editing [61.50205580051405]
Generative Adversarial Networks (GAN) はバイアスの影響を受けやすい。
我々は、このバイアスが公平性だけでなく、分布のコアから逸脱する際の潜在トラバース編集手法の崩壊に重要な役割を果たしていると論じる。
論文 参考訳(メタデータ) (2022-02-08T18:08:24Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。