論文の概要: Dual Projection Generative Adversarial Networks for Conditional Image
Generation
- arxiv url: http://arxiv.org/abs/2108.09016v1
- Date: Fri, 20 Aug 2021 06:10:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-23 13:28:36.809262
- Title: Dual Projection Generative Adversarial Networks for Conditional Image
Generation
- Title(参考訳): 条件付き画像生成のためのデュアルプロジェクション生成対向ネットワーク
- Authors: Ligong Han, Martin Renqiang Min, Anastasis Stathopoulos, Yu Tian,
Ruijiang Gao, Asim Kadav, Dimitris Metaxas
- Abstract要約: 本稿では、エムデータマッチングとエムラベルマッチングのバランスをとることを学習するDual Projection GAN(P2GAN)モデルを提案する。
次に、Auxiliary Classificationを用いた改良されたcGANモデルを提案し、$f$-divergenceを最小化することで、偽条件および実条件を$P(textclass|textimage)$と直列に調整する。
- 参考スコア(独自算出の注目度): 26.563829113916942
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Conditional Generative Adversarial Networks (cGANs) extend the standard
unconditional GAN framework to learning joint data-label distributions from
samples, and have been established as powerful generative models capable of
generating high-fidelity imagery. A challenge of training such a model lies in
properly infusing class information into its generator and discriminator. For
the discriminator, class conditioning can be achieved by either (1) directly
incorporating labels as input or (2) involving labels in an auxiliary
classification loss. In this paper, we show that the former directly aligns the
class-conditioned fake-and-real data distributions
$P(\text{image}|\text{class})$ ({\em data matching}), while the latter aligns
data-conditioned class distributions $P(\text{class}|\text{image})$ ({\em label
matching}). Although class separability does not directly translate to sample
quality and becomes a burden if classification itself is intrinsically
difficult, the discriminator cannot provide useful guidance for the generator
if features of distinct classes are mapped to the same point and thus become
inseparable. Motivated by this intuition, we propose a Dual Projection GAN
(P2GAN) model that learns to balance between {\em data matching} and {\em label
matching}. We then propose an improved cGAN model with Auxiliary Classification
that directly aligns the fake and real conditionals
$P(\text{class}|\text{image})$ by minimizing their $f$-divergence. Experiments
on a synthetic Mixture of Gaussian (MoG) dataset and a variety of real-world
datasets including CIFAR100, ImageNet, and VGGFace2 demonstrate the efficacy of
our proposed models.
- Abstract(参考訳): conditional generative adversarial networks (cgans) は標準の無条件ganフレームワークを拡張してサンプルから共同データラベル分布を学習し、高忠実度画像を生成する強力な生成モデルとして確立されている。
このようなモデルのトレーニングの課題は、クラス情報をジェネレータや判別器に適切に注入することにある。
識別器では、(1)ラベルを直接入力として組み込むか、(2)ラベルを補助的な分類損失に含めることにより、クラス条件付けを行うことができる。
本稿では,前者がクラス条件付き偽・実データ分布 $p(\text{image}|\text{class})$ ({\em data matching}) を直接調整し,後者がデータ条件付きクラス分布 $p(\text{class}|\text{image})$ ({\em label matching}) を直接調整することを示す。
分類自体が本質的に難しい場合、クラス分離性は直接サンプル品質に変換されず、負担となるが、異なるクラスの特徴が同一点にマッピングされ、したがって分離不能になる場合、識別器はジェネレータに有用なガイダンスを提供することができない。
この直観に動機づけられて, 2重射影gan (p2gan) モデルを提案し,このモデルを用いて「emデータマッチング」と「emラベルマッチング」のバランスをとることを学ぶ。
次に、補助分類を用いた改良されたcGANモデルを提案し、$f$-divergenceを最小化することにより、偽条件と実条件を直接調整する。
gaussian(mog)データセットとcifar100、imagenet、vggface2を含む様々な実世界のデータセットを合成した実験により、提案モデルの有効性が示された。
関連論文リスト
- Exploring Beyond Logits: Hierarchical Dynamic Labeling Based on Embeddings for Semi-Supervised Classification [49.09505771145326]
モデル予測に依存しない階層型動的ラベル付け(HDL)アルゴリズムを提案し,画像埋め込みを用いてサンプルラベルを生成する。
本手法は,半教師付き学習における擬似ラベル生成のパラダイムを変える可能性がある。
論文 参考訳(メタデータ) (2024-04-26T06:00:27Z) - Ref-Diff: Zero-shot Referring Image Segmentation with Generative Models [68.73086826874733]
本稿では,画像分割を参照するための新しい参照拡散分割器(Referring Diffusional segmentor, Ref-Diff)を提案する。
提案生成器がなければ、生成モデルだけで既存のSOTAの弱教師付きモデルに匹敵する性能を達成できることを実証する。
このことは、生成モデルがこのタスクに有益であり、より優れたセグメンテーションを参照するために識別モデルを補完できることを示している。
論文 参考訳(メタデータ) (2023-08-31T14:55:30Z) - Score-based Conditional Generation with Fewer Labeled Data by
Self-calibrating Classifier Guidance [16.025002076222002]
SGM(Score-based Generative Model)は、画像生成品質の高い深層生成モデルのファミリである。
この問題は、下層の非条件分布とコーディネートすることなく、分類器が過度に適合する傾向に根ざしていると論じる。
分類器自身を正規化させることにより、分類器誘導型SGMを改善することを提案する。
論文 参考訳(メタデータ) (2023-07-09T01:41:22Z) - Label-Retrieval-Augmented Diffusion Models for Learning from Noisy
Labels [61.97359362447732]
ノイズの多いラベルからの学習は、実際のアプリケーションのための機械学習において、重要かつ長年にわたる問題である。
本稿では,生成モデルの観点からラベルノイズ問題を再構成する。
我々のモデルは、標準的な実世界のベンチマークデータセットで新しいSOTA(State-of-the-art)結果を達成する。
論文 参考訳(メタデータ) (2023-05-31T03:01:36Z) - EGC: Image Generation and Classification via a Diffusion Energy-Based
Model [59.591755258395594]
この研究は、エネルギーベースの分類器とジェネレータ、すなわちEMCを導入し、単一のニューラルネットワークを使用して両方のタスクで優れたパフォーマンスを実現する。
EGCはImageNet-1k、CelebA-HQ、LSUN Churchの最先端アプローチと比較して、競争力のある生成結果を達成している。
この研究は、ネットワークパラメータの単一セットを使用して両方のタスクを同時に実行しようとする最初の試みである。
論文 参考訳(メタデータ) (2023-04-04T17:59:14Z) - DualFair: Fair Representation Learning at Both Group and Individual
Levels via Contrastive Self-supervision [73.80009454050858]
この研究は、DualFairと呼ばれる自己教師型モデルを提示し、学習された表現から性別や人種などのセンシティブな属性をデバイアスすることができる。
我々のモデルは、グループフェアネスと対実フェアネスという2つのフェアネス基準を共同で最適化する。
論文 参考訳(メタデータ) (2023-03-15T07:13:54Z) - A Unified Generative Adversarial Network Training via Self-Labeling and
Self-Attention [38.31735499785227]
本稿では,任意のレベルのラベリングを統一的に処理できる新しいGANトレーニング手法を提案する。
提案手法では,手動で定義したラベルを組み込むことができる人工ラベル方式を導入する。
我々は, CIFAR-10, STL-10, SVHNに対するアプローチを評価し, 自己ラベルと自己アテンションの両方が生成データの品質を継続的に向上することを示す。
論文 参考訳(メタデータ) (2021-06-18T04:40:26Z) - Self-supervised GANs with Label Augmentation [43.78253518292111]
本稿では,ラベルの強化,すなわち,自己教師付き擬似ラベルによるGANラベル(実物または偽物)の増大を図った,新たな自己教師型GANフレームワークを提案する。
提案手法は,生成モデルと表現学習の両面において,競争ベースラインを大幅に上回ることを示す。
論文 参考訳(メタデータ) (2021-06-16T07:58:00Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Classify and Generate: Using Classification Latent Space Representations
for Image Generations [17.184760662429834]
本稿では,操作された教師付き潜在表現を用いて,与えられたクラスに属する新しいサンプルを再構成・生成する識別モデリングフレームワークを提案する。
ReGeneは、既存の条件生成モデルよりも高い分類精度を持ち、FIDの点で競争力がある。
論文 参考訳(メタデータ) (2020-04-16T09:13:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。