論文の概要: Enhanced Balancing GAN: Minority-class Image Generation
- arxiv url: http://arxiv.org/abs/2011.00189v1
- Date: Sat, 31 Oct 2020 05:03:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-01 05:06:02.143767
- Title: Enhanced Balancing GAN: Minority-class Image Generation
- Title(参考訳): 拡張バランシングGAN: マイノリティクラスの画像生成
- Authors: Gaofeng Huang and Amir H. Jafari
- Abstract要約: GAN(Generative Adversarial Network)は、最も強力な生成モデルの一つである。
この問題を軽減するため、BAGAN(Bavalancing GAN)が提案されているが、異なるクラスの画像が似ていると不安定である。
本研究では,ラベル付き潜在ベクトルを分散する中間埋め込みモデルを用いた教師付きオートエンコーダを提案する。
提案モデルでは,従来のBAGANの不安定な問題を克服し,より高速で高品質な世代に収束する。
- 参考スコア(独自算出の注目度): 0.7310043452300734
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generative adversarial networks (GANs) are one of the most powerful
generative models, but always require a large and balanced dataset to train.
Traditional GANs are not applicable to generate minority-class images in a
highly imbalanced dataset. Balancing GAN (BAGAN) is proposed to mitigate this
problem, but it is unstable when images in different classes look similar, e.g.
flowers and cells. In this work, we propose a supervised autoencoder with an
intermediate embedding model to disperse the labeled latent vectors. With the
improved autoencoder initialization, we also build an architecture of BAGAN
with gradient penalty (BAGAN-GP). Our proposed model overcomes the unstable
issue in original BAGAN and converges faster to high quality generations. Our
model achieves high performance on the imbalanced scale-down version of MNIST
Fashion, CIFAR-10, and one small-scale medical image dataset.
- Abstract(参考訳): generative adversarial networks (gans)は最も強力な生成モデルの一つであるが、トレーニングには常に大きなバランスのとれたデータセットが必要である。
従来のGANは、高度に不均衡なデータセットで少数クラスの画像を生成するには適用できない。
この問題を軽減するため、BAGAN(Bavalancing GAN)が提案されているが、花や細胞など、異なるクラスの画像が似ていると不安定である。
本研究では,ラベル付き潜在ベクトルを分散する中間埋め込みモデルを持つ教師付きオートエンコーダを提案する。
オートエンコーダの初期化を改良し、勾配ペナルティ(BAGAN-GP)を持つBAGANのアーキテクチャを構築する。
提案モデルは,バガンの不安定な問題を克服し,高品質な世代に高速に収束する。
mnist fashion, cifar-10, および小型医用画像データセットの非平衡スケールダウン版において, 高い性能を実現する。
関連論文リスト
- Stabilize the Latent Space for Image Autoregressive Modeling: A Unified Perspective [52.778766190479374]
遅延ベース画像生成モデルは、画像生成タスクにおいて顕著な成功を収めた。
同じ遅延空間を共有するにもかかわらず、自己回帰モデルは画像生成において LDM や MIM よりもかなり遅れている。
本稿では,画像生成モデルのための遅延空間を安定化する,単純だが効果的な離散画像トークン化手法を提案する。
論文 参考訳(メタデータ) (2024-10-16T12:13:17Z) - Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - Fair GANs through model rebalancing for extremely imbalanced class
distributions [5.463417677777276]
本稿では,既存のバイアス付きGANからGAN(unbiased generative adversarial Network)を構築するためのアプローチを提案する。
Flickr Faces High Quality (FFHQ) データセットを用いて、人種的公平性をトレーニングしながら、StyleGAN2モデルの結果を示す。
また,不均衡なCIFAR10データセットに適用することで,我々のアプローチをさらに検証する。
論文 参考訳(メタデータ) (2023-08-16T19:20:06Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - How to train your draGAN: A task oriented solution to imbalanced
classification [15.893327571516016]
本稿では,新しいアーキテクチャであるdraGANを用いた,ユニークでパフォーマンスを重視したデータ生成戦略を提案する。
サンプルは、実際のデータと類似性ではなく、分類モデルの性能を最適化する目的で生成される。
経験的に、draGANの優位性を示すと同時に、いくつかの欠点も強調する。
論文 参考訳(メタデータ) (2022-11-18T07:37:34Z) - FewGAN: Generating from the Joint Distribution of a Few Images [95.6635227371479]
本稿では,新しい,高品質で多様な画像を生成するための生成モデルFewGANを紹介する。
FewGANは、第1の粗いスケールで量子化を適用した階層的なパッチGANであり、その後、より微細なスケールで残った完全畳み込みGANのピラミッドが続く。
大規模な実験では、FewGANは定量的にも定性的にも基線より優れていることが示されている。
論文 参考訳(メタデータ) (2022-07-18T07:11:28Z) - Conditional Variational Autoencoder with Balanced Pre-training for
Generative Adversarial Networks [11.46883762268061]
クラス不均衡は、各クラスの画像数が大きく異なる画像分類を含む多くの実世界のアプリケーションで発生する。
不均衡なデータでは、GAN(Generative Adversarial Network)は多数派に傾いている。
本稿では, リアルな合成画像を生成するための拡張ツールとして, CAPGAN (Geneversarative Adrial Networks) のためのバランス付き事前学習機能を備えた新しい変分オートエンコーダを提案する。
論文 参考訳(メタデータ) (2022-01-13T06:52:58Z) - InvGAN: Invertible GANs [88.58338626299837]
InvGANはInvertible GANの略で、高品質な生成モデルの潜在空間に実際の画像を埋め込むことに成功した。
これにより、画像のインペイント、マージ、オンラインデータ拡張を実行できます。
論文 参考訳(メタデータ) (2021-12-08T21:39:00Z) - Fast and Robust Cascade Model for Multiple Degradation Single Image
Super-Resolution [2.1574781022415364]
SISR(Single Image Super-Resolution)は、近年注目されている低レベルのコンピュータビジョン問題の一つである。
本稿では、畳み込みニューラルネットワーク(CNN)のカスケードモデルについて、新しい定式化を提案する。
外部知識を用いて各サブモジュールの出力を制限することで,より密結合なCNNアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-11-16T18:59:49Z) - TinyGAN: Distilling BigGAN for Conditional Image Generation [2.8072597424460466]
BigGANはImageNetの画像生成の質を大幅に改善しましたが、巨大なモデルが必要で、リソースに制約のあるデバイスへのデプロイが困難になります。
本稿では,GANを圧縮するためのブラックボックス知識蒸留フレームワークを提案する。
教師ネットワークとしてBigGANを前提として、私たちは、インセプションとFIDスコアの競合的なパフォーマンスを達成するために、はるかに小さな学生ネットワークをトレーニングしました。
論文 参考訳(メタデータ) (2020-09-29T07:33:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。