論文の概要: Conditional Variational Autoencoder with Balanced Pre-training for
Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2201.04809v1
- Date: Thu, 13 Jan 2022 06:52:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-14 23:21:35.702928
- Title: Conditional Variational Autoencoder with Balanced Pre-training for
Generative Adversarial Networks
- Title(参考訳): 逆数生成ネットワークのための平衡事前学習付き条件変分オートエンコーダ
- Authors: Yuchong Yao, Xiaohui Wangr, Yuanbang Ma, Han Fang, Jiaying Wei, Liyuan
Chen, Ali Anaissi and Ali Braytee
- Abstract要約: クラス不均衡は、各クラスの画像数が大きく異なる画像分類を含む多くの実世界のアプリケーションで発生する。
不均衡なデータでは、GAN(Generative Adversarial Network)は多数派に傾いている。
本稿では, リアルな合成画像を生成するための拡張ツールとして, CAPGAN (Geneversarative Adrial Networks) のためのバランス付き事前学習機能を備えた新しい変分オートエンコーダを提案する。
- 参考スコア(独自算出の注目度): 11.46883762268061
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Class imbalance occurs in many real-world applications, including image
classification, where the number of images in each class differs significantly.
With imbalanced data, the generative adversarial networks (GANs) leans to
majority class samples. The two recent methods, Balancing GAN (BAGAN) and
improved BAGAN (BAGAN-GP), are proposed as an augmentation tool to handle this
problem and restore the balance to the data. The former pre-trains the
autoencoder weights in an unsupervised manner. However, it is unstable when the
images from different categories have similar features. The latter is improved
based on BAGAN by facilitating supervised autoencoder training, but the
pre-training is biased towards the majority classes. In this work, we propose a
novel Conditional Variational Autoencoder with Balanced Pre-training for
Generative Adversarial Networks (CAPGAN) as an augmentation tool to generate
realistic synthetic images. In particular, we utilize a conditional
convolutional variational autoencoder with supervised and balanced pre-training
for the GAN initialization and training with gradient penalty. Our proposed
method presents a superior performance of other state-of-the-art methods on the
highly imbalanced version of MNIST, Fashion-MNIST, CIFAR-10, and two medical
imaging datasets. Our method can synthesize high-quality minority samples in
terms of Fr\'echet inception distance, structural similarity index measure and
perceptual quality.
- Abstract(参考訳): クラス不均衡は、各クラスの画像数が大きく異なる画像分類を含む多くの実世界のアプリケーションで発生する。
不均衡なデータでは、生成的敵ネットワーク(gans)が多数派クラスサンプルに傾いている。
近年の2つの手法であるBalancing GAN(BAGAN)と改良BAGAN(BAGAN-GP)が,この問題に対処し,データのバランスを回復するための拡張ツールとして提案されている。
前者は教師なしの方法でオートエンコーダ重みを事前訓練する。
しかし、異なるカテゴリの画像に類似した特徴がある場合、不安定である。
後者は、教師付きオートエンコーダのトレーニングを容易にすることで、BAGANに基づいて改善されている。
本研究では, 現実的な合成画像を生成するための拡張ツールとして, CAPGAN (Conditional Variational Autoencoder) を提案する。
特に,条件付き畳み込み変分オートエンコーダを用いて,GAN初期化と勾配ペナルティによるトレーニングを行う。
提案手法は,MNIST,Fashion-MNIST,CIFAR-10,および2つの医用画像データセットの高度に不均衡なバージョンに対して,他の最先端手法よりも優れた性能を示す。
提案手法は,Fr'echet開始距離,構造類似度指標,知覚品質の観点から,高品質なマイノリティサンプルを合成することができる。
関連論文リスト
- Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。
従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。
これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文 参考訳(メタデータ) (2024-07-16T06:38:49Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z) - Learning to Re-weight Examples with Optimal Transport for Imbalanced
Classification [74.62203971625173]
不均衡データは、ディープラーニングに基づく分類モデルに課題をもたらす。
不均衡なデータを扱うための最も広く使われているアプローチの1つは、再重み付けである。
本稿では,分布の観点からの最適輸送(OT)に基づく新しい再重み付け手法を提案する。
論文 参考訳(メタデータ) (2022-08-05T01:23:54Z) - FewGAN: Generating from the Joint Distribution of a Few Images [95.6635227371479]
本稿では,新しい,高品質で多様な画像を生成するための生成モデルFewGANを紹介する。
FewGANは、第1の粗いスケールで量子化を適用した階層的なパッチGANであり、その後、より微細なスケールで残った完全畳み込みGANのピラミッドが続く。
大規模な実験では、FewGANは定量的にも定性的にも基線より優れていることが示されている。
論文 参考訳(メタデータ) (2022-07-18T07:11:28Z) - Prototypical Classifier for Robust Class-Imbalanced Learning [64.96088324684683]
埋め込みネットワークに付加的なパラメータを必要としないtextitPrototypealを提案する。
プロトタイプは、訓練セットがクラス不均衡であるにもかかわらず、すべてのクラスに対してバランスと同等の予測を生成する。
我々は, CIFAR-10LT, CIFAR-100LT, Webvision のデータセットを用いて, プロトタイプが芸術の状況と比較した場合, サブスタンスの改善が得られることを検証した。
論文 参考訳(メタデータ) (2021-10-22T01:55:01Z) - eGAN: Unsupervised approach to class imbalance using transfer learning [8.100450025624443]
クラス不均衡は、多くの機械学習分類タスクに固有の問題である。
予め訓練された画像分類モデルからエンコーダベースのGenerative Adversarial Network(eGAN)への転送学習を活用することにより、これらの不均衡に対処するための監督されていないアプローチを検討する。
CIFAR-10分類タスクにおいて0.69 F1-scoreの結果が1:2500の不均衡比で得られた。
論文 参考訳(メタデータ) (2021-04-09T02:37:55Z) - Insta-RS: Instance-wise Randomized Smoothing for Improved Robustness and
Accuracy [9.50143683501477]
Insta-RSは、テスト例にカスタマイズされたガウス分散を割り当てるマルチスタート検索アルゴリズムである。
Insta-RS Trainは、各トレーニング例のノイズレベルを適応的に調整し、カスタマイズする新しい2段階トレーニングアルゴリズムです。
本手法は,平均認定半径(ACR)とクリーンデータ精度を有意に向上させることを示した。
論文 参考訳(メタデータ) (2021-03-07T19:46:07Z) - Enhanced Balancing GAN: Minority-class Image Generation [0.7310043452300734]
GAN(Generative Adversarial Network)は、最も強力な生成モデルの一つである。
この問題を軽減するため、BAGAN(Bavalancing GAN)が提案されているが、異なるクラスの画像が似ていると不安定である。
本研究では,ラベル付き潜在ベクトルを分散する中間埋め込みモデルを用いた教師付きオートエンコーダを提案する。
提案モデルでは,従来のBAGANの不安定な問題を克服し,より高速で高品質な世代に収束する。
論文 参考訳(メタデータ) (2020-10-31T05:03:47Z) - Encoding Robustness to Image Style via Adversarial Feature Perturbations [72.81911076841408]
我々は、画像画素ではなく特徴統計を直接摂動することで、頑健なモデルを生成することで、敵の訓練に適応する。
提案手法であるAdvBN(Adversarial Batch Normalization)は,トレーニング中に最悪の機能摂動を発生させる単一ネットワーク層である。
論文 参考訳(メタデータ) (2020-09-18T17:52:34Z) - Mitigating Dataset Imbalance via Joint Generation and Classification [17.57577266707809]
教師付きディープラーニング手法は、コンピュータビジョンの多くの実践的応用において大きな成功を収めている。
バイアスや不均衡データに対する顕著な性能劣化は、これらの手法の信頼性に疑問を投げかける。
ニューラルネットワーク分類器とGAN(Generative Adversarial Networks)を組み合わせた共同データセット修復戦略を提案する。
重度のクラス不均衡に対する分類器とGANの堅牢性向上に寄与することを示す。
論文 参考訳(メタデータ) (2020-08-12T18:40:38Z) - Imbalanced Data Learning by Minority Class Augmentation using Capsule
Adversarial Networks [31.073558420480964]
本稿では,2つの同時手法を合体させて,不均衡な画像のバランスを回復する手法を提案する。
我々のモデルでは、生成的および識別的ネットワークは、新しい競争力のあるゲームをする。
カプセルGANの合体は、畳み込みGANと比較して非常に少ないパラメータで重なり合うクラスを認識するのに効果的である。
論文 参考訳(メタデータ) (2020-04-05T12:36:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。