論文の概要: Label Geometry Aware Discriminator for Conditional Generative Networks
- arxiv url: http://arxiv.org/abs/2105.05501v1
- Date: Wed, 12 May 2021 08:17:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-13 12:23:58.676021
- Title: Label Geometry Aware Discriminator for Conditional Generative Networks
- Title(参考訳): 条件付き生成ネットワークのためのラベル幾何認識判別器
- Authors: Suman Sapkota, Bidur Khanal, Binod Bhattarai, Bishesh Khanal, Tae-Kyun
Kim
- Abstract要約: 条件付きGenerative Adversarial Networks(GAN)は、目的のターゲットクラスで高画質の画像を生成することができます。
これらの合成画像は、画像分類などの下流監督タスクを改善するために必ずしも役に立たない。
- 参考スコア(独自算出の注目度): 40.89719383597279
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-domain image-to-image translation with conditional Generative
Adversarial Networks (GANs) can generate highly photo realistic images with
desired target classes, yet these synthetic images have not always been helpful
to improve downstream supervised tasks such as image classification. Improving
downstream tasks with synthetic examples requires generating images with high
fidelity to the unknown conditional distribution of the target class, which
many labeled conditional GANs attempt to achieve by adding soft-max
cross-entropy loss based auxiliary classifier in the discriminator. As recent
studies suggest that the soft-max loss in Euclidean space of deep feature does
not leverage their intrinsic angular distribution, we propose to replace this
loss in auxiliary classifier with an additive angular margin (AAM) loss that
takes benefit of the intrinsic angular distribution, and promotes intra-class
compactness and inter-class separation to help generator synthesize high
fidelity images.
We validate our method on RaFD and CIFAR-100, two challenging face expression
and natural image classification data set. Our method outperforms
state-of-the-art methods in several different evaluation criteria including
recently proposed GAN-train and GAN-test metrics designed to assess the impact
of synthetic data on downstream classification task, assessing the usefulness
in data augmentation for supervised tasks with prediction accuracy score and
average confidence score, and the well known FID metric.
- Abstract(参考訳): 条件付き生成逆数ネットワーク(GAN)を用いたマルチドメイン画像・画像変換は,所望の目標クラスで高画質な画像を生成することができるが,これらの合成画像は画像分類などの下流教師付きタスクの改善に必ずしも役立っていない。
合成例で下流タスクを改善するためには、多くのラベル付き条件付きGANが識別器にソフトマックスクロスエントロピー損失に基づく補助分類器を追加することで達成しようとする、未知の条件分布に対する忠実度の高い画像を生成する必要がある。
近年の研究では、深層特徴のユークリッド空間におけるソフトマックス損失はそれらの固有角分布を生かさないことが示唆されているため、補助分類器における損失を、固有角分布の恩恵を受ける付加的角マージン(aam)損失に置き換えるとともに、クラス内コンパクト性とクラス間分離を促進し、高忠実度画像の生成を支援する。
本稿では,2つの顔表現と自然画像分類データセットであるRaFDとCIFAR-100について検証する。
提案手法は,下流分類タスクにおける合成データの影響評価,予測精度スコアと平均信頼度スコアを用いた教師タスクのデータ拡張の有用性評価,よく知られたFID測定値など,いくつかの評価基準において,最先端の手法よりも優れている。
関連論文リスト
- Counterfactual Image Generation for adversarially robust and
interpretable Classifiers [1.3859669037499769]
本稿では,GAN(Generative Adrial Networks)を基盤として,画像から画像への変換を利用した統合フレームワークを提案する。
これは、分類器と識別器を1つのモデルに組み合わせて、実際の画像をそれぞれのクラスに属性付け、生成されたイメージを「フェイク」として生成することで達成される。
モデルが敵攻撃に対するロバスト性の向上を示すことを示すとともに,判別器の「フェイクネス」値が予測の不確かさの指標となることを示す。
論文 参考訳(メタデータ) (2023-10-01T18:50:29Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - DuDGAN: Improving Class-Conditional GANs via Dual-Diffusion [2.458437232470188]
GAN(Generative Adversarial Network)を用いたクラス条件画像生成について,様々な手法を用いて検討した。
本稿では,DuDGANと呼ばれる2次元拡散型ノイズ注入法を取り入れたGANを用いたクラス条件画像生成手法を提案する。
提案手法は,画像生成のための現状条件付きGANモデルよりも性能的に優れている。
論文 参考訳(メタデータ) (2023-05-24T07:59:44Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - Semantic Image Synthesis via Diffusion Models [159.4285444680301]
Denoising Diffusion Probabilistic Models (DDPM) は様々な画像生成タスクにおいて顕著な成功を収めた。
セマンティック画像合成に関する最近の研究は、主に「GAN(Generative Adversarial Nets)」に追従している。
論文 参考訳(メタデータ) (2022-06-30T18:31:51Z) - Investigating the Potential of Auxiliary-Classifier GANs for Image
Classification in Low Data Regimes [12.128005423388226]
本稿では、画像分類のための「ワンストップショップ」アーキテクチャとして、補助分類型GAN(AC-GAN)の可能性を検討する。
AC-GANは画像分類において有望であり、標準CNNとの競合性能を達成する。
論文 参考訳(メタデータ) (2022-01-22T19:33:16Z) - Compound Frechet Inception Distance for Quality Assessment of GAN
Created Images [7.628527132779575]
GANの注目すべき応用の1つは、ディープフェイク(deep fakes)として知られる偽の人間の顔を開発することである。
生成された画像の品質を測定することは本質的に主観的だが、標準化されたメトリクスを使って品質を客観化しようとする試みがなされている。
我々は,より広い視覚的欠陥をカバーするために,低レベルの特徴を統合することにより,評価プロセスの堅牢性を向上させることを提案する。
論文 参考訳(メタデータ) (2021-06-16T06:53:27Z) - Sparse Signal Models for Data Augmentation in Deep Learning ATR [0.8999056386710496]
ドメイン知識を取り入れ,データ集約学習アルゴリズムの一般化能力を向上させるためのデータ拡張手法を提案する。
本研究では,空間領域における散乱中心のスパース性とアジムタル領域における散乱係数の滑らかな変動構造を活かし,過パラメータモデルフィッティングの問題を解く。
論文 参考訳(メタデータ) (2020-12-16T21:46:33Z) - When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である
本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。
ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-02-24T11:35:28Z) - Image Fine-grained Inpainting [89.17316318927621]
拡張畳み込みの密結合を利用してより大きく効果的な受容場を得る一段階モデルを提案する。
この効率的なジェネレータをよく訓練するために、頻繁に使用されるVGG特徴整合損失を除いて、新しい自己誘導回帰損失を設計する。
また、局所的・グローバルな分枝を持つ識別器を用いて、局所的・グローバルな内容の整合性を確保する。
論文 参考訳(メタデータ) (2020-02-07T03:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。