論文の概要: Feature Statistics Mixing Regularization for Generative Adversarial
Networks
- arxiv url: http://arxiv.org/abs/2112.04120v1
- Date: Wed, 8 Dec 2021 05:11:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-09 14:42:24.155596
- Title: Feature Statistics Mixing Regularization for Generative Adversarial
Networks
- Title(参考訳): 生成型逆ネットワークのための特徴統計混合正規化
- Authors: Junho Kim, Yunjey Choi, Youngjung Uh
- Abstract要約: 生成的敵ネットワークにおいて、識別器の改善は、生成性能の鍵となる要素の一つである。
本稿では,判別器の予測を入力画像のスタイルに不変にするための特徴統計混合正則化(FSMR)を提案する。
我々は、規則化がスタイルに対する感度を低下させ、様々なGANアーキテクチャの性能を一貫して向上させることを示すために、広範囲な実験を行っている。
- 参考スコア(独自算出の注目度): 13.326288596904208
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In generative adversarial networks, improving discriminators is one of the
key components for generation performance. As image classifiers are biased
toward texture and debiasing improves accuracy, we investigate 1) if the
discriminators are biased, and 2) if debiasing the discriminators will improve
generation performance. Indeed, we find empirical evidence that the
discriminators are sensitive to the style (\e.g., texture and color) of images.
As a remedy, we propose feature statistics mixing regularization (FSMR) that
encourages the discriminator's prediction to be invariant to the styles of
input images. Specifically, we generate a mixed feature of an original and a
reference image in the discriminator's feature space and we apply
regularization so that the prediction for the mixed feature is consistent with
the prediction for the original image. We conduct extensive experiments to
demonstrate that our regularization leads to reduced sensitivity to style and
consistently improves the performance of various GAN architectures on nine
datasets. In addition, adding FSMR to recently-proposed augmentation-based GAN
methods further improves image quality. Code will be publicly available online
for the research community.
- Abstract(参考訳): 生成型adversarial networkでは、識別器の改善が生成性能の重要なコンポーネントの1つである。
画像分類器はテクスチャに偏り、デバイアスは精度を向上させる
1) 差別者が偏っている場合,
2) 判別者が偏差した場合は, 生成性能が向上する。
実際、識別者がイメージのスタイル(例えばテクスチャと色)に敏感であるという実証的な証拠が得られます。
そこで本研究では,判別器の予測を入力画像のスタイルに不変にするための特徴統計混合正則化(FSMR)を提案する。
具体的には、判別器の特徴空間における原画像と参照画像の混合特徴を生成し、その混合特徴の予測が原画像の予測と一致するように正規化を適用する。
我々は、我々の規則化がスタイルに対する感度を低下させ、9つのデータセット上の様々なGANアーキテクチャの性能を一貫して改善することを示すために、広範な実験を行う。
さらに、最近提案された拡張ベースのGANメソッドにFSMRを追加することにより、画質が向上する。
コードは研究コミュニティ向けにオンラインで公開されている。
関連論文リスト
- Debiasing Classifiers by Amplifying Bias with Latent Diffusion and Large Language Models [9.801159950963306]
DiffuBiasはテキスト・画像生成のための新しいパイプラインであり、バイアス・コンフリクト・サンプルを生成することで分類器の堅牢性を高める。
DrouBiasは、安定拡散モデルを活用する最初のアプローチである。
総合実験により,DiffuBiasがベンチマークデータセット上で最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2024-11-25T04:11:16Z) - DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - Causality and Independence Enhancement for Biased Node Classification [56.38828085943763]
各種グラフニューラルネットワーク(GNN)に適用可能な新しい因果性・独立性向上(CIE)フレームワークを提案する。
提案手法は,ノード表現レベルでの因果的特徴と突発的特徴を推定し,突発的相関の影響を緩和する。
我々のアプローチCIEは、GNNの性能を大幅に向上するだけでなく、最先端の debiased ノード分類法よりも優れています。
論文 参考訳(メタデータ) (2023-10-14T13:56:24Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Hierarchical Forgery Classifier On Multi-modality Face Forgery Clues [61.37306431455152]
我々は,HFC-MFFD (hierarchical Forgery for Multi-modality Face Forgery Detection) を提案する。
HFC-MFFDは、マルチモーダルシナリオにおけるフォージェリー認証を強化するために、堅牢なパッチベースのハイブリッド表現を学習する。
クラス不均衡問題を緩和し、さらに検出性能を高めるために、特定の階層的な顔偽造を提案する。
論文 参考訳(メタデータ) (2022-12-30T10:54:29Z) - Few-shot Image Generation via Masked Discrimination [20.998032566820907]
少ないショット画像生成は、限られたデータで高品質で多彩な画像を生成することを目的としている。
現代のGANでは、ほんの数枚の画像で訓練された場合、過度な適合を避けることは困難である。
本研究は,マスク付き識別による少数ショットGAN適応を実現するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-10-27T06:02:22Z) - Style Normalization and Restitution for DomainGeneralization and
Adaptation [88.86865069583149]
効果的なドメイン一般化モデルは、一般化および判別可能な特徴表現を学習することが期待される。
本稿では,ネットワークの高一般化と識別能力を確保するために,新しいスタイル正規化・再構成モジュール(SNR)を設計する。
論文 参考訳(メタデータ) (2021-01-03T09:01:39Z) - Evaluating and Mitigating Bias in Image Classifiers: A Causal
Perspective Using Counterfactuals [27.539001365348906]
本稿では、逆学習推論(ALI)の改良版に構造因果モデル(SCM)を組み込むことにより、逆ファクトアルを生成する方法を提案する。
本稿では,事前学習された機械学習分類器の説明方法を示し,そのバイアスを評価し,そのバイアスを正則化器を用いて緩和する方法について述べる。
論文 参考訳(メタデータ) (2020-09-17T13:19:31Z) - When Relation Networks meet GANs: Relation GANs with Triplet Loss [110.7572918636599]
GAN(Generative Adversarial Network)の学習安定性はいまだに悩みの種である
本稿では,判別器のための関係ネットワークアーキテクチャについて検討し,より優れた一般化と安定性を実現する三重項損失を設計する。
ベンチマークデータセットの実験により、提案された関係判別器と新たな損失は、可変視覚タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2020-02-24T11:35:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。