論文の概要: Intercategorical Label Interpolation for Emotional Face Generation with
Conditional Generative Adversarial Networks
- arxiv url: http://arxiv.org/abs/2204.12237v1
- Date: Tue, 26 Apr 2022 11:36:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 18:42:15.468806
- Title: Intercategorical Label Interpolation for Emotional Face Generation with
Conditional Generative Adversarial Networks
- Title(参考訳): 条件付き生成対向ネットワークを用いた感情顔生成のためのカテゴリー間ラベル補間
- Authors: Silvan Mertes, Dominik Schiller, Florian Lingenfelser, Thomas Kiderle,
Valentin Kroner, Lama Diab, Elisabeth Andr\'e
- Abstract要約: 人間の顔の感情画像の生成は、アバターの自動生成など、さまざまなユースケースに利用することができる。
このタスクに最も適したデータセットは分類的感情モデルに依存しており、そのため個別のアノテーションラベルのみを特徴としている。
分類データセットで訓練されたネットワークを強化し、連続的な特徴を前提とした画像を生成するためのラベルの可能性を探る。
- 参考スコア(独自算出の注目度): 1.3661693133068065
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Generative adversarial networks offer the possibility to generate deceptively
real images that are almost indistinguishable from actual photographs. Such
systems however rely on the presence of large datasets to realistically
replicate the corresponding domain. This is especially a problem if not only
random new images are to be generated, but specific (continuous) features are
to be co-modeled. A particularly important use case in \emph{Human-Computer
Interaction} (HCI) research is the generation of emotional images of human
faces, which can be used for various use cases, such as the automatic
generation of avatars. The problem hereby lies in the availability of training
data. Most suitable datasets for this task rely on categorical emotion models
and therefore feature only discrete annotation labels. This greatly hinders the
learning and modeling of smooth transitions between displayed affective states.
To overcome this challenge, we explore the potential of label interpolation to
enhance networks trained on categorical datasets with the ability to generate
images conditioned on continuous features.
- Abstract(参考訳): 生成的広告ネットワークは、実際の写真とほとんど区別できない、欺きに富んだ実画像を生成することができる。
しかし、そのようなシステムは対応するドメインを現実的に複製するために大きなデータセットの存在に依存している。
これは特に、ランダムな新しい画像が生成されるだけでなく、特定の(連続的な)特徴が一緒にモデル化される場合の問題である。
hci(enmph{human-computer interaction})研究で特に重要なユースケースは、アバターの自動生成など、さまざまなユースケースで使用できる人間の顔の感情イメージの生成である。
ここでの問題は、トレーニングデータの可用性にある。
このタスクに最も適したデータセットは分類的感情モデルに依存しており、そのため個別のアノテーションラベルのみを特徴としている。
これにより、表示された感情状態間の滑らかな遷移の学習とモデリングが著しく妨げられる。
この課題を克服するために,ラベル補間の可能性を探究し,連続的な特徴を条件とした画像を生成することで,カテゴリ的データセットにトレーニングされたネットワークを強化する。
関連論文リスト
- See or Guess: Counterfactually Regularized Image Captioning [32.82695612178604]
本稿では、因果推論を利用して、既存のモデルを介入作業に役立てる汎用画像キャプションフレームワークを提案する。
本手法は幻覚を効果的に低減し,画像への忠実さを向上し,小型および大規模の画像・テキスト・モデル間で高い可搬性を示す。
論文 参考訳(メタデータ) (2024-08-29T17:59:57Z) - SDFD: Building a Versatile Synthetic Face Image Dataset with Diverse Attributes [14.966767182001755]
顔の多様性の幅広いスペクトルをキャプチャする合成顔画像データセットを生成する手法を提案する。
具体的には、我々のアプローチは人口統計学とバイオメトリックスを統合するだけでなく、メイクアップ、ヘアスタイル、アクセサリーといった非永続的な特徴も統合しています。
これらのプロンプトは、高品質なリアル画像の包括的なデータセットを生成する際に、最先端のテキスト・ツー・イメージモデルを導く。
論文 参考訳(メタデータ) (2024-04-26T08:51:31Z) - Premonition: Using Generative Models to Preempt Future Data Changes in
Continual Learning [63.850451635362425]
継続的な学習には、データ分散の継続的な変化に対応するためのモデルが必要である。
本稿では,大規模言語モデルと画像生成モデルの組み合わせが有用であることを示す。
トレーニング済みネットワークのバックボーンは、下流の連続学習問題に有用な表現を学習できることがわかった。
論文 参考訳(メタデータ) (2024-03-12T06:29:54Z) - Counterfactual Image Editing [54.21104691749547]
対物画像編集は、生成AIにおいて重要なタスクであり、ある機能が異なる場合、画像がどのように見えるかを尋ねる。
本稿では,形式言語を用いた対物画像編集タスクを形式化し,潜在生成因子と画像の因果関係をモデル化する。
ニューラル因果モデルを利用して、対物画像を生成する効率的なアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-02-07T20:55:39Z) - Learned representation-guided diffusion models for large-image generation [58.192263311786824]
自己教師型学習(SSL)からの埋め込みを条件とした拡散モデルを訓練する新しいアプローチを導入する。
我々の拡散モデルは、これらの特徴を高品質な病理組織学およびリモートセンシング画像に投影することに成功した。
実画像のバリエーションを生成して実データを増やすことにより、パッチレベルおよび大規模画像分類タスクの下流精度が向上する。
論文 参考訳(メタデータ) (2023-12-12T14:45:45Z) - CIFAKE: Image Classification and Explainable Identification of
AI-Generated Synthetic Images [7.868449549351487]
本稿では,コンピュータビジョンによるAI生成画像の認識能力を高めることを提案する。
写真が本物かAIによって生成されるかに関して、バイナリ分類問題として存在する2つのデータセット。
本研究では,畳み込みニューラルネットワーク(CNN)を用いて画像をリアルとフェイクの2つのカテゴリに分類する。
論文 参考訳(メタデータ) (2023-03-24T16:33:06Z) - Towards Robust Classification Model by Counterfactual and Invariant Data
Generation [7.488317734152585]
純粋さは、一部の特徴がラベルと相関するが因果関係がないときに起こる。
本稿では2つのデータ生成プロセスを提案する。
我々のデータ生成は、スプリアス相関が壊れたときの精度で最先端の手法より優れています。
論文 参考訳(メタデータ) (2021-06-02T12:48:29Z) - Leveraging Self-Supervision for Cross-Domain Crowd Counting [71.75102529797549]
混雑したシーンで人をカウントするための最先端の方法は、群衆密度を推定するために深いネットワークに依存します。
われわれのネットワークは、通常の画像から逆さまの実際の画像を認識できるように訓練し、その不確実性を予測する能力を組み込む。
このアルゴリズムは、推論時に余分な計算をせずに、最先端のクロスドメイン群をカウントするアルゴリズムを一貫して上回る。
論文 参考訳(メタデータ) (2021-03-30T12:37:55Z) - Counterfactual Generative Networks [59.080843365828756]
画像生成過程を直接監督せずに訓練する独立した因果機構に分解することを提案する。
適切な誘導バイアスを活用することによって、これらのメカニズムは物体の形状、物体の質感、背景を解き放つ。
その結果, 偽画像は, 元の分類タスクにおける性能の低下を伴い, 分散性が向上することが示された。
論文 参考訳(メタデータ) (2021-01-15T10:23:12Z) - A 3D GAN for Improved Large-pose Facial Recognition [3.791440300377753]
深層畳み込みニューラルネットワークを用いた顔認識は、顔画像の大きなデータセットの可用性に依存している。
近年の研究では、アイデンティティからポーズを離す方法が不十分であることが示されている。
本研究では,GAN発生器に3次元モーフィラブルモデルを組み込むことにより,野生画像から非線形テクスチャモデルを学習する。
これにより、新しい合成IDの生成と、アイデンティティを損なうことなくポーズ、照明、表現の操作が可能になります。
論文 参考訳(メタデータ) (2020-12-18T22:41:15Z) - Using Simulated Data to Generate Images of Climate Change [108.43373369198765]
シミュレーションされた3次元環境からの画像を用いて,MUNITアーキテクチャによるドメイン適応タスクを改善する可能性について検討する。
気候変動の潜在的な影響に対する認識を高めるために、得られた画像を利用することを目指しています。
論文 参考訳(メタデータ) (2020-01-26T22:19:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。