論文の概要: Generative Adversarial Stacked Autoencoders for Facial Pose
Normalization and Emotion Recognition
- arxiv url: http://arxiv.org/abs/2007.09790v1
- Date: Sun, 19 Jul 2020 21:47:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 23:56:43.770653
- Title: Generative Adversarial Stacked Autoencoders for Facial Pose
Normalization and Emotion Recognition
- Title(参考訳): 表情の正規化と感情認識のための生成的対向重積オートエンコーダ
- Authors: Ariel Ruiz-Garcia, Vasile Palade, Mark Elshaw, Mariette Awad
- Abstract要約: 本稿では,表情のマッピングを学習するジェネレーティブ・アドバイサル・スタックド・オートエンコーダを提案する。
野生で採集された顔の感情認識コーパスについて,最先端のパフォーマンスを報告した。
- 参考スコア(独自算出の注目度): 4.620526905329234
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this work, we propose a novel Generative Adversarial Stacked Autoencoder
that learns to map facial expressions, with up to plus or minus 60 degrees, to
an illumination invariant facial representation of 0 degrees. We accomplish
this by using a novel convolutional layer that exploits both local and global
spatial information, and a convolutional layer with a reduced number of
parameters that exploits facial symmetry. Furthermore, we introduce a
generative adversarial gradual greedy layer-wise learning algorithm designed to
train Adversarial Autoencoders in an efficient and incremental manner. We
demonstrate the efficiency of our method and report state-of-the-art
performance on several facial emotion recognition corpora, including one
collected in the wild.
- Abstract(参考訳): 本研究では,最大60度以上の表情を0度の照明不変な表情表現にマッピングすることを学ぶ,新しい生成的逆向き自動エンコーダを提案する。
局所空間情報と大域的空間情報の両方を利用する新しい畳み込み層と、顔の対称性を利用するパラメータの少ない畳み込み層を用いてこれを達成する。
さらに, 逐次的かつ効率的な自動エンコーダの学習を目的とした, 逐次的逆回帰層学習アルゴリズムを提案する。
本手法の有効性を実証し,実地で収集した顔を含む複数の表情認識コーパスにおける最先端のパフォーマンスを報告する。
関連論文リスト
- ID-Guard: A Universal Framework for Combating Facial Manipulation via Breaking Identification [60.73617868629575]
深層学習に基づく顔操作の誤用は、公民権に対する潜在的な脅威となる。
この不正行為を防ぐため、プロアクティブな防御技術が提案され、操作プロセスを妨害した。
我々は,ID-Guardと呼ばれる,顔操作と戦うための新しい普遍的枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-20T09:30:08Z) - G2Face: High-Fidelity Reversible Face Anonymization via Generative and Geometric Priors [71.69161292330504]
可逆顔匿名化(Reversible face anonymization)は、顔画像の繊細なアイデンティティ情報を、合成された代替品に置き換えようとしている。
本稿では,Gtextsuperscript2Faceを提案する。
提案手法は,高データの有効性を保ちながら,顔の匿名化と回復において既存の最先端技術よりも優れる。
論文 参考訳(メタデータ) (2024-08-18T12:36:47Z) - Masked Face Recognition with Generative-to-Discriminative Representations [29.035270415311427]
本研究では,マスク付き顔認識を容易にするために,生成と識別の表現を学習するための統合されたディープネットワークを提案する。
まず,顔の塗り絵に予め訓練された生成エンコーダを利用して,顔のマスクをカテゴリ認識記述子に表現する。
我々は,多層畳み込みネットワークを識別的再構成器として組み込んで,カテゴリ対応記述子をアイデンティティ対応ベクトルに変換することを学習する。
論文 参考訳(メタデータ) (2024-05-27T02:20:55Z) - LCM-Lookahead for Encoder-based Text-to-Image Personalization [82.56471486184252]
我々は,テキスト・ツー・イメージ・モデルのパーソナライズを導くために,ショートカット・メカニズムを利用する可能性を探る。
エンコーダをベースとしたパーソナライズ手法に焦点をあてて、ルックアヘッドのアイデンティティ損失を調整することで、より高いアイデンティティの忠実性を達成できることを実証する。
論文 参考訳(メタデータ) (2024-04-04T17:43:06Z) - E2F-Net: Eyes-to-Face Inpainting via StyleGAN Latent Space [4.110419543591102]
我々は、E2F-Net(Eyes-to-Face Network)と呼ばれるGANベースのモデルを提案する。
提案手法は,2つの専用エンコーダを用いて眼周囲領域から同一性および非同一性の特徴を抽出する。
提案手法は,現在の手法を超越して,高品質な顔全体の再構築に成功していることを示す。
論文 参考訳(メタデータ) (2024-03-18T19:11:34Z) - DreamIdentity: Improved Editability for Efficient Face-identity
Preserved Image Generation [69.16517915592063]
人間の顔の正確な表現を学習するための新しい顔識別エンコーダを提案する。
また、モデルの編集可能性を高めるために、自己拡張編集可能性学習を提案する。
我々の手法は、異なるシーン下でより高速にアイデンティティ保存された画像を生成することができる。
論文 参考訳(メタデータ) (2023-07-01T11:01:17Z) - Multi-Domain Norm-referenced Encoding Enables Data Efficient Transfer
Learning of Facial Expression Recognition [62.997667081978825]
本稿では,表情認識における伝達学習のための生物学的メカニズムを提案する。
提案アーキテクチャでは,人間の脳が,頭部形状の異なる表情を自然に認識する方法について解説する。
本モデルでは, FERGデータセットの分類精度92.15%を極端に高いデータ効率で達成する。
論文 参考訳(メタデータ) (2023-04-05T09:06:30Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - Emotion Transfer Using Vector-Valued Infinite Task Learning [2.588412672658578]
本稿では,無限タスク学習とベクトル値再生カーネルHilbert空間に基づく新しいスタイル転送フレームワークを提案する。
我々は、顔のイメージを異なるターゲットの感情に変換することを目標とする感情伝達のアイデアをインスタンス化する。
論文 参考訳(メタデータ) (2021-02-09T19:05:56Z) - Head2Head++: Deep Facial Attributes Re-Targeting [6.230979482947681]
我々は,顔の3次元形状とGANを利用して,顔と頭部の再現作業のための新しいディープラーニングアーキテクチャを設計する。
駆動単眼動作から複雑な非剛性顔の動きを捉え,時間的に一貫した映像を合成する。
我々のシステムは、ほぼリアルタイムでエンドツーエンドの再現(18fps)を行う。
論文 参考訳(メタデータ) (2020-06-17T23:38:37Z) - FaceShifter: Towards High Fidelity And Occlusion Aware Face Swapping [43.236261887752065]
本研究では,顔交換のための2段階フレームワークであるFaceShifterを提案する。
最初の段階では、ターゲット属性を徹底的かつ適応的に利用して、スワップされた顔を高忠実に生成する。
難解な顔合成に対処するために、HEAR-Net(Huristic Err Accnowledging Refinement Network)と呼ばれる新しいヒューリスティック・エラー認識ネットワーク(Heuristic Err Acknowledging Refinement Network)の第2ステージを付加する。
論文 参考訳(メタデータ) (2019-12-31T17:57:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。