論文の概要: SimFLE: Simple Facial Landmark Encoding for Self-Supervised Facial
Expression Recognition in the Wild
- arxiv url: http://arxiv.org/abs/2303.07648v1
- Date: Tue, 14 Mar 2023 06:30:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-15 16:16:38.321756
- Title: SimFLE: Simple Facial Landmark Encoding for Self-Supervised Facial
Expression Recognition in the Wild
- Title(参考訳): simfle: 野生の自己教師付き表情認識のための簡単な顔ランドマーク符号化
- Authors: Jiyong Moon and Seongsik Park
- Abstract要約: 顔のランドマークの効果的な符号化を学習できる自己教師型簡易顔ランドマーク符号化法(SimFLE)を提案する。
この目的のために、新しいFaceMAEモジュールを紹介します。
いくつかのFER-Wベンチマークの実験結果から、提案したSimFLEは顔のランドマークのローカライゼーションに優れていることが証明された。
- 参考スコア(独自算出の注目度): 3.4798852684389963
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the key issues in facial expression recognition in the wild (FER-W) is
that curating large-scale labeled facial images is challenging due to the
inherent complexity and ambiguity of facial images. Therefore, in this paper,
we propose a self-supervised simple facial landmark encoding (SimFLE) method
that can learn effective encoding of facial landmarks, which are important
features for improving the performance of FER-W, without expensive labels.
Specifically, we introduce novel FaceMAE module for this purpose. FaceMAE
reconstructs masked facial images with elaborately designed semantic masking.
Unlike previous random masking, semantic masking is conducted based on channel
information processed in the backbone, so rich semantics of channels can be
explored. Additionally, the semantic masking process is fully trainable,
enabling FaceMAE to guide the backbone to learn spatial details and contextual
properties of fine-grained facial landmarks. Experimental results on several
FER-W benchmarks prove that the proposed SimFLE is superior in facial landmark
localization and noticeably improved performance compared to the supervised
baseline and other self-supervised methods.
- Abstract(参考訳): 野生(fer-w)における表情認識の重要な問題の一つは、顔画像の複雑さとあいまいさのため、大規模なラベル付き顔画像のキュレーションが難しいことである。
そこで本稿では,fer-Wの性能向上に重要な特徴である顔ランドマークの効果的な符号化を,高価なラベルを使わずに学習できる自己教師型簡易顔ランドマーク符号化(SimFLE)手法を提案する。
具体的には,新しいFaceMAEモジュールについて紹介する。
FaceMAEは、精巧に設計されたセマンティックマスクでマスクされた顔画像を再構成する。
以前のランダムマスキングとは異なり、セマンティクスマスキングはバックボーンで処理されたチャネル情報に基づいて行われるため、チャネルの豊富なセマンティクスを探求することができる。
さらに、セマンティックマスキングプロセスは完全にトレーニング可能で、FaceMAEはバックボーンをガイドして、きめ細かい顔のランドマークの空間的詳細と文脈的特性を学ぶことができる。
複数のfer-wベンチマークにおける実験結果から,提案手法は顔ランドマークの定位に優れ,教師ありベースラインや他の自己教師あり手法と比較して明らかに性能が向上した。
関連論文リスト
- LAFS: Landmark-based Facial Self-supervised Learning for Face
Recognition [37.4550614524874]
我々は、効果的な顔認識モデルの訓練に適応できる顔表現の学習に焦点をあてる。
本研究では,自己教師付き事前学習による未ラベル顔画像の学習戦略について検討する。
提案手法は,複数の顔認識ベンチマークにおける最先端技術よりも大幅に向上する。
論文 参考訳(メタデータ) (2024-03-13T01:07:55Z) - Self-Supervised Facial Representation Learning with Facial Region
Awareness [13.06996608324306]
自己教師付き事前学習は、様々な視覚的タスクに役立つ伝達可能な表現を学習するのに有効であることが証明されている。
この目標に向けての最近の取り組みは、各顔画像を全体として扱うことに限定されている。
本研究では,一貫したグローバルおよびローカルな顔表現を学習するための,自己教師型顔表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-04T15:48:56Z) - A Generalist FaceX via Learning Unified Facial Representation [77.74407008931486]
FaceXは、多様な顔タスクを同時に処理できる新しい顔ジェネラリストモデルである。
汎用的なFaceXは、一般的な顔編集タスクの精巧なタスク特化モデルと比較して、競争性能が向上する。
論文 参考訳(メタデータ) (2023-12-31T17:41:48Z) - Seeing through the Mask: Multi-task Generative Mask Decoupling Face
Recognition [47.248075664420874]
現在の一般的な顔認識システムは、隠蔽シーンに遭遇する際の重大な性能劣化に悩まされている。
本稿では,これら2つのタスクを協調的に扱うために,マルチタスクのgEnerative mask dEcoupling Face Recognition (MEER) ネットワークを提案する。
まず,マスクと識別情報を分離する新しいマスクデカップリングモジュールを提案する。
論文 参考訳(メタデータ) (2023-11-20T03:23:03Z) - FaceDancer: Pose- and Occlusion-Aware High Fidelity Face Swapping [62.38898610210771]
そこで我々は,FaceDancerという顔のスワップとID転送のための新しい単一ステージ手法を提案する。
アダプティブ・フィーチャー・フュージョン・アテンション(AFFA)と解釈的特徴類似性規則化(IFSR)の2つの主要なコントリビューションがある。
論文 参考訳(メタデータ) (2022-10-19T11:31:38Z) - Emotion Separation and Recognition from a Facial Expression by Generating the Poker Face with Vision Transformers [57.1091606948826]
我々はこれらの課題に対処するため,ポーカー・フェイス・ビジョン・トランスフォーマー (PF-ViT) と呼ばれる新しいFERモデルを提案する。
PF-ViTは、対応するポーカーフェースを生成して、乱れを認識できない感情を静的な顔画像から分離し、認識することを目的としている。
PF-ViTはバニラビジョントランスフォーマーを使用し、そのコンポーネントは大規模な表情データセット上でMasked Autoencodeerとして事前トレーニングされている。
論文 参考訳(メタデータ) (2022-07-22T13:39:06Z) - Foreground-guided Facial Inpainting with Fidelity Preservation [7.5089719291325325]
本稿では,畳み込みニューラルネットワーク層を用いて顔特徴を抽出・生成できるフォアグラウンド誘導型顔塗工フレームワークを提案する。
具体的には,表情の意味的能力推論,自然・不自然な特徴(メイクアップ)を用いた新しい損失関数を提案する。
提案手法は, 顔成分の高忠実度保存を, 質的に比較すると, 比較して定量的な結果を得た。
論文 参考訳(メタデータ) (2021-05-07T15:50:58Z) - DotFAN: A Domain-transferred Face Augmentation Network for Pose and
Illumination Invariant Face Recognition [94.96686189033869]
本稿では,3次元モデルを用いたドメイン転送型顔強調ネットワーク(DotFAN)を提案する。
DotFANは、他のドメインから収集された既存のリッチフェイスデータセットから抽出された知識に基づいて、入力顔の一連の変種を生成することができる。
実験によると、DotFANは、クラス内の多様性を改善するために、小さな顔データセットを増やすのに有益である。
論文 参考訳(メタデータ) (2020-02-23T08:16:34Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。