論文の概要: Mid-level Representation Enhancement and Graph Embedded Uncertainty
Suppressing for Facial Expression Recognition
- arxiv url: http://arxiv.org/abs/2207.13235v1
- Date: Wed, 27 Jul 2022 01:25:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-28 12:59:14.543647
- Title: Mid-level Representation Enhancement and Graph Embedded Uncertainty
Suppressing for Facial Expression Recognition
- Title(参考訳): 顔表情認識のための中レベル表現強調とグラフ埋め込み不確かさ抑制
- Authors: Jie Lei, Zhao Liu, Zeyu Zou, Tong Li, Xu Juan, Shuaiwei Wang, Guoyu
Yang, Zunlei Feng
- Abstract要約: 我々は、中間レベル表現強化(MRE)とグラフ埋め込み不確実性抑制(GUS)を提案する。
一方、MREは、表現表現学習が限られた数の高度に識別可能なパターンに支配されるのを避けるために導入された。
一方、GUSは表現空間における特徴のあいまいさを抑制するために導入された。
- 参考スコア(独自算出の注目度): 24.1753129572881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facial expression is an essential factor in conveying human emotional states
and intentions. Although remarkable advancement has been made in facial
expression recognition (FER) task, challenges due to large variations of
expression patterns and unavoidable data uncertainties still remain. In this
paper, we propose mid-level representation enhancement (MRE) and graph embedded
uncertainty suppressing (GUS) addressing these issues. On one hand, MRE is
introduced to avoid expression representation learning being dominated by a
limited number of highly discriminative patterns. On the other hand, GUS is
introduced to suppress the feature ambiguity in the representation space. The
proposed method not only has stronger generalization capability to handle
different variations of expression patterns but also more robustness to capture
expression representations. Experimental evaluation on Aff-Wild2 have verified
the effectiveness of the proposed method.
- Abstract(参考訳): 表情は人間の感情状態や意図を伝える上で不可欠な要素である。
顔表情認識(FER)タスクでは顕著な進歩があったが、表現パターンの多様さや避けられないデータの不確実性による課題は依然として残っている。
本稿では,これらの問題に対処する中レベル表現強化(MRE)とグラフ埋め込み不確実性抑制(GUS)を提案する。
一方、MREは、表現表現学習が限られた数の高度識別パターンに支配されるのを避けるために導入された。
一方、GUSは表現空間における特徴のあいまいさを抑制するために導入された。
提案手法は表現パターンの異なるバリエーションを扱うためのより強固な一般化機能を持つだけでなく,表現表現をキャプチャするロバスト性も備えている。
aff-wild2の有効性を実験的に検証した。
関連論文リスト
- Knowledge-Enhanced Facial Expression Recognition with Emotional-to-Neutral Transformation [66.53435569574135]
既存の表情認識法は、通常、個別のラベルを使って訓練済みのビジュアルエンコーダを微調整する。
視覚言語モデルによって生成されるテキスト埋め込みの豊富な知識は、識別的表情表現を学ぶための有望な代替手段である。
感情-中性変換を用いた知識強化FER法を提案する。
論文 参考訳(メタデータ) (2024-09-13T07:28:57Z) - Contrastive Learning of View-Invariant Representations for Facial
Expressions Recognition [27.75143621836449]
コントラスト学習に基づく新しいビュー不変FERフレームワークであるViewFXを提案する。
提案手法を2つの公開多視点顔表情認識データセット上で検証する。
論文 参考訳(メタデータ) (2023-11-12T14:05:09Z) - Towards General Visual-Linguistic Face Forgery Detection [95.73987327101143]
ディープフェイクは現実的な顔操作であり、セキュリティ、プライバシー、信頼に深刻な脅威をもたらす可能性がある。
既存の方法は、このタスクを、デジタルラベルまたはマスク信号を使用して検出モデルをトレーニングするバイナリ分類として扱う。
本稿では, 微粒な文レベルのプロンプトをアノテーションとして用いた, VLFFD (Visual-Linguistic Face Forgery Detection) という新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2023-07-31T10:22:33Z) - Exploring Large-scale Unlabeled Faces to Enhance Facial Expression
Recognition [12.677143408225167]
本研究では、ラベルのない顔データを用いて表現認識モデルを効果的に訓練する半教師付き学習フレームワークを提案する。
本手法では,顔認識データを完全に活用するために,信頼度を適応的に調整できる動的しきい値モジュールを用いる。
ABAW5 EXPRタスクでは,オフィシャル検証セットにおいて優れた結果を得た。
論文 参考訳(メタデータ) (2023-03-15T13:43:06Z) - Uncertain Facial Expression Recognition via Multi-task Assisted
Correction [43.02119884581332]
MTACと呼ばれる不確実な表情認識に対処するためのマルチタスク支援補正法を提案する。
具体的には、信頼度推定ブロックと重み付け正則化モジュールを用いて、固体試料をハイライトし、バッチ毎に不確かさサンプルを抑圧する。
RAF-DB、AffectNet、AffWild2データセットの実験は、MTACが合成および実際の不確実性に直面した際のベースラインよりも大幅に改善されていることを示した。
論文 参考訳(メタデータ) (2022-12-14T10:28:08Z) - Revisiting Self-Supervised Contrastive Learning for Facial Expression
Recognition [39.647301516599505]
我々は,自己指導型コントラスト学習の活用を再考し,表現固有の表現を強制するための3つの中核戦略を探求する。
実験の結果,提案手法は最先端の自己教師型学習法よりも優れていた。
論文 参考訳(メタデータ) (2022-10-08T00:04:27Z) - Dive into Ambiguity: Latent Distribution Mining and Pairwise Uncertainty
Estimation for Facial Expression Recognition [59.52434325897716]
DMUE(DMUE)という,アノテーションのあいまいさを2つの視点から解決するソリューションを提案する。
前者に対しては,ラベル空間における潜伏分布をよりよく記述するために,補助的マルチブランチ学習フレームワークを導入する。
後者の場合、インスタンス間の意味的特徴のペアワイズ関係を完全に活用して、インスタンス空間のあいまいさの程度を推定する。
論文 参考訳(メタデータ) (2021-04-01T03:21:57Z) - Adversarial Semantic Data Augmentation for Human Pose Estimation [96.75411357541438]
本研究では,セマンティックデータ拡張法 (SDA) を提案する。
また,適応的セマンティックデータ拡張 (ASDA) を提案する。
最先端の結果は、挑戦的なベンチマークで得られます。
論文 参考訳(メタデータ) (2020-08-03T07:56:04Z) - LEED: Label-Free Expression Editing via Disentanglement [57.09545215087179]
LEEDフレームワークは、表現ラベルを必要とせずに、前頭顔画像とプロファイル顔画像の両方の表現を編集することができる。
2つの新たな損失は、最適な表現の切り離しと一貫した合成のために設計されている。
論文 参考訳(メタデータ) (2020-07-17T13:36:15Z) - Occlusion-Adaptive Deep Network for Robust Facial Expression Recognition [56.11054589916299]
本研究では,隠蔽領域から腐敗した特徴を発見・破棄するためのランドマーク誘導型アテンションブランチを提案する。
注意マップが最初に作成され、特定の顔部が閉鎖されているかどうかを示し、我々のモデルを非閉鎖領域に誘導する。
これにより、顔が部分的に隠されている場合でも、表情認識システムが回復することができる。
論文 参考訳(メタデータ) (2020-05-12T20:42:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。