論文の概要: Learning Diversified Feature Representations for Facial Expression
Recognition in the Wild
- arxiv url: http://arxiv.org/abs/2210.09381v1
- Date: Mon, 17 Oct 2022 19:25:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 13:45:08.371032
- Title: Learning Diversified Feature Representations for Facial Expression
Recognition in the Wild
- Title(参考訳): 野生における表情認識のための多様な特徴表現の学習
- Authors: Negar Heidari, Alexandros Iosifidis
- Abstract要約: 本稿では,CNN層が抽出した顔表情認識アーキテクチャの特徴を多様化する機構を提案する。
AffectNet,FER+,RAF-DBの3つの顔表情認識実験の結果,本手法の有効性が示された。
- 参考スコア(独自算出の注目度): 97.14064057840089
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diversity of the features extracted by deep neural networks is important for
enhancing the model generalization ability and accordingly its performance in
different learning tasks. Facial expression recognition in the wild has
attracted interest in recent years due to the challenges existing in this area
for extracting discriminative and informative features from occluded images in
real-world scenarios. In this paper, we propose a mechanism to diversify the
features extracted by CNN layers of state-of-the-art facial expression
recognition architectures for enhancing the model capacity in learning
discriminative features. To evaluate the effectiveness of the proposed
approach, we incorporate this mechanism in two state-of-the-art models to (i)
diversify local/global features in an attention-based model and (ii) diversify
features extracted by different learners in an ensemble-based model.
Experimental results on three well-known facial expression recognition
in-the-wild datasets, AffectNet, FER+, and RAF-DB, show the effectiveness of
our method, achieving the state-of-the-art performance of 89.99% on RAF-DB,
89.34% on FER+ and the competitive accuracy of 60.02% on AffectNet dataset.
- Abstract(参考訳): 深層ニューラルネットワークによって抽出される特徴の多様性は、モデルの一般化能力の向上と、異なる学習タスクのパフォーマンス向上に重要である。
現実のシナリオにおいて、オクルード画像から識別的および情報的特徴を抽出するという課題がこの地域に存在するため、野生の表情認識は近年注目を集めている。
本稿では,cnn層から抽出される特徴を多角化するためのメカニズムを提案し,識別的特徴の学習におけるモデル能力を向上させる。
提案手法の有効性を評価するため,この機構を2つの最先端モデルに組み込む。
(i)注意に基づくモデルにおける局所的・グローバル的特徴の多様化
(2)異なる学習者が抽出した特徴をアンサンブルモデルで多様化させる。
AffectNet,FER+,RAF-DBの3つのよく知られた表情認識実験の結果,RAF-DBの89.99%,FER+の89.34%,AffectNetデータセットの60.02%の競争精度を達成し,本手法の有効性を示した。
関連論文リスト
- Emotic Masked Autoencoder with Attention Fusion for Facial Expression Recognition [1.4374467687356276]
本稿では,MAE-Face self-supervised learning (SSL) 法と多視点融合注意機構を組み合わせた表現分類手法を提案する。
我々は、重要な顔の特徴を強調表示して、そのような機能がモデルのガイドとして機能するかどうかを判断することを目的とした、実装が容易でトレーニングなしのフレームワークを提案する。
Aff-wild2データセットにおけるモデル性能の改善により,本手法の有効性が検証された。
論文 参考訳(メタデータ) (2024-03-19T16:21:47Z) - CIAO! A Contrastive Adaptation Mechanism for Non-Universal Facial
Expression Recognition [80.07590100872548]
本稿では、顔エンコーダの最後の層に異なるデータセットの特定の感情特性を適応させるメカニズムであるContrastive Inhibitory Adaptati On(CIAO)を提案する。
CIAOは、非常にユニークな感情表現を持つ6つの異なるデータセットに対して、表情認識性能が改善されている。
論文 参考訳(メタデータ) (2022-08-10T15:46:05Z) - Multi-Branch Deep Radial Basis Function Networks for Facial Emotion
Recognition [80.35852245488043]
放射状基底関数(RBF)ユニットによって形成された複数の分岐で拡張されたCNNベースのアーキテクチャを提案する。
RBFユニットは、中間表現を用いて類似のインスタンスで共有される局所パターンをキャプチャする。
提案手法は,提案手法の競争力を高めるためのローカル情報の導入であることを示す。
論文 参考訳(メタデータ) (2021-09-07T21:05:56Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Exploiting Emotional Dependencies with Graph Convolutional Networks for
Facial Expression Recognition [31.40575057347465]
本稿では,視覚における表情認識のためのマルチタスク学習フレームワークを提案する。
MTL設定において、離散認識と連続認識の両方のために共有特徴表現が学習される。
実験の結果,本手法は離散FER上での最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-06-07T10:20:05Z) - Feature Decomposition and Reconstruction Learning for Effective Facial
Expression Recognition [80.17419621762866]
本稿では,表情認識のための特徴分解再構成学習(FDRL)手法を提案する。
FDRLは、FDN(Feature Decomposition Network)とFRN(Feature Restruction Network)の2つの重要なネットワークで構成されている。
論文 参考訳(メタデータ) (2021-04-12T02:22:45Z) - A Multi-resolution Approach to Expression Recognition in the Wild [9.118706387430883]
顔認識タスクを解決するためのマルチリゾリューション手法を提案する。
私たちは、しばしば異なる解像度で画像が取得されるという観察を直感的に根拠としています。
我々は、Affect-in-the-Wild 2データセットに基づいてトレーニングされたSqueeze-and-Excitationブロックを備えたResNetのようなアーキテクチャを使用する。
論文 参考訳(メタデータ) (2021-03-09T21:21:02Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Two-Level Adversarial Visual-Semantic Coupling for Generalized Zero-shot
Learning [21.89909688056478]
トレーニング中に推論ネットワークを用いて生成ネットワークを増強する2段階のジョイントアイデアを提案する。
これにより、ビジュアルドメインとセマンティックドメイン間の効果的な知識伝達のための強力な相互モーダル相互作用が提供される。
提案手法は,4つのベンチマークデータセットに対して,いくつかの最先端手法に対して評価し,その性能を示す。
論文 参考訳(メタデータ) (2020-07-15T15:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。