論文の概要: Lossless Attention in Convolutional Networks for Facial Expression
Recognition in the Wild
- arxiv url: http://arxiv.org/abs/2001.11869v1
- Date: Fri, 31 Jan 2020 14:38:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 06:37:44.852976
- Title: Lossless Attention in Convolutional Networks for Facial Expression
Recognition in the Wild
- Title(参考訳): 野生の表情認識のための畳み込みネットワークにおけるロスレス注意
- Authors: Chuang Wang, Ruimin Hu, Min Hu, Jiang Liu, Ting Ren, Shan He, Ming
Jiang, Jing Miao
- Abstract要約: 本稿では,畳み込みニューラルネットワーク (CNN) のためのロスレス注意モデル (LLAM) を提案し,顔から注意を意識した特徴を抽出する。
我々は,FG-2020 Affective Behavior Analysis in-the-wild Challengeの7つの基本表現分類に参加する。
そして,本手法をチャレンジでリリースしたAff-Wild2データセット上で検証する。
- 参考スコア(独自算出の注目度): 26.10189921938026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unlike the constraint frontal face condition, faces in the wild have various
unconstrained interference factors, such as complex illumination, changing
perspective and various occlusions. Facial expressions recognition (FER) in the
wild is a challenging task and existing methods can't perform well. However,
for occluded faces (containing occlusion caused by other objects and
self-occlusion caused by head posture changes), the attention mechanism has the
ability to focus on the non-occluded regions automatically. In this paper, we
propose a Lossless Attention Model (LLAM) for convolutional neural networks
(CNN) to extract attention-aware features from faces. Our module avoids decay
information in the process of generating attention maps by using the
information of the previous layer and not reducing the dimensionality.
Sequentially, we adaptively refine the feature responses by fusing the
attention map with the feature map. We participate in the seven basic
expression classification sub-challenges of FG-2020 Affective Behavior Analysis
in-the-wild Challenge. And we validate our method on the Aff-Wild2 datasets
released by the Challenge. The total accuracy (Accuracy) and the unweighted
mean (F1) of our method on the validation set are 0.49 and 0.38 respectively,
and the final result is 0.42 (0.67 F1-Score + 0.33 Accuracy).
- Abstract(参考訳): 前頭面の制約条件とは異なり、野生の顔は複雑な照明、遠近法の変化、様々な咬合といった様々な制約のない干渉要因を持っている。
顔の表情認識(FER)は難しい課題であり、既存の手法ではうまく機能しない。
しかし、閉塞面(他の物体による閉塞や頭部姿勢の変化による自己閉塞を含む)では、注意機構は非閉塞領域に自動的に集中することができる。
本稿では,畳み込みニューラルネットワーク (CNN) のためのロスレス注意モデル (LLAM) を提案し,顔から注意を意識した特徴を抽出する。
本モジュールは,前層の情報を用いて注意マップを生成する過程における減衰情報を避け,次元性を低減しない。
次に,注目マップと特徴マップを融合させて特徴応答を適応的に改善する。
我々は,FG-2020 Affective Behavior Analysis in-the-wild Challengeの7つの基本表現分類に参加する。
そして,本手法をチャレンジでリリースしたAff-Wild2データセット上で検証する。
検証セットにおける全精度(精度)と非重み付け平均(f1)はそれぞれ0.49と0.38であり、最終結果は0.42である(0.67 f1-score + 0.33精度)。
関連論文リスト
- Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - Latent-OFER: Detect, Mask, and Reconstruct with Latent Vectors for
Occluded Facial Expression Recognition [0.0]
提案手法は, 顔の隠蔽部分を, 隠蔽されていないかのように検出し, 認識し, FER精度を向上する。
まず、視覚変換器(ViT)ベースのオクルージョンパッチ検出器は、隠蔽されたパッチから潜在ベクトルのみを訓練することで、隠蔽された位置をマスクする。
第2に、ハイブリッド再構成ネットワークは、ViTと畳み込みニューラルネットワーク(CNN)を用いて、完全な画像としてマスキング位置を生成する。
最後に、式関連潜時ベクトル抽出器は、CNNに基づくクラスアクティベーションマップを適用して、すべての潜時ベクトルから式関連情報を検索し、使用する。
論文 参考訳(メタデータ) (2023-07-21T07:56:32Z) - Set-Based Face Recognition Beyond Disentanglement: Burstiness
Suppression With Variance Vocabulary [78.203301910422]
SFRにおける2つの重要な問題は、顔の品質とバーストネスであり、アイデンティティ非関連と分散関連の両方である、と我々は主張する。
分散特徴と同一性の特徴を分離する軽量な集合ベース・アンタングルメント・フレームワークを提案する。
集合における顔のバースト性を抑制するために,語彙ベースバースト抑制法(VBS)を提案する。
論文 参考訳(メタデータ) (2023-04-13T04:02:58Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - Robust and Precise Facial Landmark Detection by Self-Calibrated Pose
Attention Network [73.56802915291917]
より堅牢で正確な顔のランドマーク検出を実現するための半教師付きフレームワークを提案する。
より効果的な顔形状制約をモデル化するために,境界対応ランドマーク強度(BALI)フィールドを提案する。
自己キャリブレーション・ポース・アテンション(SCPA)モデルは、中間的監督を強制する自己学習型目標関数を提供するように設計されている。
論文 参考訳(メタデータ) (2021-12-23T02:51:08Z) - End2End Occluded Face Recognition by Masking Corrupted Features [82.27588990277192]
最先端の一般的な顔認識モデルは、隠蔽された顔画像に対してうまく一般化しない。
本稿では,1つのエンドツーエンドのディープニューラルネットワークに基づいて,オクルージョンに頑健な新しい顔認識手法を提案する。
我々のアプローチは、深い畳み込みニューラルネットワークから破損した特徴を発見し、動的に学習されたマスクによってそれらをきれいにする。
論文 参考訳(メタデータ) (2021-08-21T09:08:41Z) - Robust Facial Expression Recognition with Convolutional Visual
Transformers [23.05378099875569]
コンボリューションビジュアルトランスフォーマーは、主に2つのステップで野生の表情認識に取り組むために提案します。
まず,2分岐CNNが生成する特徴マップを活用するための注意選択融合(ASF)を提案する。
第二に,自然言語処理におけるトランスフォーマーの成功に触発されて,これらの視覚単語間の関係をグローバル自己着眼でモデル化することを提案する。
論文 参考訳(メタデータ) (2021-03-31T07:07:56Z) - Micro-Facial Expression Recognition Based on Deep-Rooted Learning
Algorithm [0.0]
本稿では,MFEDRL(Micro-Facial Expression Based Deep-Rooted Learning)分類器を提案する。
アルゴリズムの性能は認識率と偽測度を用いて評価する。
論文 参考訳(メタデータ) (2020-09-12T12:23:27Z) - Occlusion-Adaptive Deep Network for Robust Facial Expression Recognition [56.11054589916299]
本研究では,隠蔽領域から腐敗した特徴を発見・破棄するためのランドマーク誘導型アテンションブランチを提案する。
注意マップが最初に作成され、特定の顔部が閉鎖されているかどうかを示し、我々のモデルを非閉鎖領域に誘導する。
これにより、顔が部分的に隠されている場合でも、表情認識システムが回復することができる。
論文 参考訳(メタデータ) (2020-05-12T20:42:55Z) - Suppressing Uncertainties for Large-Scale Facial Expression Recognition [81.51495681011404]
本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
論文 参考訳(メタデータ) (2020-02-24T17:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。