論文の概要: Suppressing Uncertainties for Large-Scale Facial Expression Recognition
- arxiv url: http://arxiv.org/abs/2002.10392v2
- Date: Fri, 6 Mar 2020 09:57:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-29 04:14:30.350193
- Title: Suppressing Uncertainties for Large-Scale Facial Expression Recognition
- Title(参考訳): 大規模顔表情認識における不確かさの抑制
- Authors: Kai Wang, Xiaojiang Peng, Jianfei Yang, Shijian Lu, Yu Qiao
- Abstract要約: 本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
- 参考スコア(独自算出の注目度): 81.51495681011404
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Annotating a qualitative large-scale facial expression dataset is extremely
difficult due to the uncertainties caused by ambiguous facial expressions,
low-quality facial images, and the subjectiveness of annotators. These
uncertainties lead to a key challenge of large-scale Facial Expression
Recognition (FER) in deep learning era. To address this problem, this paper
proposes a simple yet efficient Self-Cure Network (SCN) which suppresses the
uncertainties efficiently and prevents deep networks from over-fitting
uncertain facial images. Specifically, SCN suppresses the uncertainty from two
different aspects: 1) a self-attention mechanism over mini-batch to weight each
training sample with a ranking regularization, and 2) a careful relabeling
mechanism to modify the labels of these samples in the lowest-ranked group.
Experiments on synthetic FER datasets and our collected WebEmotion dataset
validate the effectiveness of our method. Results on public benchmarks
demonstrate that our SCN outperforms current state-of-the-art methods with
\textbf{88.14}\% on RAF-DB, \textbf{60.23}\% on AffectNet, and \textbf{89.35}\%
on FERPlus. The code will be available at
\href{https://github.com/kaiwang960112/Self-Cure-Network}{https://github.com/kaiwang960112/Self-Cure-Network}.
- Abstract(参考訳): 定性的な大規模表情データセットの注釈付けは,あいまいな表情,低品質な顔画像,注釈者の主観性などの不確実性から,極めて困難である。
これらの不確実性は、ディープラーニング時代における大規模な表情認識(FER)の重要な課題に繋がる。
そこで本研究では,不確かさを効果的に抑制し,深層ネットワークによる不確かさな顔画像の過剰フィッティングを防止する,簡便で効率的な自己キュアネットワーク(scn)を提案する。
具体的には、SCNは2つの異なる側面から不確実性を抑制する。
1)ランキング正則化による各トレーニングサンプルの重み付けのためのミニバッチに対する自己注意機構
2) これらのサンプルのラベルを最も低いランクのグループで変更するための注意深いリラベリング機構。
合成FERデータセットと収集したWebEmotionデータセットの実験により,本手法の有効性が検証された。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBでは \textbf{88.14}\%、AffectNetでは \textbf{60.23}\%、FERPlusでは \textbf{89.35}\% に優れていた。
コードは \href{https://github.com/kaiwang960112/Self-Cure-Network}{https://github.com/kaiwang960112/Self-Cure-Network} で入手できる。
関連論文リスト
- Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - RARE: Robust Masked Graph Autoencoder [45.485891794905946]
Masked graph autoencoder (MGAE) は、有望な自己教師付きグラフ事前学習(SGP)パラダイムとして登場した。
本稿では,ロバストmAsked gRaph autoEncoder (RARE) と呼ばれる新しいSGP手法を提案する。
論文 参考訳(メタデータ) (2023-04-04T03:35:29Z) - Attribute-preserving Face Dataset Anonymization via Latent Code
Optimization [64.4569739006591]
本稿では,事前学習したGANの潜時空間における画像の潜時表現を直接最適化するタスク非依存匿名化手法を提案する。
我々は一連の実験を通して、我々の手法が画像の同一性を匿名化できる一方で、顔の属性をより保存できることを実証した。
論文 参考訳(メタデータ) (2023-03-20T17:34:05Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Robust and Precise Facial Landmark Detection by Self-Calibrated Pose
Attention Network [73.56802915291917]
より堅牢で正確な顔のランドマーク検出を実現するための半教師付きフレームワークを提案する。
より効果的な顔形状制約をモデル化するために,境界対応ランドマーク強度(BALI)フィールドを提案する。
自己キャリブレーション・ポース・アテンション(SCPA)モデルは、中間的監督を強制する自己学習型目標関数を提供するように設計されている。
論文 参考訳(メタデータ) (2021-12-23T02:51:08Z) - Towards robustness under occlusion for face recognition [0.0]
本稿では,ResNetのバックボーンを用いた顔認識パイプラインの性能に及ぼすオクルージョンの影響を評価する。
入力画像に適用した8種類のオクルージョンマスクを設計した。
閉塞下でのロバスト性を高めるために,我々は2つのアプローチを踏襲した。
2つ目はCutmixで、長方形のパッチを使ってトレーニング画像とラベルを混ぜる正規化戦略である。
論文 参考訳(メタデータ) (2021-09-19T08:27:57Z) - Consensual Collaborative Training And Knowledge Distillation Based
Facial Expression Recognition Under Noisy Annotations [2.538209532048867]
本研究は,CCT(Consensual Collaborative Training)フレームワークと呼ばれる,ノイズラベルの存在下での効果的なトレーニング戦略を提案する。
CCTは3つのネットワークを共同で管理損失と一貫性損失の凸の組み合わせで訓練する。
FERDB (90.84%)、FERPlus (89.99%)、AffectNet (66%)のベンチマークで最先端のパフォーマンスが報告されている。
論文 参考訳(メタデータ) (2021-07-10T03:37:06Z) - Robust Self-Ensembling Network for Hyperspectral Image Classification [38.84831094095329]
この問題に対処するために,ロバストな自己認識ネットワーク(RSEN)を提案する。
rsenはベースネットワークとアンサンブルネットワークを含む2つのワークから成り立っている。
提案アルゴリズムは, 最先端手法と比較して, 競争性能を向上できることを示す。
論文 参考訳(メタデータ) (2021-04-08T13:33:14Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Semantic Neighborhood-Aware Deep Facial Expression Recognition [14.219890078312536]
意味的摂動を定式化し,訓練中に信頼できないサンプルを選択する新しい手法を提案する。
実験の結果,提案手法の有効性が示され,その結果が得られた。
論文 参考訳(メタデータ) (2020-04-27T11:48:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。