論文の概要: Spatial and Temporal Networks for Facial Expression Recognition in the
Wild Videos
- arxiv url: http://arxiv.org/abs/2107.05160v1
- Date: Mon, 12 Jul 2021 01:41:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-14 00:16:50.989605
- Title: Spatial and Temporal Networks for Facial Expression Recognition in the
Wild Videos
- Title(参考訳): 野生ビデオにおける表情認識のための時空間ネットワーク
- Authors: Shuyi Mao, Xinqi Fan, Xiaojiang Peng
- Abstract要約: 本稿では,ABAW(Affective Behavior Analysis in-the-Wild)コンペティション2021の7つの基本的表現分類法について述べる。
我々のアンサンブルモデルではF1は0.4133、精度は0.6216、最終的な測定値は0.4821であった。
- 参考スコア(独自算出の注目度): 14.760435737320744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The paper describes our proposed methodology for the seven basic expression
classification track of Affective Behavior Analysis in-the-wild (ABAW)
Competition 2021. In this task, facial expression recognition (FER) methods aim
to classify the correct expression category from a diverse background, but
there are several challenges. First, to adapt the model to in-the-wild
scenarios, we use the knowledge from pre-trained large-scale face recognition
data. Second, we propose an ensemble model with a convolution neural network
(CNN), a CNN-recurrent neural network (CNN-RNN), and a CNN-Transformer
(CNN-Transformer), to incorporate both spatial and temporal information. Our
ensemble model achieved F1 as 0.4133, accuracy as 0.6216 and final metric as
0.4821 on the validation set.
- Abstract(参考訳): 本稿では,ABAW(Affective Behavior Analysis in-the-Wild)コンペティション2021の7つの基本表現分類法について述べる。
本課題では,顔の表情認識(FER)法は,様々な背景から正しい表情カテゴリーを分類することを目的としているが,いくつかの課題がある。
まず,事前学習した大規模顔認証データから得られた知識を用いて,そのモデルを適用する。
次に、畳み込みニューラルネットワーク(CNN)、CNN-RNN(CNN-RNN)、CNN-Transformer(CNN-Transformer)を用いたアンサンブルモデルを提案する。
我々のアンサンブルモデルは、f1 を 0.4133、精度を 0.6216、最終計量を 0.4821 と検証した。
関連論文リスト
- Alleviating Catastrophic Forgetting in Facial Expression Recognition with Emotion-Centered Models [49.3179290313959]
感情中心型生成的リプレイ (ECgr) は, 生成的対向ネットワークから合成画像を統合することで, この課題に対処する。
ECgrは、生成された画像の忠実性を保証するために品質保証アルゴリズムを組み込んでいる。
4つの多様な表情データセットに対する実験結果から,擬似リハーサル法により生成されたイメージを組み込むことで,ターゲットとするデータセットとソースデータセットのトレーニングが促進されることが示された。
論文 参考訳(メタデータ) (2024-04-18T15:28:34Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - Text Classification in Memristor-based Spiking Neural Networks [0.0]
IMDB映画レビューデータセットにおける感情分析タスクを実演するために,仮想記憶器アレイを用いたシミュレーションフレームワークを開発した。
トレーニング済みのANNをmmristorベースのSNNに変換し,84.86%をmemristorベースのSNNを直接トレーニングすることで,85.88%の分類精度を実現する。
また, スパイクトレイン長, リードノイズ, および重み更新停止条件などの大域的パラメータが, どちらのアプローチにおいてもニューラルネットワークに与える影響についても検討した。
論文 参考訳(メタデータ) (2022-07-27T18:08:31Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - Facial expression and attributes recognition based on multi-task
learning of lightweight neural networks [9.162936410696409]
顔の識別と顔の属性の分類のための軽量畳み込みニューラルネットワークのマルチタスクトレーニングを検討する。
顔の表情を予測するためには,これらのネットワークを微調整する必要がある。
MobileNet、EfficientNet、RexNetアーキテクチャに基づくいくつかのモデルが提示される。
論文 参考訳(メタデータ) (2021-03-31T14:21:04Z) - Video-based Facial Expression Recognition using Graph Convolutional
Networks [57.980827038988735]
我々は、ビデオベースの表情認識のための共通のCNN-RNNモデルに、GCN(Graph Convolutional Network)層を導入する。
我々は、CK+、Oulu-CASIA、MMIの3つの広く使われているデータセットと、AFEW8.0の挑戦的なワイルドデータセットについて、本手法の評価を行った。
論文 参考訳(メタデータ) (2020-10-26T07:31:51Z) - Deep Convolutional Neural Network Based Facial Expression Recognition in
the Wild [0.0]
我々は、提案した深部畳み込みニューラルネットワーク(CNN)モデルを用いて、与えられたデータセット上で自動表情認識(AFER)を行う。
提案モデルの精度は50.77%,F1スコアは29.16%である。
論文 参考訳(メタデータ) (2020-10-03T08:17:00Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Deep Learning based, end-to-end metaphor detection in Greek language
with Recurrent and Convolutional Neural Networks [0.0]
本稿では,ギリシャ語におけるメタファ検出のための,エンドツーエンドのDeep Learningベースモデルを多数提示し,ベンチマークする。
畳み込みニューラルネットワークとリカレントニューラルネットワークと表現学習を組み合わせることで,ギリシャ語のメタファ検出問題に対処する。
論文 参考訳(メタデータ) (2020-07-23T12:02:40Z) - Pre-Trained Models for Heterogeneous Information Networks [57.78194356302626]
異種情報ネットワークの特徴を捉えるための自己教師付き事前学習・微調整フレームワークPF-HINを提案する。
PF-HINは4つのデータセットにおいて、各タスクにおける最先端の代替よりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2020-07-07T03:36:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。