Fugu-MT 論文翻訳(概要): Facial Expression Recognition using Squeeze and Excitation-powered Swin Transformers

論文の概要: Facial Expression Recognition using Squeeze and Excitation-powered Swin Transformers

arxiv url: http://arxiv.org/abs/2301.10906v7
Date: Sat, 29 Apr 2023 01:02:43 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-03 17:26:41.433930
Title: Facial Expression Recognition using Squeeze and Excitation-powered Swin Transformers
Title（参考訳）: スクイーズと励磁によるスウィントランスを用いた表情認識
Authors: Arpita Vats, Aman Chadha
Abstract要約: 本研究では,Swin Vision Transformers (SwinT) とSwin Vision Transformers (SE) を用いて,視覚タスクに対処するフレームワークを提案する。我々の焦点は、最小限のデータを使って顔の感情を認識できるSwinTアーキテクチャに基づく効率的なFERモデルを作ることであった。我々は、ハイブリッドデータセットでモデルをトレーニングし、そのパフォーマンスをAffectNetデータセットで評価し、F1スコア0.5420を達成しました。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/publicdomain/zero/1.0/
Abstract: The ability to recognize and interpret facial emotions is a critical component of human communication, as it allows individuals to understand and respond to emotions conveyed through facial expressions and vocal tones. The recognition of facial emotions is a complex cognitive process that involves the integration of visual and auditory information, as well as prior knowledge and social cues. It plays a crucial role in social interaction, affective processing, and empathy, and is an important aspect of many real-world applications, including human-computer interaction, virtual assistants, and mental health diagnosis and treatment. The development of accurate and efficient models for facial emotion recognition is therefore of great importance and has the potential to have a significant impact on various fields of study.The field of Facial Emotion Recognition (FER) is of great significance in the areas of computer vision and artificial intelligence, with vast commercial and academic potential in fields such as security, advertising, and entertainment. We propose a FER framework that employs Swin Vision Transformers (SwinT) and squeeze and excitation block (SE) to address vision tasks. The approach uses a transformer model with an attention mechanism, SE, and SAM to improve the efficiency of the model, as transformers often require a large amount of data. Our focus was to create an efficient FER model based on SwinT architecture that can recognize facial emotions using minimal data. We trained our model on a hybrid dataset and evaluated its performance on the AffectNet dataset, achieving an F1-score of 0.5420, which surpassed the winner of the Affective Behavior Analysis in the Wild (ABAW) Competition held at the European Conference on Computer Vision (ECCV) 2022~\cite{Kollias}.
Abstract（参考訳）: 顔の感情を認識して解釈する能力は、表情や発声音を通じて伝達される感情を理解し、応答することができるため、人間のコミュニケーションの重要な要素である。顔の感情の認識は、視覚と聴覚の情報の統合や、事前の知識や社会的手がかりを含む複雑な認知過程である。社会的相互作用、情緒的処理、共感において重要な役割を担い、人間とコンピュータの相互作用、仮想アシスタント、メンタルヘルス診断と治療を含む多くの現実世界の応用において重要な側面である。顔の感情認識のための正確かつ効率的なモデルの開発は、様々な研究分野に大きな影響を与える可能性があり、コンピュータビジョンや人工知能の分野において、顔の感情認識(FER)の分野は大きな意味を持ち、セキュリティ、広告、エンターテイメントといった分野において、商業的および学術的な可能性を持っている。本研究では,Swin Vision Transformers (SwinT) とSwin Vision Transformers (SE) を併用したFERフレームワークを提案する。このアプローチでは、アテンション機構を備えたトランスフォーマーモデル、SE、SAMを使用して、トランスフォーマーが大量のデータを必要とする場合が多いため、モデルの効率を改善する。我々の焦点は、最小限のデータを使って顔の感情を認識できるSwinTアーキテクチャに基づく効率的なFERモデルを作ることであった。我々はハイブリッドデータセットでモデルをトレーニングし,AffectNetデータセット上での性能評価を行い,欧州コンピュータビジョン会議(ECCV)2022~\cite{Kollias}で開催されるABAWコンペティションの優勝者を上回ったF1スコア0.5420を達成した。

関連論文リスト

CAST-Phys: Contactless Affective States Through Physiological signals Database [74.28082880875368]
感情的なマルチモーダルデータセットの欠如は、正確な感情認識システムを開発する上で、依然として大きなボトルネックとなっている。遠隔の生理的感情認識が可能な新しい高品質なデータセットであるCAST-Physを提示する。本分析では,表情だけでは十分な感情情報が得られない現実的なシナリオにおいて,生理的信号が重要な役割を担っていることを強調した。
論文参考訳（メタデータ） (2025-07-08T15:20:24Z)
Modelling Emotions in Face-to-Face Setting: The Interplay of Eye-Tracking, Personality, and Temporal Dynamics [1.4645774851707578]
本研究では、視線追跡データ、時間的ダイナミクス、性格特性を統合することで、知覚と知覚の両方の感情の検出を大幅に向上させる方法について述べる。本研究は,将来の情緒コンピューティングと人間エージェントシステムの設計を示唆するものである。
論文参考訳（メタデータ） (2025-03-18T13:15:32Z)
Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors [63.194053817609024]
視覚行動は、視覚行動支援型マルチモーダル感情認識データセットを作成するための重要な感情的手がかりとなる。 EMERデータセットに感情認識(ER)と表情認識(FER)の両方のアノテーションを初めて提供する。具体的には、ERとFERの両方のパフォーマンスを同時に向上する新しいEMERTアーキテクチャを設計する。
論文参考訳（メタデータ） (2024-11-08T04:53:55Z)
Emotion Detection through Body Gesture and Face [0.0]
このプロジェクトは、非顔の手がかり、特に手、身体のジェスチャー、ジェスチャーに焦点を当てることによる感情認識の課題に対処する。従来の感情認識システムは、主に表情分析に依存しており、ボディランゲージを通して伝達される豊かな感情情報を無視することが多い。このプロジェクトの目的は、マシンが人間の感情をより包括的でニュアンスな方法で解釈し、反応する能力を高めることで、感情コンピューティングの分野に貢献することにある。
論文参考訳（メタデータ） (2024-07-13T15:15:50Z)
Maia: A Real-time Non-Verbal Chat for Human-AI Interaction [10.580858171606167]
我々はテキストベースのヒューマン-AIインタラクションの代替案を提案する。非言語的な視覚コミュニケーションを活用することで、表情、頭と体の動きを通じて、エンゲージメントを高めることを目指している。我々のアプローチは芸術に特化せず、様々な絵画、アニメーション、アバターに適応することができる。
論文参考訳（メタデータ） (2024-02-09T13:07:22Z)
I am Only Happy When There is Light: The Impact of Environmental Changes on Affective Facial Expressions Recognition [65.69256728493015]
本研究では,異なる画像条件が人間の表情からの覚醒の認識に与える影響について検討した。以上の結果から,人間の感情状態の解釈が肯定的,否定的に大きく異なることが示唆された。
論文参考訳（メタデータ） (2022-10-28T16:28:26Z)
Data-driven emotional body language generation for social robotics [58.88028813371423]
社会ロボティクスでは、人間型ロボットに感情の身体的表現を生成する能力を与えることで、人間とロボットの相互作用とコラボレーションを改善することができる。我々は、手作業で設計されたいくつかの身体表現から学習する深層学習データ駆動フレームワークを実装した。評価実験の結果, 生成した表現の人間同型とアニマシーは手作りの表現と異なる認識が得られなかった。
論文参考訳（メタデータ） (2022-05-02T09:21:39Z)
Multi-Cue Adaptive Emotion Recognition Network [4.570705738465714]
適応型マルチキューに基づく感情認識のための新しい深層学習手法を提案する。提案手法とCAER-Sデータセットの最先端手法を比較した。
論文参考訳（メタデータ） (2021-11-03T15:08:55Z)
Domain Adaptation for Facial Expression Classifier via Domain Discrimination and Gradient Reversal [0.0]
表情認識(FER)の分野での研究は、過去10年間に増加傾向にある。本稿では、FERタスクのための新しいアーキテクチャを提案し、ドメイン識別損失正規化が学習プロセスに与える影響について検討する。
論文参考訳（メタデータ） (2021-06-02T20:58:24Z)
I Only Have Eyes for You: The Impact of Masks On Convolutional-Based Facial Expression Recognition [78.07239208222599]
今回提案したFaceChannelがマスクを持つ人からの表情認識にどのように適応するかを評価します。また、制約された社会的相互作用シナリオにおける顔の特徴の変化を学習し、組み合わせるためのFaceChannelの本質的な能力を示すために、特定の機能レベルの可視化も行います。
論文参考訳（メタデータ） (2021-04-16T20:03:30Z)
Learning Emotional-Blinded Face Representations [77.7653702071127]
感情反応に関連する表情に盲目な2つの顔表現を提案する。この作業は、個人データ保護に関する新たな国際規則によって動機付けられている。
論文参考訳（メタデータ） (2020-09-18T09:24:10Z)
Introducing Representations of Facial Affect in Automated Multimodal Deception Detection [18.16596562087374]
自動偽造検知システムは、社会の健康、正義、安全を高めることができる。本稿では,顔認識における顔の感情の次元表現力の新たな解析法を提案する。私たちは、現実世界の、高額な法廷状況で、真実または偽装的にコミュニケーションする人々のビデオデータセットを使用しました。
論文参考訳（メタデータ） (2020-08-31T05:12:57Z)
Continuous Emotion Recognition via Deep Convolutional Autoencoder and Support Vector Regressor [70.2226417364135]
マシンはユーザの感情状態を高い精度で認識できることが不可欠である。ディープニューラルネットワークは感情を認識する上で大きな成功を収めている。表情認識に基づく連続的感情認識のための新しいモデルを提案する。
論文参考訳（メタデータ） (2020-01-31T17:47:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。