Fugu-MT 論文翻訳(概要): Facial Expression Recognition with Deep Learning

論文の概要: Facial Expression Recognition with Deep Learning

arxiv url: http://arxiv.org/abs/2004.11823v1
Date: Wed, 8 Apr 2020 03:12:49 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-15 09:21:59.123346
Title: Facial Expression Recognition with Deep Learning
Title（参考訳）: 深層学習による表情認識
Authors: Amil Khanzada, Charles Bai, Ferhat Turker Celepcikay
Abstract要約: 顔表情認識のための複数の深層学習モデル(FER)を実装する。私たちは、精度を最大化することだけでなく、結果を現実世界に適用することを目指しています。 fer2013テストセットにおける最先端の75.8%の精度を実証し、既存のすべての出版物を上回ります。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: One of the most universal ways that people communicate is through facial expressions. In this paper, we take a deep dive, implementing multiple deep learning models for facial expression recognition (FER). Our goals are twofold: we aim not only to maximize accuracy, but also to apply our results to the real-world. By leveraging numerous techniques from recent research, we demonstrate a state-of-the-art 75.8% accuracy on the FER2013 test set, outperforming all existing publications. Additionally, we showcase a mobile web app which runs our FER models on-device in real time.
Abstract（参考訳）: 人々がコミュニケーションする最も普遍的な方法の1つは、表情を通してである。本稿では,表情認識のための複数の深層学習モデル(FER)を実装する。目標は2つある: 精度を最大化するだけでなく、結果を現実世界に適用することを目指している。最近の研究から多くの技術を活用することで、FER2013テストセットにおける最先端の75.8%の精度を実証し、既存のすべての出版物を上回ります。さらに、デバイス上でFERモデルをリアルタイムに実行するモバイルWebアプリを紹介します。

関連論文リスト

GiMeFive: Towards Interpretable Facial Emotion Classification [1.1468563069298348]
深層畳み込みニューラルネットワークは、顔の感情をうまく認識することが示されている。本稿では,階層アクティベーションと勾配重み付きクラスマッピングを用いたGiMeFiveモデルを提案する。実験結果から,本モデルでは従来の手法よりも精度が高いことがわかった。
論文参考訳（メタデータ） (2024-02-24T00:37:37Z)
Effective Whole-body Pose Estimation with Two-stages Distillation [52.92064408970796]
全体ポーズ推定は、画像内の人体、手、顔、足のキーポイントをローカライズする。 textbfWhole-body textbfPose 推定器の2段階ポーズ textbfDistillation を提案し,その有効性と効率性について検討した。
論文参考訳（メタデータ） (2023-07-29T03:49:28Z)
Exploring Large-scale Unlabeled Faces to Enhance Facial Expression Recognition [12.677143408225167]
本研究では、ラベルのない顔データを用いて表現認識モデルを効果的に訓練する半教師付き学習フレームワークを提案する。本手法では,顔認識データを完全に活用するために,信頼度を適応的に調整できる動的しきい値モジュールを用いる。 ABAW5 EXPRタスクでは,オフィシャル検証セットにおいて優れた結果を得た。
論文参考訳（メタデータ） (2023-03-15T13:43:06Z)
CIAO! A Contrastive Adaptation Mechanism for Non-Universal Facial Expression Recognition [80.07590100872548]
本稿では、顔エンコーダの最後の層に異なるデータセットの特定の感情特性を適応させるメカニズムであるContrastive Inhibitory Adaptati On(CIAO)を提案する。 CIAOは、非常にユニークな感情表現を持つ6つの異なるデータセットに対して、表情認識性能が改善されている。
論文参考訳（メタデータ） (2022-08-10T15:46:05Z)
Towards a General Deep Feature Extractor for Facial Expression Recognition [5.012963825796511]
本稿では,他の顔の感情認識タスクやデータセットに適用可能な,視覚的特徴抽出器を学習する,新たなディープラーニングベースのアプローチを提案する。 DeepFEVERは、AffectNetとGoogle Facial Expression Comparisonデータセットで最先端の結果を上回っている。
論文参考訳（メタデータ） (2022-01-19T18:42:23Z)
An Exploration of Self-Supervised Pretrained Representations for End-to-End Speech Recognition [98.70304981174748]
本稿では,事前訓練された音声表現の一般応用,高度なエンドツーエンド自動音声認識(E2E-ASR)モデルに焦点をあてる。いくつかの事前訓練された音声表現を選択し、E2E-ASRのための様々なオープンソースおよび公開コーパスの実験結果を示す。
論文参考訳（メタデータ） (2021-10-09T15:06:09Z)
Recognizing Facial Expressions in the Wild using Multi-Architectural Representations based Ensemble Learning with Distillation [0.0]
EmoXNetは、複雑な表情を学習するためのアンサンブル学習技術である。 EmoXNetLiteは、我々のアンサンブルモデルから効率的なディープニューラルネットワークへの知識伝達に有用な蒸留技術である。
論文参考訳（メタデータ） (2021-06-30T15:22:24Z)
A Multi-resolution Approach to Expression Recognition in the Wild [9.118706387430883]
顔認識タスクを解決するためのマルチリゾリューション手法を提案する。私たちは、しばしば異なる解像度で画像が取得されるという観察を直感的に根拠としています。我々は、Affect-in-the-Wild 2データセットに基づいてトレーニングされたSqueeze-and-Excitationブロックを備えたResNetのようなアーキテクチャを使用する。
論文参考訳（メタデータ） (2021-03-09T21:21:02Z)
The FaceChannel: A Fast & Furious Deep Neural Network for Facial Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文参考訳（メタデータ） (2020-09-15T09:25:37Z)
Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文参考訳（メタデータ） (2020-08-11T17:58:50Z)
Learning to Augment Expressions for Few-shot Fine-grained Facial Expression Recognition [98.83578105374535]
顔表情データベースF2EDについて述べる。顔の表情は119人から54人まで、200万枚以上の画像が含まれている。実世界のシナリオでは,不均一なデータ分布やサンプルの欠如が一般的であるので,数発の表情学習の課題を評価する。顔画像合成のための統合されたタスク駆動型フレームワークであるComposeal Generative Adversarial Network (Comp-GAN) 学習を提案する。
論文参考訳（メタデータ） (2020-01-17T03:26:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。