論文の概要: Facial Expression Recognition with Deep Learning
- arxiv url: http://arxiv.org/abs/2004.11823v1
- Date: Wed, 8 Apr 2020 03:12:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 09:21:59.123346
- Title: Facial Expression Recognition with Deep Learning
- Title(参考訳): 深層学習による表情認識
- Authors: Amil Khanzada, Charles Bai, Ferhat Turker Celepcikay
- Abstract要約: 顔表情認識のための複数の深層学習モデル(FER)を実装する。
私たちは、精度を最大化することだけでなく、結果を現実世界に適用することを目指しています。
fer2013テストセットにおける最先端の75.8%の精度を実証し、既存のすべての出版物を上回ります。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the most universal ways that people communicate is through facial
expressions. In this paper, we take a deep dive, implementing multiple deep
learning models for facial expression recognition (FER). Our goals are twofold:
we aim not only to maximize accuracy, but also to apply our results to the
real-world. By leveraging numerous techniques from recent research, we
demonstrate a state-of-the-art 75.8% accuracy on the FER2013 test set,
outperforming all existing publications. Additionally, we showcase a mobile web
app which runs our FER models on-device in real time.
- Abstract(参考訳): 人々がコミュニケーションする最も普遍的な方法の1つは、表情を通してである。
本稿では,表情認識のための複数の深層学習モデル(FER)を実装する。
目標は2つある: 精度を最大化するだけでなく、結果を現実世界に適用することを目指している。
最近の研究から多くの技術を活用することで、FER2013テストセットにおける最先端の75.8%の精度を実証し、既存のすべての出版物を上回ります。
さらに、デバイス上でFERモデルをリアルタイムに実行するモバイルWebアプリを紹介します。
関連論文リスト
- GiMeFive: Towards Interpretable Facial Emotion Classification [1.1468563069298348]
深層畳み込みニューラルネットワークは、顔の感情をうまく認識することが示されている。
本稿では,階層アクティベーションと勾配重み付きクラスマッピングを用いたGiMeFiveモデルを提案する。
実験結果から,本モデルでは従来の手法よりも精度が高いことがわかった。
論文 参考訳(メタデータ) (2024-02-24T00:37:37Z) - Effective Whole-body Pose Estimation with Two-stages Distillation [52.92064408970796]
全体ポーズ推定は、画像内の人体、手、顔、足のキーポイントをローカライズする。
textbfWhole-body textbfPose 推定器の2段階ポーズ textbfDistillation を提案し,その有効性と効率性について検討した。
論文 参考訳(メタデータ) (2023-07-29T03:49:28Z) - Exploring Large-scale Unlabeled Faces to Enhance Facial Expression
Recognition [12.677143408225167]
本研究では、ラベルのない顔データを用いて表現認識モデルを効果的に訓練する半教師付き学習フレームワークを提案する。
本手法では,顔認識データを完全に活用するために,信頼度を適応的に調整できる動的しきい値モジュールを用いる。
ABAW5 EXPRタスクでは,オフィシャル検証セットにおいて優れた結果を得た。
論文 参考訳(メタデータ) (2023-03-15T13:43:06Z) - CIAO! A Contrastive Adaptation Mechanism for Non-Universal Facial
Expression Recognition [80.07590100872548]
本稿では、顔エンコーダの最後の層に異なるデータセットの特定の感情特性を適応させるメカニズムであるContrastive Inhibitory Adaptati On(CIAO)を提案する。
CIAOは、非常にユニークな感情表現を持つ6つの異なるデータセットに対して、表情認識性能が改善されている。
論文 参考訳(メタデータ) (2022-08-10T15:46:05Z) - An Exploration of Self-Supervised Pretrained Representations for
End-to-End Speech Recognition [98.70304981174748]
本稿では,事前訓練された音声表現の一般応用,高度なエンドツーエンド自動音声認識(E2E-ASR)モデルに焦点をあてる。
いくつかの事前訓練された音声表現を選択し、E2E-ASRのための様々なオープンソースおよび公開コーパスの実験結果を示す。
論文 参考訳(メタデータ) (2021-10-09T15:06:09Z) - Recognizing Facial Expressions in the Wild using Multi-Architectural
Representations based Ensemble Learning with Distillation [0.0]
EmoXNetは、複雑な表情を学習するためのアンサンブル学習技術である。
EmoXNetLiteは、我々のアンサンブルモデルから効率的なディープニューラルネットワークへの知識伝達に有用な蒸留技術である。
論文 参考訳(メタデータ) (2021-06-30T15:22:24Z) - A Multi-resolution Approach to Expression Recognition in the Wild [9.118706387430883]
顔認識タスクを解決するためのマルチリゾリューション手法を提案する。
私たちは、しばしば異なる解像度で画像が取得されるという観察を直感的に根拠としています。
我々は、Affect-in-the-Wild 2データセットに基づいてトレーニングされたSqueeze-and-Excitationブロックを備えたResNetのようなアーキテクチャを使用する。
論文 参考訳(メタデータ) (2021-03-09T21:21:02Z) - The FaceChannel: A Fast & Furious Deep Neural Network for Facial
Expression Recognition [71.24825724518847]
顔の表情の自動認識(FER)の最先端モデルは、非常に深いニューラルネットワークに基づいており、訓練には効果的だがかなり高価である。
私たちは、一般的なディープニューラルネットワークよりもはるかに少ないパラメータを持つ軽量ニューラルネットワークであるFaceChannelを形式化します。
我々は、私たちのモデルがFERの現在の最先端技術に匹敵するパフォーマンスを達成する方法を実証する。
論文 参考訳(メタデータ) (2020-09-15T09:25:37Z) - Visual Imitation Made Easy [102.36509665008732]
本稿では,ロボットへのデータ転送を容易にしながら,データ収集プロセスを単純化する,模倣のための代替インターフェースを提案する。
我々は、データ収集装置やロボットのエンドエフェクターとして、市販のリーチ・グラブラー補助具を使用する。
我々は,非包括的プッシュと包括的積み重ねという2つの課題について実験的に評価した。
論文 参考訳(メタデータ) (2020-08-11T17:58:50Z) - Learning to Augment Expressions for Few-shot Fine-grained Facial
Expression Recognition [98.83578105374535]
顔表情データベースF2EDについて述べる。
顔の表情は119人から54人まで、200万枚以上の画像が含まれている。
実世界のシナリオでは,不均一なデータ分布やサンプルの欠如が一般的であるので,数発の表情学習の課題を評価する。
顔画像合成のための統合されたタスク駆動型フレームワークであるComposeal Generative Adversarial Network (Comp-GAN) 学習を提案する。
論文 参考訳(メタデータ) (2020-01-17T03:26:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。