論文の概要: InFER: A Multi-Ethnic Indian Facial Expression Recognition Dataset
- arxiv url: http://arxiv.org/abs/2310.00287v1
- Date: Sat, 30 Sep 2023 07:36:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 05:19:39.905820
- Title: InFER: A Multi-Ethnic Indian Facial Expression Recognition Dataset
- Title(参考訳): InFER: マルチエスニックなインド顔表情認識データセット
- Authors: Syed Sameen Ahmad Rizvi, Preyansh Agrawal, Jagat Sesh Challa and
Pratik Narang
- Abstract要約: InFERは、10,200の画像と7つの基本的な表情の4,200のショートビデオからなる実世界の多民族インド顔表情認識データセットである。
このデータセットは、600人の被験者の表現を提示し、インターネットからクラウドソースされた6000枚の画像の自発的に実行された表現を提示している。
われわれの知る限りでは、InFERはインド亜大陸の非常に多様な民族から600人の被験者が撮影した最初の画像だ。
- 参考スコア(独自算出の注目度): 5.784550537553534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid advancement in deep learning over the past decade has transformed
Facial Expression Recognition (FER) systems, as newer methods have been
proposed that outperform the existing traditional handcrafted techniques.
However, such a supervised learning approach requires a sufficiently large
training dataset covering all the possible scenarios. And since most people
exhibit facial expressions based upon their age group, gender, and ethnicity, a
diverse facial expression dataset is needed. This becomes even more crucial
while developing a FER system for the Indian subcontinent, which comprises of a
diverse multi-ethnic population. In this work, we present InFER, a real-world
multi-ethnic Indian Facial Expression Recognition dataset consisting of 10,200
images and 4,200 short videos of seven basic facial expressions. The dataset
has posed expressions of 600 human subjects, and spontaneous/acted expressions
of 6000 images crowd-sourced from the internet. To the best of our knowledge
InFER is the first of its kind consisting of images from 600 subjects from very
diverse ethnicity of the Indian Subcontinent. We also present the experimental
results of baseline & deep FER methods on our dataset to substantiate its
usability in real-world practical applications.
- Abstract(参考訳): 過去10年間のディープラーニングの急速な進歩は、既存の手工芸技術を上回る新しい手法が提案され、顔表情認識(FER)システムに変化をもたらした。
しかし、このような教師付き学習アプローチでは、可能なすべてのシナリオをカバーする十分な大規模なトレーニングデータセットが必要です。
そして、ほとんどの人は年齢、性別、民族に基づく表情を示すので、多様な表情データセットが必要である。
これは、多民族の多様な集団からなるインド亜大陸のFERシステムを開発する際にさらに重要となる。
本研究では,7つの表情の10,200画像と4,200ショートビデオからなる実世界の多民族インド顔表情認識データセットであるInFERを提案する。
このデータセットは、600人の被験者の表現と、インターネットからクラウドソースされた6000枚の画像の自然発生/実行表現を提示している。
われわれの知る限りでは、InFERはインド亜大陸の非常に多様な民族から600人の被験者が撮影した最初の画像だ。
また,本データセット上でのベースラインおよびディープFER手法の実験結果について,実運用におけるユーザビリティを実証する。
関連論文リスト
- Learning Diversified Feature Representations for Facial Expression
Recognition in the Wild [97.14064057840089]
本稿では,CNN層が抽出した顔表情認識アーキテクチャの特徴を多様化する機構を提案する。
AffectNet,FER+,RAF-DBの3つの顔表情認識実験の結果,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-17T19:25:28Z) - CIAO! A Contrastive Adaptation Mechanism for Non-Universal Facial
Expression Recognition [80.07590100872548]
本稿では、顔エンコーダの最後の層に異なるデータセットの特定の感情特性を適応させるメカニズムであるContrastive Inhibitory Adaptati On(CIAO)を提案する。
CIAOは、非常にユニークな感情表現を持つ6つの異なるデータセットに対して、表情認識性能が改善されている。
論文 参考訳(メタデータ) (2022-08-10T15:46:05Z) - Multiface: A Dataset for Neural Face Rendering [108.44505415073579]
本研究では,新しいマルチビュー,高解像度のヒューマン・フェイス・データセットであるMultifaceを提案する。
顔のパフォーマンスの高解像度同期映像をキャプチャする大規模なマルチカメラ装置であるMugsyを紹介する。
Multifaceの目的は、学術コミュニティにおける高品質データへのアクセシビリティのギャップを埋め、VRテレプレゼンスの研究を可能にすることである。
論文 参考訳(メタデータ) (2022-07-22T17:55:39Z) - Towards a General Deep Feature Extractor for Facial Expression
Recognition [5.012963825796511]
本稿では,他の顔の感情認識タスクやデータセットに適用可能な,視覚的特徴抽出器を学習する,新たなディープラーニングベースのアプローチを提案する。
DeepFEVERは、AffectNetとGoogle Facial Expression Comparisonデータセットで最先端の結果を上回っている。
論文 参考訳(メタデータ) (2022-01-19T18:42:23Z) - Facial Expressions Recognition with Convolutional Neural Networks [0.0]
ニューラルネットワークを利用して表情認識システム(FER)を実装する。
我々は、追加のトレーニングデータを用いることなく、FER2013データセット上で、最先端のシングルネットワーク精度の70.10%を実証する。
論文 参考訳(メタデータ) (2021-07-19T06:41:00Z) - A Multi-resolution Approach to Expression Recognition in the Wild [9.118706387430883]
顔認識タスクを解決するためのマルチリゾリューション手法を提案する。
私たちは、しばしば異なる解像度で画像が取得されるという観察を直感的に根拠としています。
我々は、Affect-in-the-Wild 2データセットに基づいてトレーニングされたSqueeze-and-Excitationブロックを備えたResNetのようなアーキテクチャを使用する。
論文 参考訳(メタデータ) (2021-03-09T21:21:02Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z) - Learning to Augment Expressions for Few-shot Fine-grained Facial
Expression Recognition [98.83578105374535]
顔表情データベースF2EDについて述べる。
顔の表情は119人から54人まで、200万枚以上の画像が含まれている。
実世界のシナリオでは,不均一なデータ分布やサンプルの欠如が一般的であるので,数発の表情学習の課題を評価する。
顔画像合成のための統合されたタスク駆動型フレームワークであるComposeal Generative Adversarial Network (Comp-GAN) 学習を提案する。
論文 参考訳(メタデータ) (2020-01-17T03:26:32Z) - Investigating the Impact of Inclusion in Face Recognition Training Data
on Individual Face Identification [93.5538147928669]
最新のオープンソースの顔認識システムであるArcFaceを、100万枚以上の散らばった画像を用いた大規模な顔識別実験で監査する。
モデルのトレーニングデータには79.71%、存在しない人には75.73%のランク1顔認証精度がある。
論文 参考訳(メタデータ) (2020-01-09T15:50:28Z) - Facial Emotions Recognition using Convolutional Neural Net [0.6091702876917281]
本稿では,畳み込みニューラルネットワーク(CNN)を用いた顔認識システムを提案する。
深層学習モデルはデータから学習するため,提案システムでは各画像を様々な事前処理ステップで処理し,予測精度を向上する。
組み合わせたデータセットを用いて,最大78.1パーセントの精度を達成した。
論文 参考訳(メタデータ) (2020-01-06T09:43:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。