論文の概要: Benchmarking Deep Facial Expression Recognition: An Extensive Protocol
with Balanced Dataset in the Wild
- arxiv url: http://arxiv.org/abs/2311.02910v1
- Date: Mon, 6 Nov 2023 06:48:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 15:14:06.864005
- Title: Benchmarking Deep Facial Expression Recognition: An Extensive Protocol
with Balanced Dataset in the Wild
- Title(参考訳): 深い顔の表情認識のベンチマーク: 野生におけるバランスの取れたデータセットを持つ拡張プロトコル
- Authors: Gianmarco Ipinze Tutuianu, Yang Liu, Ari Alam\"aki, Janne Kauttonen
- Abstract要約: 顔表情認識(FER)は、人間とコンピュータの相互作用において重要な部分である。
我々は,クロスドメイン検証のための新しい顔表情データセットを収集した。
ネットワークアーキテクチャを分類し、実際のシナリオにディープFERメソッドをデプロイする際の推奨事項をまとめた。
- 参考スコア(独自算出の注目度): 5.044138778500218
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Facial expression recognition (FER) is a crucial part of human-computer
interaction. Existing FER methods achieve high accuracy and generalization
based on different open-source deep models and training approaches. However,
the performance of these methods is not always good when encountering practical
settings, which are seldom explored. In this paper, we collected a new
in-the-wild facial expression dataset for cross-domain validation. Twenty-three
commonly used network architectures were implemented and evaluated following a
uniform protocol. Moreover, various setups, in terms of input resolutions,
class balance management, and pre-trained strategies, were verified to show the
corresponding performance contribution. Based on extensive experiments on three
large-scale FER datasets and our practical cross-validation, we ranked network
architectures and summarized a set of recommendations on deploying deep FER
methods in real scenarios. In addition, potential ethical rules, privacy
issues, and regulations were discussed in practical FER applications such as
marketing, education, and entertainment business.
- Abstract(参考訳): 表情認識(FER)は人間とコンピュータの相互作用において重要な部分である。
既存のFER法は、異なるオープンソースのディープモデルとトレーニングアプローチに基づいて高精度で一般化されている。
しかし、これらの手法の性能は、ほとんど探索されない実践的な設定に遭遇するときに必ずしも良いとは限らない。
本稿では,クロスドメイン検証のための新しい顔表情データセットを収集した。
23の一般的なネットワークアーキテクチャを実装し,一様プロトコルに従って評価した。
さらに, 入力解像度, クラスバランス管理, 事前学習戦略の観点から, 各種設定を検証し, 対応性能の寄与を示す。
3つの大規模FERデータセットと実用的なクロスバリデーションに関する広範な実験に基づいて、ネットワークアーキテクチャを分類し、実際のシナリオにディープFERメソッドをデプロイする際の推奨事項をまとめた。
加えて、潜在的な倫理的ルール、プライバシー問題、規制は、マーケティング、教育、エンタテインメントビジネスといった実用的なferアプリケーションで議論された。
関連論文リスト
- Semantics-Oriented Multitask Learning for DeepFake Detection: A Joint Embedding Approach [77.65459419417533]
本稿ではセマンティクス指向のDeepFake検出タスクをサポートするための自動データセット拡張手法を提案する。
また,顔画像とそれに対応するラベルを併用して予測を行う。
提案手法は,DeepFake検出の一般化性を向上し,人間の理解可能な説明を提供することで,ある程度のモデル解釈を行う。
論文 参考訳(メタデータ) (2024-08-29T07:11:50Z) - Towards Human-Like Machine Comprehension: Few-Shot Relational Learning in Visually-Rich Documents [16.78371134590167]
Visually-Rich Documents (VRDs) ではキーバリュー関係が一般的である
これらの非テクスト的手がかりは、人間の理解とそのような関係三重項の獲得を大幅に促進する重要な指標となる。
本研究は,VRDにおけるキー-値関係三重項の抽出を目的とした,数発のリレーショナル学習に焦点を当てた。
論文 参考訳(メタデータ) (2024-03-23T08:40:35Z) - Pre-trained Recommender Systems: A Causal Debiasing Perspective [19.712997823535066]
本研究では,異なるドメインから抽出した汎用ユーザ・イテムインタラクションデータをトレーニングすることで,ユニバーサルインタラクションパターンをキャプチャする汎用レコメンデータを開発する。
実験により,提案モデルにより,ゼロショットと少数ショットの学習環境での推薦性能が大幅に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2023-10-30T03:37:32Z) - NormAUG: Normalization-guided Augmentation for Domain Generalization [60.159546669021346]
ディープラーニングのためのNormAUG(Normalization-guided Augmentation)と呼ばれるシンプルで効果的な手法を提案する。
本手法は特徴レベルで多様な情報を導入し,主経路の一般化を改善する。
テスト段階では、アンサンブル戦略を利用して、モデルの補助経路からの予測を組み合わせ、さらなる性能向上を図る。
論文 参考訳(メタデータ) (2023-07-25T13:35:45Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - On the Importance of Exploration for Generalization in Reinforcement
Learning [89.63074327328765]
本研究では,不確実性の高い状態の探索を支援する方法であるEDE: Exploration via Distributional Ensembleを提案する。
当社のアルゴリズムは,ProcgenとCrafterの両面で最先端を実現するための,最初のバリューベースアプローチである。
論文 参考訳(メタデータ) (2023-06-08T18:07:02Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Domain Generalization for Activity Recognition via Adaptive Feature
Fusion [9.458837222079612]
本稿では,emphAdaptive Feature Fusion for Activity Recognition (AFFAR)を提案する。
AFFARは、モデルの一般化性能を改善するために、ドメイン不変表現とドメイン固有表現を融合することを学ぶ。
AFARを実際の応用、すなわち子どもの注意欠陥性高活動障害(ADHD)の診断に適用する。
論文 参考訳(メタデータ) (2022-07-21T02:14:09Z) - One-Class Knowledge Distillation for Face Presentation Attack Detection [53.30584138746973]
本稿では,一級ドメイン適応による対面PADのクロスドメイン性能向上のための教師学生フレームワークを提案する。
学生ネットワークは、教師ネットワークを模倣し、ターゲットドメインの真の顔サンプルの類似した表現を学ぶために訓練される。
テストフェーズでは、教師と学生ネットワークの表現の類似度スコアを用いて、真の攻撃と区別する。
論文 参考訳(メタデータ) (2022-05-08T06:20:59Z) - Deep Multi-Facial Patches Aggregation Network For Facial Expression
Recognition [5.735035463793008]
深層多面的パッチアグリゲーションネットワークに基づく顔表情認識(FER)のアプローチを提案する。
ディープ機能は、ディープサブネットワークを使用して顔のパッチから学習され、表現分類のために1つのディープアーキテクチャに集約される。
論文 参考訳(メタデータ) (2020-02-20T17:57:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。