論文の概要: Enhancing Ambiguous Dynamic Facial Expression Recognition with Soft Label-based Data Augmentation
- arxiv url: http://arxiv.org/abs/2506.20867v1
- Date: Wed, 25 Jun 2025 22:36:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.905316
- Title: Enhancing Ambiguous Dynamic Facial Expression Recognition with Soft Label-based Data Augmentation
- Title(参考訳): ソフトラベルに基づくデータ拡張による曖昧な動的顔表情認識の実現
- Authors: Ryosuke Kawamura, Hideaki Hayashi, Shunsuke Otake, Noriko Takemura, Hajime Nagahara,
- Abstract要約: あいまいな表情データに対するDFER性能の向上を目的としたMIDASを提案する。
MIDASは、一対のビデオフレームとその対応する感情クラスラベルを凸的に組み合わせてトレーニングデータを強化する。
その結果,MIDASでトレーニングしたモデルは,従来のデータセットでトレーニングした最先端の手法と比較して,優れた性能が得られることがわかった。
- 参考スコア(独自算出の注目度): 11.08736594484412
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic facial expression recognition (DFER) is a task that estimates emotions from facial expression video sequences. For practical applications, accurately recognizing ambiguous facial expressions -- frequently encountered in in-the-wild data -- is essential. In this study, we propose MIDAS, a data augmentation method designed to enhance DFER performance for ambiguous facial expression data using soft labels representing probabilities of multiple emotion classes. MIDAS augments training data by convexly combining pairs of video frames and their corresponding emotion class labels. This approach extends mixup to soft-labeled video data, offering a simple yet highly effective method for handling ambiguity in DFER. To evaluate MIDAS, we conducted experiments on both the DFEW dataset and FERV39k-Plus, a newly constructed dataset that assigns soft labels to an existing DFER dataset. The results demonstrate that models trained with MIDAS-augmented data achieve superior performance compared to the state-of-the-art method trained on the original dataset.
- Abstract(参考訳): 動的表情認識(DFER)は、表情の映像シーケンスから感情を推定するタスクである。
現実的な応用においては、不明瞭な表情を正確に認識することが不可欠である。
本研究では,複数の感情クラスの確率を表すソフトラベルを用いて,不明瞭な表情データに対するDFER性能の向上を目的としたデータ拡張手法MIDASを提案する。
MIDASは、一対のビデオフレームと対応する感情クラスラベルを凸的に組み合わせてトレーニングデータを強化する。
このアプローチは、ミックスアップをソフトラベル付きビデオデータに拡張し、DFERのあいまいさを扱うためのシンプルで高効率な方法を提供する。
MIDASを評価するために,既存のDFERデータセットにソフトラベルを割り当てる新たに構築したデータセットであるDFEWデータセットとFERV39k-Plusについて実験を行った。
その結果,MIDASを付加したデータを用いてトレーニングしたモデルは,従来のデータセットでトレーニングした最先端の手法に比べて優れた性能を示した。
関連論文リスト
- MIDAS: Mixing Ambiguous Data with Soft Labels for Dynamic Facial Expression Recognition [11.89503569570198]
動的表情認識(DFER)のためのデータ拡張手法MIDASを提案する。
MIDASでは、ビデオフレームの対とその対応する感情クラスラベルを凸的に組み合わせてトレーニングデータを拡張する。
その結果、MIDASによって強化されたデータに基づいてトレーニングされたモデルは、元のデータセットでトレーニングされた既存の最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2025-02-28T21:39:19Z) - AffectNet+: A Database for Enhancing Facial Expression Recognition with Soft-Labels [2.644902054473556]
画像に複数の感情をラベル付けするラベル付け手法により、FERデータセットを作成するための新しい手法を提案する。
提案手法の利点は, よりスムーズな決定境界の発見, マルチラベル化の実現, バイアスと不均衡データの緩和などにある。
AffectNetをベースとして,次世代の表情データセットであるAffectNet+を紹介する。
論文 参考訳(メタデータ) (2024-10-29T19:57:10Z) - Static for Dynamic: Towards a Deeper Understanding of Dynamic Facial Expressions Using Static Expression Data [83.48170683672427]
本稿では,DFERの補完リソースとしてSFERデータを統合した統合型デュアルモーダル学習フレームワークを提案する。
S4Dは、共有トランスフォーマー(ViT)エンコーダデコーダアーキテクチャを用いて、顔画像とビデオに対して、デュアルモーダルな自己教師付き事前トレーニングを採用する。
実験により、S4DはDFERをより深く理解し、新しい最先端のパフォーマンスを設定できることが示された。
論文 参考訳(メタデータ) (2024-09-10T01:57:57Z) - From Static to Dynamic: Adapting Landmark-Aware Image Models for Facial Expression Recognition in Videos [88.08209394979178]
野生における動的表情認識(DFER)は、データ制限によって依然として妨げられている。
抽出された顔のランドマーク認識機能に暗黙的に符号化された既存のSFER知識と動的情報を活用する新しい静的・動的モデル(S2D)を提案する。
論文 参考訳(メタデータ) (2023-12-09T03:16:09Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。