論文の概要: Semi-Supervised Facial Expression Recognition based on Dynamic Threshold and Negative Learning
- arxiv url: http://arxiv.org/abs/2601.05556v1
- Date: Fri, 09 Jan 2026 06:13:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-12 17:41:49.86247
- Title: Semi-Supervised Facial Expression Recognition based on Dynamic Threshold and Negative Learning
- Title(参考訳): 動的閾値と負学習に基づく半教師付き顔表情認識
- Authors: Zhongpeng Cai, Jun Yu, Wei Xu, Tianyu Liu, Jianqing Sun, Jiaen Liang,
- Abstract要約: DTA(Dynamic Threshold Adjustment)とSNL(Selective Negative Learning)に基づく半教師付き表情認識アルゴリズムを提案する。
我々はRAF-DBとAffectNetデータセットで最先端のパフォーマンスを達成した。
- 参考スコア(独自算出の注目度): 28.398253836458025
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial expression recognition is a key task in human-computer interaction and affective computing. However, acquiring a large amount of labeled facial expression data is often costly. Therefore, it is particularly important to design a semi-supervised facial expression recognition algorithm that makes full use of both labeled and unlabeled data. In this paper, we propose a semi-supervised facial expression recognition algorithm based on Dynamic Threshold Adjustment (DTA) and Selective Negative Learning (SNL). Initially, we designed strategies for local attention enhancement and random dropout of feature maps during feature extraction, which strengthen the representation of local features while ensuring the model does not overfit to any specific local area. Furthermore, this study introduces a dynamic thresholding method to adapt to the requirements of the semi-supervised learning framework for facial expression recognition tasks, and through a selective negative learning strategy, it fully utilizes unlabeled samples with low confidence by mining useful expression information from complementary labels, achieving impressive results. We have achieved state-of-the-art performance on the RAF-DB and AffectNet datasets. Our method surpasses fully supervised methods even without using the entire dataset, which proves the effectiveness of our approach.
- Abstract(参考訳): 表情認識は、人間とコンピュータの相互作用と感情的コンピューティングにおいて重要なタスクである。
しかし、大量のラベル付き表情データを取得することは、しばしばコストがかかる。
したがって,ラベル付きデータとラベルなしデータの両方をフル活用する半教師付き表情認識アルゴリズムを設計することが特に重要である。
本稿では,動的閾値調整(DTA)と選択負学習(SNL)に基づく半教師付き表情認識アルゴリズムを提案する。
当初我々は,特徴抽出における特徴マップの局所的注意力向上とランダムなドロップアウトのための戦略を設計し,そのモデルが特定の局所領域に過度に適合しないことを保証しながら,局所的特徴の表現を強化する。
さらに,表情認識タスクにおける半教師付き学習フレームワークの要件に適応する動的しきい値設定手法を導入し,選択的負の学習戦略により,相補ラベルから有用な表現情報をマイニングし,信頼性の低いラベル付きサンプルを十分に活用し,印象的な結果を得る。
我々はRAF-DBとAffectNetデータセットで最先端のパフォーマンスを達成した。
提案手法は,全データセットを使わずに完全に教師付き手法を超越し,提案手法の有効性を実証する。
関連論文リスト
- Exploring Facial Expression Recognition through Semi-Supervised Pretraining and Temporal Modeling [8.809586885539002]
本稿では,第6回ABAW(Affective Behavior Analysis in-the-Wild)コンペティションについて述べる。
第6回ABAWコンペティションでは,オフィシャル検証セットにおいて優れた結果を得た。
論文 参考訳(メタデータ) (2024-03-18T16:36:54Z) - Exploring Large-scale Unlabeled Faces to Enhance Facial Expression
Recognition [12.677143408225167]
本研究では、ラベルのない顔データを用いて表現認識モデルを効果的に訓練する半教師付き学習フレームワークを提案する。
本手法では,顔認識データを完全に活用するために,信頼度を適応的に調整できる動的しきい値モジュールを用いる。
ABAW5 EXPRタスクでは,オフィシャル検証セットにおいて優れた結果を得た。
論文 参考訳(メタデータ) (2023-03-15T13:43:06Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Improved Speech Emotion Recognition using Transfer Learning and
Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。
SERの主な課題の1つは、データの不足である。
本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文 参考訳(メタデータ) (2021-08-05T10:39:39Z) - FP-Age: Leveraging Face Parsing Attention for Facial Age Estimation in
the Wild [50.8865921538953]
年齢推定に顔のセマンティクスを明示的に組み込む手法を提案する。
我々は,顔解析に基づくネットワークを設計し,異なるスケールで意味情報を学習する。
提案手法は,既存の年齢推定手法を常に上回っていることを示す。
論文 参考訳(メタデータ) (2021-06-21T14:31:32Z) - Progressive Spatio-Temporal Bilinear Network with Monte Carlo Dropout
for Landmark-based Facial Expression Recognition with Uncertainty Estimation [93.73198973454944]
提案手法の性能は, 広く使用されている3つのデータセットで評価される。
ビデオベースの最先端の手法に匹敵するが、複雑さははるかに少ない。
論文 参考訳(メタデータ) (2021-06-08T13:40:30Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。