Fugu-MT 論文翻訳(概要): Improving Facial Emotion Recognition through Dataset Merging and Balanced Training Strategies

論文の概要: Improving Facial Emotion Recognition through Dataset Merging and Balanced Training Strategies

arxiv url: http://arxiv.org/abs/2604.20307v1
Date: Wed, 22 Apr 2026 08:08:59 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-23 15:36:11.031818
Title: Improving Facial Emotion Recognition through Dataset Merging and Balanced Training Strategies
Title（参考訳）: データセット統合とバランスの取れたトレーニング戦略による顔の感情認識の改善
Authors: Serap Kırbız,
Abstract要約: 深層畳み込みネットワークに基づく表情自動認識のためのディープラーニングフレームワークを提案する。提案手法は,7つの基本的な感情を82%の精度で認識することができる。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In this paper, a deep learning framework is proposed for automatic facial emotion based on deep convolutional networks. In order to increase the generalization ability and the robustness of the method, the dataset size is increased by merging three publicly available facial emotion datasets: CK+, FER+ and KDEF. Despite the increase in dataset size, the minority classes still suffer from insufficient number of training samples, leading to data imbalance. The data imbalance problem is minimized by online and offline augmentation techniques and random weighted sampling. Experimental results demonstrate that the proposed method can recognize the seven basic emotions with 82% accuracy. The results demonstrate the effectiveness of the proposed approach in tackling the challenges of data imbalance and improving classification performance in facial emotion recognition.
Abstract（参考訳）: 本稿では,深層畳み込みネットワークに基づく表情自動認識のためのディープラーニングフレームワークを提案する。一般化能力と手法の堅牢性を高めるため,CK+,FER+,KDEFの3つの顔感情データセットを統合することにより,データセットサイズを増大させる。データセットのサイズが大きくなるにもかかわらず、マイノリティクラスは依然としてトレーニングサンプルの不足に悩まされており、データの不均衡につながっている。データ不均衡問題は、オンラインおよびオフラインの強化手法とランダムな重み付けサンプリングによって最小化される。実験の結果,提案手法は7つの基本的な感情を82%の精度で認識できることがわかった。その結果,データ不均衡の課題に対処し,顔の感情認識における分類性能を向上させるために提案手法の有効性が示された。

関連論文リスト

Facial Emotion Recognition on FER-2013 using an EfficientNetB2-Based Approach [0.0]
現実のシナリオにおける顔画像に基づく人間の感情の検出は、画像品質の低さ、照明の変動、ポーズの変化、背景の気晴らし、クラス間の小さなバリエーション、騒々しいクラウドソースラベル、厳しいクラス不均衡のために難しい作業である。 EfficientNetB2に基づく、軽量で効率的な顔の感情認識パイプラインを用いて、これらの課題に対処する。このモデルは、87.5%/12.5%の列車価差分を定式化してトレーニングされ、試験精度は68.78%であり、VGG16ベースラインの約10倍のパラメータを達成している。
論文参考訳（メタデータ） (2026-01-26T07:29:50Z)
A Comparative Study on Synthetic Facial Data Generation Techniques for Face Recognition [1.5515194949246]
本研究は, 顔認識タスクにおいて, 異なる手法を用いて生成した合成顔データの有効性を比較した。その結果, 実データとの性能ギャップを埋めるためのさらなる研究の必要性を強調しつつ, 現実的な変動を捉える合成データの能力を実証した。
論文参考訳（メタデータ） (2025-12-05T18:11:29Z)
A Deep Learning Approach for Facial Attribute Manipulation and Reconstruction in Surveillance and Reconnaissance [5.980822697955566]
監視システムはセキュリティと偵察において重要な役割を果たすが、その性能は低品質の画像やビデオによって損なわれることが多い。既存のAIベースの顔分析モデルは、皮膚のトーンの変化と部分的に隠された顔に関連するバイアスに悩まされている。本稿では,データセットのバイアスを補うための合成トレーニングデータを生成することにより,監視機能を向上させるデータ駆動プラットフォームを提案する。
論文参考訳（メタデータ） (2025-06-06T23:09:17Z)
Toward Fairer Face Recognition Datasets [69.04239222633795]
顔認識と検証は、ディープ表現の導入によってパフォーマンスが向上したコンピュータビジョンタスクである。実際のトレーニングデータセットにおける顔データとバイアスのセンシティブな性格による倫理的、法的、技術的な課題は、彼らの開発を妨げる。生成されたトレーニングデータセットに階層属性のバランス機構を導入することにより、公平性を促進する。
論文参考訳（メタデータ） (2024-06-24T12:33:21Z)
Deep Imbalanced Learning for Multimodal Emotion Recognition in Conversations [15.705757672984662]
会話におけるマルチモーダル感情認識(MERC)は、マシンインテリジェンスにとって重要な開発方向である。 MERCのデータの多くは自然に感情カテゴリーの不均衡な分布を示しており、研究者は感情認識に対する不均衡なデータの負の影響を無視している。生データにおける感情カテゴリーの不均衡分布に対処するクラス境界拡張表現学習(CBERL)モデルを提案する。我々は,IEMOCAPおよびMELDベンチマークデータセットの広範な実験を行い,CBERLが感情認識の有効性において一定の性能向上を達成したことを示す。
論文参考訳（メタデータ） (2023-12-11T12:35:17Z)
Improved Speech Emotion Recognition using Transfer Learning and Spectrogram Augmentation [56.264157127549446]
音声感情認識(SER)は、人間とコンピュータの相互作用において重要な役割を果たす課題である。 SERの主な課題の1つは、データの不足である。本稿では,スペクトログラム拡張と併用した移動学習戦略を提案する。
論文参考訳（メタデータ） (2021-08-05T10:39:39Z)
Noisy Student Training using Body Language Dataset Improves Facial Expression Recognition [10.529781894367877]
本稿では,ラベル付きデータセットと非ラベル付きデータセットを組み合わせた自己学習手法を提案する。実験分析により,ノイズの多い学生ネットワークを反復的にトレーニングすることで,より優れた結果が得られることが示された。提案手法は,ベンチマークデータセット上での最先端性能を実現する。
論文参考訳（メタデータ） (2020-08-06T13:45:52Z)
Suppressing Uncertainties for Large-Scale Facial Expression Recognition [81.51495681011404]
本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
論文参考訳（メタデータ） (2020-02-24T17:24:36Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。