論文の概要: Combating Uncertainty and Class Imbalance in Facial Expression
Recognition
- arxiv url: http://arxiv.org/abs/2212.07751v1
- Date: Thu, 15 Dec 2022 12:09:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 17:10:41.641352
- Title: Combating Uncertainty and Class Imbalance in Facial Expression
Recognition
- Title(参考訳): 表情認識における不確実性とクラス不均衡
- Authors: Jiaxiang Fan, Jian Zhou, Xiaoyu Deng, Huabin Wang, Liang Tao, Hon
Keung Kwan
- Abstract要約: 本稿では,Resnet と Attention に基づくフレームワークを提案する。
本手法は,表情データセットの精度において,最も基本的な手法を超越している。
- 参考スコア(独自算出の注目度): 4.306007841758853
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recognition of facial expression is a challenge when it comes to computer
vision. The primary reasons are class imbalance due to data collection and
uncertainty due to inherent noise such as fuzzy facial expressions and
inconsistent labels. However, current research has focused either on the
problem of class imbalance or on the problem of uncertainty, ignoring the
intersection of how to address these two problems. Therefore, in this paper, we
propose a framework based on Resnet and Attention to solve the above problems.
We design weight for each class. Through the penalty mechanism, our model will
pay more attention to the learning of small samples during training, and the
resulting decrease in model accuracy can be improved by a Convolutional Block
Attention Module (CBAM). Meanwhile, our backbone network will also learn an
uncertain feature for each sample. By mixing uncertain features between
samples, the model can better learn those features that can be used for
classification, thus suppressing uncertainty. Experiments show that our method
surpasses most basic methods in terms of accuracy on facial expression data
sets (e.g., AffectNet, RAF-DB), and it also solves the problem of class
imbalance well.
- Abstract(参考訳): コンピュータビジョンに関しては、表情の認識が課題である。
主な理由は、ファジィ表情や一貫性のないラベルなどの固有のノイズによるデータ収集と不確実性によるクラス不均衡である。
しかし、現在の研究は、クラス不均衡の問題か不確実性の問題に焦点を合わせており、これらの2つの問題を解決する方法の共通点を無視している。
そこで本稿では,resnetに基づくフレームワークと,上記の問題を解決するための注意点を提案する。
クラスごとに重量を設計します。
ペナルティメカニズムを通じて,本モデルでは,トレーニング中の小さなサンプルの学習により多くの注意を払うとともに,畳み込みブロック注意モジュール(CBAM)によりモデル精度の低下を改善できる。
一方、バックボーンネットワークは、サンプル毎に不確実な機能も学習します。
サンプル間で不確実な特徴を混ぜ合わせることで、モデルは分類に使用できる特徴をよりよく学習し、不確実性を抑えることができる。
実験の結果,表情データセット(例えばAffectNetやRAF-DB)の精度において,最も基本的な手法を超越し,クラス不均衡の問題も解決できることがわかった。
関連論文リスト
- Classes Are Not Equal: An Empirical Study on Image Recognition Fairness [100.36114135663836]
我々は,クラスが等しくないことを実験的に証明し,様々なデータセットにまたがる画像分類モデルにおいて,公平性の問題が顕著であることを示した。
以上の結果から,モデルでは認識が困難であるクラスに対して,予測バイアスが大きくなる傾向が示唆された。
データ拡張および表現学習アルゴリズムは、画像分類のある程度の公平性を促進することにより、全体的なパフォーマンスを向上させる。
論文 参考訳(メタデータ) (2024-02-28T07:54:50Z) - Answering from Sure to Uncertain: Uncertainty-Aware Curriculum Learning
for Video Question Answering [63.12469700986452]
不確実性を考慮したカリキュラム学習(CL)の概念を導入する。
ここで不確実性は、困難を動的に調整するための指針となる。
実際に、我々は、ビデオQAモデルを我々のフレームワークにシームレスに統合し、包括的な実験を行う。
論文 参考訳(メタデータ) (2024-01-03T02:29:34Z) - Leave No Stone Unturned: Mine Extra Knowledge for Imbalanced Facial
Expression Recognition [39.08466869516571]
顔の表情データは大きな不均衡を特徴とし、ほとんどの収集されたデータは幸福あるいは中立な表現を示し、恐怖や嫌悪の事例は少ない。
この不均衡は、表情認識(FER)モデルに課題をもたらし、様々な人間の感情状態を完全に理解する能力を妨げる。
既存のFER法は通常、高度に不均衡なテストセットに対して全体的な精度を報告するが、全ての式クラスの平均精度では低い性能を示す。
論文 参考訳(メタデータ) (2023-10-30T15:26:26Z) - Uncertainty-guided Boundary Learning for Imbalanced Social Event
Detection [64.4350027428928]
本研究では,不均衡なイベント検出タスクのための不確実性誘導型クラス不均衡学習フレームワークを提案する。
我々のモデルは、ほとんど全てのクラス、特に不確実なクラスにおいて、社会イベントの表現と分類タスクを大幅に改善する。
論文 参考訳(メタデータ) (2023-10-30T03:32:04Z) - Imbalanced Nodes Classification for Graph Neural Networks Based on
Valuable Sample Mining [9.156427521259195]
不均衡問題に対する従来のアルゴリズムレベルのアプローチに基づいて、新たな損失関数FD-Lossを再構成する。
我々の損失関数は、ノード分類タスクの既存の手法と比較して、サンプルノードの不均衡を効果的に解決し、分類精度を4%向上させることができる。
論文 参考訳(メタデータ) (2022-09-18T09:22:32Z) - Robustness and invariance properties of image classifiers [8.970032486260695]
ディープニューラルネットワークは多くの画像分類タスクで印象的な結果を得た。
ディープネットワークは、多種多様なセマンティック保存画像修正に対して堅牢ではない。
画像分類器の小さなデータ分散シフトに対する堅牢性の低さは、その信頼性に関する深刻な懸念を引き起こす。
論文 参考訳(メタデータ) (2022-08-30T11:00:59Z) - Visual Perturbation-aware Collaborative Learning for Overcoming the
Language Prior Problem [60.0878532426877]
本稿では,視覚的摂動校正の観点から,新しい協調学習手法を提案する。
具体的には、異なる摂動範囲で2種類のキュレートされた画像を構築するための視覚コントローラを考案する。
2つの診断VQA-CPベンチマークデータセットの実験結果は、その効果を明らかに示している。
論文 参考訳(メタデータ) (2022-07-24T23:50:52Z) - Uncertainty-Aware Learning Against Label Noise on Imbalanced Datasets [23.4536532321199]
不整合データセットのラベルノイズを処理するための不確かさを意識したラベル補正フレームワークを提案する。
本研究では,不均衡なデータセットのラベルノイズを処理するために,不確かさを意識したラベル補正フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-12T11:35:55Z) - Imbalanced Image Classification with Complement Cross Entropy [10.35173901214638]
不正なクラスにおける出力スコアをほとんど無視するクロスエントロピーの研究を行う。
本研究は,不規則なクラスにおける予測確率が不均衡画像分類の予測精度を向上させることを明らかにする。
提案された損失により、基底真理クラスは他のクラスをソフトマックス確率で圧倒する。
論文 参考訳(メタデータ) (2020-09-04T13:46:24Z) - Long-Tailed Recognition Using Class-Balanced Experts [128.73438243408393]
本稿では,多様な分類器の強度を組み合わせたクラスバランスの専門家のアンサンブルを提案する。
私たちのクラスバランスの専門家のアンサンブルは、最先端に近い結果に到達し、長い尾の認識のための2つのベンチマークで新たな最先端のアンサンブルを確立します。
論文 参考訳(メタデータ) (2020-04-07T20:57:44Z) - Suppressing Uncertainties for Large-Scale Facial Expression Recognition [81.51495681011404]
本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
論文 参考訳(メタデータ) (2020-02-24T17:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。