論文の概要: Self-Paced Neutral Expression-Disentangled Learning for Facial
Expression Recognition
- arxiv url: http://arxiv.org/abs/2303.11840v1
- Date: Tue, 21 Mar 2023 13:34:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 14:57:20.399328
- Title: Self-Paced Neutral Expression-Disentangled Learning for Facial
Expression Recognition
- Title(参考訳): 表情認識のための自己ペース中性表現不連続学習
- Authors: Zhenqian Wu and Xiaoyuan Li and Yazhou Ren and Xiaorong Pu and
Xiaofeng Zhu and Lifang He
- Abstract要約: 中立表現において中立情報を利用するモデルを提案する。
類似表現間の異種情報をキャプチャすることができる。
3つの人気データベースの実験は、その有効性を示している。
- 参考スコア(独自算出の注目度): 17.392579923611724
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The accuracy of facial expression recognition is typically affected by the
following factors: high similarities across different expressions, disturbing
factors, and micro-facial movement of rapid and subtle changes. One potentially
viable solution for addressing these barriers is to exploit the neutral
information concealed in neutral expression images. To this end, in this paper
we propose a self-Paced Neutral Expression-Disentangled Learning (SPNDL) model.
SPNDL disentangles neutral information from facial expressions, making it
easier to extract key and deviation features. Specifically, it allows to
capture discriminative information among similar expressions and perceive
micro-facial movements. In order to better learn these neutral
expression-disentangled features (NDFs) and to alleviate the non-convex
optimization problem, a self-paced learning (SPL) strategy based on NDFs is
proposed in the training stage. SPL learns samples from easy to complex by
increasing the number of samples selected into the training process, which
enables to effectively suppress the negative impacts introduced by low-quality
samples and inconsistently distributed NDFs. Experiments on three popular
databases (i.e., CK+, Oulu-CASIA, and RAF-DB) show the effectiveness of our
proposed method.
- Abstract(参考訳): 表情認識の正確さは, 表情の類似度, 乱れ要因, 急速で微妙な変化のマイクロ顔面運動など, 様々な要因によって影響を受ける。
これらの障壁に対処する潜在的解決策の1つは、中立表現画像に隠された中立的な情報を活用することである。
そこで本稿では,spndl(self-paced neutral expression-disentangled learning)モデルを提案する。
SPNDLは、表情から中立情報を取り除き、キーと逸脱の特徴を抽出しやすくする。
具体的には、類似した表現間の識別情報をキャプチャし、マイクロ顔の動きを知覚することができる。
ニュートラル表現の不整合性(NDF)をよりよく学習し,非凸最適化問題を緩和するために,NDFに基づくセルフペースト学習(SPL)戦略をトレーニング段階で提案する。
SPLは、トレーニングプロセスに選択されたサンプルの数を増やすことで、サンプルを簡単から複雑に学習し、低品質のサンプルや不整合分散NDFによる負の影響を効果的に抑制することができる。
一般的な3つのデータベース(CK+, Oulu-CASIA, RAF-DB)を実験した結果,提案手法の有効性が示された。
関連論文リスト
- Dissecting Misalignment of Multimodal Large Language Models via Influence Function [12.832792175138241]
コントラスト損失に対する拡張影響関数 (ECIF) を導入し, コントラスト損失に対する影響関数について検討した。
ECIFは正と負の両方のサンプルを考慮し、対照的な学習モデルの閉形式近似を提供する。
ECIFを基盤として,MLLMにおけるデータ評価,誤アライメント検出,誤予測トレースバックタスクなどの一連のアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-11-18T15:45:41Z) - PseudoNeg-MAE: Self-Supervised Point Cloud Learning using Conditional Pseudo-Negative Embeddings [55.55445978692678]
PseudoNeg-MAEは,ポイントマスク自動エンコーダのグローバルな特徴表現を強化する,自己教師型学習フレームワークである。
PseudoNeg-MAE は ModelNet40 と ScanObjectNN のデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-09-24T07:57:21Z) - Debiasing Multimodal Large Language Models [61.6896704217147]
LVLM(Large Vision-Language Models)は、コンピュータビジョンや自然言語処理において欠かせないツールとなっている。
本研究は,入力画像に先行するLarge Language Models (LLM) の影響を主に受け,生成したコンテンツに有意なバイアスが生じることを示す。
これらのバイアスを是正し、視覚情報に対するモデルの焦点をリダイレクトするために、我々は2つの単純で訓練のない戦略を導入する。
論文 参考訳(メタデータ) (2024-03-08T12:35:07Z) - The Common Stability Mechanism behind most Self-Supervised Learning
Approaches [64.40701218561921]
自己指導型学習手法の安定性のメカニズムを説明するための枠組みを提供する。
我々は,BYOL,SWAV,SimSiam,Barlow Twins,DINOなどの非コントラスト技術であるSimCLRの動作メカニズムについて議論する。
私たちは異なる仮説を定式化し、Imagenet100データセットを使ってそれらをテストします。
論文 参考訳(メタデータ) (2024-02-22T20:36:24Z) - Disentangled Contrastive Learning for Learning Robust Textual
Representations [13.880693856907037]
運動量表現一貫性の概念を導入し,特徴を整合させ,一様性に適合しながらパワー正規化を活用する。
NLPベンチマークの実験結果から,本手法はベースラインよりも優れた結果が得られることが示された。
論文 参考訳(メタデータ) (2021-04-11T03:32:49Z) - A Simple but Tough-to-Beat Data Augmentation Approach for Natural
Language Understanding and Generation [53.8171136907856]
カットオフと呼ばれる、シンプルで効果的なデータ拡張戦略のセットを紹介します。
カットオフはサンプリング一貫性に依存しているため、計算オーバーヘッドが少なくなる。
cutoffは、敵のトレーニングを一貫して上回り、IWSLT2014 German- English データセットで最先端の結果を達成する。
論文 参考訳(メタデータ) (2020-09-29T07:08:35Z) - Micro-Facial Expression Recognition Based on Deep-Rooted Learning
Algorithm [0.0]
本稿では,MFEDRL(Micro-Facial Expression Based Deep-Rooted Learning)分類器を提案する。
アルゴリズムの性能は認識率と偽測度を用いて評価する。
論文 参考訳(メタデータ) (2020-09-12T12:23:27Z) - Semantic Neighborhood-Aware Deep Facial Expression Recognition [14.219890078312536]
意味的摂動を定式化し,訓練中に信頼できないサンプルを選択する新しい手法を提案する。
実験の結果,提案手法の有効性が示され,その結果が得られた。
論文 参考訳(メタデータ) (2020-04-27T11:48:17Z) - Suppressing Uncertainties for Large-Scale Facial Expression Recognition [81.51495681011404]
本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
論文 参考訳(メタデータ) (2020-02-24T17:24:36Z) - Joint Deep Learning of Facial Expression Synthesis and Recognition [97.19528464266824]
顔表情の合成と認識を効果的に行うための新しい統合深層学習法を提案する。
提案手法は, 2段階の学習手順を伴い, まず, 表情の異なる顔画像を生成するために, 表情合成生成対向ネットワーク (FESGAN) を事前訓練する。
実画像と合成画像間のデータバイアスの問題を軽減するために,新しい実データ誘導バックプロパゲーション(RDBP)アルゴリズムを用いたクラス内損失を提案する。
論文 参考訳(メタデータ) (2020-02-06T10:56:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。