論文の概要: Uncertain Label Correction via Auxiliary Action Unit Graphs for Facial
Expression Recognition
- arxiv url: http://arxiv.org/abs/2204.11053v1
- Date: Sat, 23 Apr 2022 11:09:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-27 07:09:33.938609
- Title: Uncertain Label Correction via Auxiliary Action Unit Graphs for Facial
Expression Recognition
- Title(参考訳): 表情認識のための補助行動単位グラフによる不確実なラベル補正
- Authors: Yang Liu, Xingming Zhang, Janne Kauttonen, Guoying Zhao
- Abstract要約: ULC-AGと呼ばれる補助行動単位(AU)グラフを用いて,表情の不確実なラベル補正を実現する。
ULC-AGはRAF-DBとAffectNetのデータセットでそれぞれ89.31%と61.57%の精度を達成した。
- 参考スコア(独自算出の注目度): 46.99756911719854
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-quality annotated images are significant to deep facial expression
recognition (FER) methods. However, uncertain labels, mostly existing in
large-scale public datasets, often mislead the training process. In this paper,
we achieve uncertain label correction of facial expressions using auxiliary
action unit (AU) graphs, called ULC-AG. Specifically, a weighted regularization
module is introduced to highlight valid samples and suppress category imbalance
in every batch. Based on the latent dependency between emotions and AUs, an
auxiliary branch using graph convolutional layers is added to extract the
semantic information from graph topologies. Finally, a re-labeling strategy
corrects the ambiguous annotations by comparing their feature similarities with
semantic templates. Experiments show that our ULC-AG achieves 89.31% and 61.57%
accuracy on RAF-DB and AffectNet datasets, respectively, outperforming the
baseline and state-of-the-art methods.
- Abstract(参考訳): 高品質なアノテート画像は、ディープ表情認識(FER)法に重要である。
しかし、大規模な公開データセットに存在する不確実なラベルは、しばしばトレーニングプロセスを誤解させる。
本稿では, ulc-agと呼ばれる補助行動単位(au)グラフを用いて, 表情のラベル補正を実現する。
具体的には、重み付き正規化モジュールを導入し、有効なサンプルを強調し、バッチ毎にカテゴリの不均衡を抑制する。
感情とAU間の潜伏依存性に基づいて、グラフ畳み込み層を用いた補助分岐を加えて、グラフトポロジから意味情報を抽出する。
最後に、再ラベル戦略は、特徴の類似性をセマンティックテンプレートと比較することで曖昧なアノテーションを修正する。
ULC-AGはRAF-DBとAffectNetのデータセットでそれぞれ89.31%と61.57%の精度を達成し、ベースラインと最先端の手法を上回った。
関連論文リスト
- Spatial Action Unit Cues for Interpretable Deep Facial Expression Recognition [55.97779732051921]
表情認識(FER)のための最先端の分類器は、エンドユーザーにとって重要な特徴である解釈可能性に欠ける。
新しい学習戦略が提案され、AU cues を分類器訓練に明示的に組み込むことで、深い解釈可能なモデルを訓練することができる。
我々の新しい戦略は汎用的であり、アーキテクチャの変更や追加のトレーニング時間を必要とすることなく、ディープCNNやトランスフォーマーベースの分類器に適用できます。
論文 参考訳(メタデータ) (2024-10-01T10:42:55Z) - Multi-Level Label Correction by Distilling Proximate Patterns for Semi-supervised Semantic Segmentation [16.75278876840937]
誤ラベルを訂正するアルゴリズムとして,MLLC (Multi-Level Label Correction) を提案する。
MLLCは、教師付きベースラインを大幅に改善し、CityscapesとPASCAL VOC 2012データセット上のさまざまなシナリオにおける最先端のアプローチより優れている。
論文 参考訳(メタデータ) (2024-04-02T16:06:20Z) - UIA-ViT: Unsupervised Inconsistency-Aware Method based on Vision
Transformer for Face Forgery Detection [52.91782218300844]
そこで我々は、UIA-ViTと呼ばれるビジョン変換器に基づく教師なし不整合認識手法を提案する。
自己注意機構により、パッチ埋め込み間の注意マップは自然に一貫性関係を表現し、一貫性表現学習に適した視覚変換器となる。
論文 参考訳(メタデータ) (2022-10-23T15:24:47Z) - Adaptive Graph-Based Feature Normalization for Facial Expression
Recognition [1.2246649738388389]
データ不確実性から表情認識モデルを保護するために,適応グラフに基づく特徴正規化(AGFN)手法を提案する。
我々の手法は、ベンチマークデータセットで91.84%、91.11%の精度で最先端の作業より優れています。
論文 参考訳(メタデータ) (2022-07-22T14:57:56Z) - Active Learning by Feature Mixing [52.16150629234465]
本稿では,ALFA-Mixと呼ばれるバッチ能動学習手法を提案する。
予測の不整合を求めることにより,不整合な特徴を持つインスタンスを同定する。
これらの予測の不整合は、モデルが未認識のインスタンスで認識できない特徴を発見するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-14T12:20:54Z) - Pseudo Pixel-level Labeling for Images with Evolving Content [5.573543601558405]
画像の手動アノテーションの労力を削減するために,擬似ピクセルレベルのラベル生成手法を提案する。
VGGとResNetのバックボーンを用いた2つのセマンティックセグメンテーションモデルを、擬似ラベリング法と最先端手法を用いてラベル付けした画像上で学習する。
以上の結果から, トレーニングプロセスにおいて, 最先端手法を用いて生成したデータの代わりに擬似ラベルを用いることで, VGGおよびResNetに基づくセマンティックセマンティックセグメンテーションモデルの平均IoUと周波数重み付きIoUを3.36%, 2.58%, 10倍改善することがわかった。
論文 参考訳(メタデータ) (2021-05-20T18:14:19Z) - GRACE: Gradient Harmonized and Cascaded Labeling for Aspect-based
Sentiment Analysis [90.43089622630258]
本稿では、これらの問題を解決するために、GRACE(GRadient hArmonized and CascadEd labeling model)を提案する。
提案モデルでは,複数のベンチマークデータセットの整合性向上を実現し,最先端の結果を生成する。
論文 参考訳(メタデータ) (2020-09-22T13:55:34Z) - Learning Image Labels On-the-fly for Training Robust Classification
Models [13.669654965671604]
ノイズの多いアノテーション(例えば、異なるアルゴリズムベースのラベル付け子から)を一緒に利用し、相互に分類タスクの学習に役立てることができるかを示す。
メタトレーニングベースのラベルサンプリングモジュールは、追加のバックプロパゲーションプロセスを通じてモデル学習の恩恵を受けるラベルに出席するように設計されている。
論文 参考訳(メタデータ) (2020-09-22T05:38:44Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。