論文の概要: Affect Expression Behaviour Analysis in the Wild using Consensual
Collaborative Training
- arxiv url: http://arxiv.org/abs/2107.05736v1
- Date: Thu, 8 Jul 2021 04:28:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-18 12:32:48.014457
- Title: Affect Expression Behaviour Analysis in the Wild using Consensual
Collaborative Training
- Title(参考訳): コンセンシアル・コラボレーティブ・トレーニングを用いた野生動物における表情行動解析
- Authors: Darshan Gera, S Balasubramanian
- Abstract要約: 本報告では,ABAW(Affective Behaviour Analysis in-the-wild)2021コンペティションに使用したConsensual Collaborative Training(CCT)フレームワークについて述べる。
CCTは3つのネットワークを共同で管理損失と一貫性損失の凸の組み合わせで訓練する。
協調トレーニングは全体的なエラーを低減し、一貫性の低下はノイズの多いサンプルへの過度な適合を防ぐ。
- 参考スコア(独自算出の注目度): 2.538209532048867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Facial expression recognition (FER) in the wild is crucial for building
reliable human-computer interactive systems. However, annotations of large
scale datasets in FER has been a key challenge as these datasets suffer from
noise due to various factors like crowd sourcing, subjectivity of annotators,
poor quality of images, automatic labelling based on key word search etc. Such
noisy annotations impede the performance of FER due to the memorization ability
of deep networks. During early learning stage, deep networks fit on clean data.
Then, eventually, they start overfitting on noisy labels due to their
memorization ability, which limits FER performance. This report presents
Consensual Collaborative Training (CCT) framework used in our submission to
expression recognition track of the Affective Behaviour Analysis in-the-wild
(ABAW) 2021 competition. CCT co-trains three networks jointly using a convex
combination of supervision loss and consistency loss, without making any
assumption about the noise distribution. A dynamic transition mechanism is used
to move from supervision loss in early learning to consistency loss for
consensus of predictions among networks in the later stage. Co-training reduces
overall error, and consistency loss prevents overfitting to noisy samples. The
performance of the model is validated on challenging Aff-Wild2 dataset for
categorical expression classification. Our code is made publicly available at
https://github.com/1980x/ABAW2021DMACS.
- Abstract(参考訳): 顔の表情認識(FER)は、人間とコンピュータの対話システムを構築する上で重要である。
しかし、クラウドソーシング、注釈の主観性、画像の質の低下、キーワード検索に基づく自動ラベル付けなど様々な要因により、ferにおける大規模データセットのアノテーションはノイズに悩まされているため、重要な課題となっている。
このようなノイズの多いアノテーションは、ディープネットワークの記憶能力のためにFERの性能を損なう。
学習の初期段階では、ディープネットワークはクリーンデータに適合する。
そして最終的に、FER性能を制限する記憶能力のために、ノイズの多いラベルに過度に適合し始める。
本報告では,ABAW(Affective Behaviour Analysis in-the-Wild)2021コンペティションの表現認識トラックに,コンセンサス協調訓練(CCT)フレームワークを提出する。
CCTは、騒音分布を仮定することなく、監督損失と整合損失の凸結合を用いて3つのネットワークを共同で訓練する。
動的遷移機構は、早期学習における監督損失から、後期のネットワーク間の予測のコンセンサスに対する一貫性損失への移行に使用される。
共トレーニングは全体的なエラーを低減し、一貫性の損失はノイズの多いサンプルへの過剰フィットを防ぐ。
分類式分類のためのAff-Wild2データセットに挑戦するモデルの性能を検証する。
私たちのコードはhttps://github.com/1980x/ABAW2021DMACSで公開されています。
関連論文リスト
- Noisy Correspondence Learning with Self-Reinforcing Errors Mitigation [63.180725016463974]
クロスモーダル検索は、実際は精力的な、十分に整合した大規模データセットに依存している。
我々は、新しい雑音対応学習フレームワーク、textbfSelf-textbfReinforcing textbfErrors textbfMitigation(SREM)を導入する。
論文 参考訳(メタデータ) (2023-12-27T09:03:43Z) - Cross-head mutual Mean-Teaching for semi-supervised medical image
segmentation [6.738522094694818]
SSMIS(Semi-supervised Medical Image segmentation)は、限られたラベル付きデータと豊富なラベルなしデータを活用することで、大幅な進歩を目撃している。
既存のSOTA(State-of-the-art)手法は、ラベルなしデータのラベルを正確に予測する際の課題に直面する。
強弱データ拡張を組み込んだ新しいクロスヘッド相互学習ネットワーク(CMMT-Net)を提案する。
論文 参考訳(メタデータ) (2023-10-08T09:13:04Z) - Cluster-level pseudo-labelling for source-free cross-domain facial
expression recognition [94.56304526014875]
表情認識のためのSFUDA法を提案する。
本手法は,自己教師付き事前学習を利用して,対象データから優れた特徴表現を学習する。
提案手法の有効性を4つの適応方式で検証し,FERに適用した場合,既存のSFUDA法より一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T08:24:50Z) - Dynamic Adaptive Threshold based Learning for Noisy Annotations Robust
Facial Expression Recognition [3.823356975862006]
ノイズの多いアノテーションを扱うための動的FER学習フレームワーク(DNFER)を提案する。
具体的には、DNFERは、選択されたクリーンサンプルを使用した教師ありトレーニングと、すべてのサンプルを使用した教師なし一貫性のあるトレーニングに基づいている。
我々は,RAFDB,FERPlus,SFEW,AffectNetなどの実雑音付きFERデータセットに対して,DNFERの堅牢性を示す。
論文 参考訳(メタデータ) (2022-08-22T12:02:41Z) - Treatment Learning Causal Transformer for Noisy Image Classification [62.639851972495094]
本研究では,この2値情報「ノイズの存在」を画像分類タスクに組み込んで予測精度を向上させる。
因果的変動推定から動機付け,雑音画像分類のための頑健な特徴表現を潜在生成モデルを用いて推定するトランスフォーマーに基づくアーキテクチャを提案する。
また、パフォーマンスベンチマークのための幅広いノイズ要素を取り入れた、新しいノイズの多い画像データセットも作成する。
論文 参考訳(メタデータ) (2022-03-29T13:07:53Z) - Synergistic Network Learning and Label Correction for Noise-robust Image
Classification [28.27739181560233]
ディープニューラルネットワーク(DNN)は、トレーニングラベルノイズに過度に適合する傾向があるため、実際のモデルパフォーマンスは低下する。
損失選択と雑音補正のアイデアを組み合わせたロバストなラベル補正フレームワークを提案する。
ノイズタイプやレートの異なる合成および実世界のデータセット上で,本手法を実証する。
論文 参考訳(メタデータ) (2022-02-27T23:06:31Z) - S3: Supervised Self-supervised Learning under Label Noise [53.02249460567745]
本稿では,ラベルノイズの存在下での分類の問題に対処する。
提案手法の核心は,サンプルのアノテートラベルと特徴空間内のその近傍のラベルの分布との整合性に依存するサンプル選択機構である。
提案手法は,CIFARCIFAR100とWebVisionやANIMAL-10Nなどの実環境ノイズデータセットの両方で,従来の手法をはるかに上回っている。
論文 参考訳(メタデータ) (2021-11-22T15:49:20Z) - Consistency Regularization Can Improve Robustness to Label Noise [4.340338299803562]
本稿では,雑音ラベルに対するトレーニング時ロバスト性に対する整合正則化の関連性について実験的に検討する。
整合性を促進する単純な損失関数は、ノイズをラベル付けするためのモデルの堅牢性を改善する。
論文 参考訳(メタデータ) (2021-10-04T08:15:08Z) - Consensual Collaborative Training And Knowledge Distillation Based
Facial Expression Recognition Under Noisy Annotations [2.538209532048867]
本研究は,CCT(Consensual Collaborative Training)フレームワークと呼ばれる,ノイズラベルの存在下での効果的なトレーニング戦略を提案する。
CCTは3つのネットワークを共同で管理損失と一貫性損失の凸の組み合わせで訓練する。
FERDB (90.84%)、FERPlus (89.99%)、AffectNet (66%)のベンチマークで最先端のパフォーマンスが報告されている。
論文 参考訳(メタデータ) (2021-07-10T03:37:06Z) - Provable Generalization of SGD-trained Neural Networks of Any Width in
the Presence of Adversarial Label Noise [85.59576523297568]
勾配降下法により学習した任意の幅の1層リークReLUネットワークを考察する。
sgdは,分布上の最良半空間に匹敵する分類精度を持つニューラルネットワークを生成できることを実証する。
論文 参考訳(メタデータ) (2021-01-04T18:32:49Z) - Suppressing Uncertainties for Large-Scale Facial Expression Recognition [81.51495681011404]
本稿では,不確実性を効果的に抑制し,深層ネットワークが不確実な顔画像に過度に収まらないような,シンプルで効率的なセルフキュアネットワーク(SCN)を提案する。
公開ベンチマークの結果、我々のSCNは現在の最先端メソッドよりも、RAF-DBで textbf88.14%、AffectNetで textbf60.23%、FERPlusで textbf89.35% を上回りました。
論文 参考訳(メタデータ) (2020-02-24T17:24:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。