論文の概要: Towards Better Uncertainty: Iterative Training of Efficient Networks for
Multitask Emotion Recognition
- arxiv url: http://arxiv.org/abs/2108.04228v1
- Date: Wed, 21 Jul 2021 09:49:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-15 11:30:05.704301
- Title: Towards Better Uncertainty: Iterative Training of Efficient Networks for
Multitask Emotion Recognition
- Title(参考訳): 不確実性向上に向けて:マルチタスク感情認識のための効率的なネットワークの反復学習
- Authors: Didan Deng, Liang Wu, Bertram E. Shi
- Abstract要約: 本稿では,感情認識タスクに多世代自己蒸留アルゴリズムを適用し,不確実性推定性能を向上させることを提案する。
我々は、感情認識と不確実性推定の性能をさらに向上させるために、深層アンサンブルを反復訓練する。
最終的に、本アルゴリズムは、ドメイン内不確実性を推定できる単一学生モデルと、ドメイン外サンプルを検出することができる学生アンサンブルとを導出する。
- 参考スコア(独自算出の注目度): 8.707214497205443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: When recognizing emotions, subtle nuances of emotion displays often cause
ambiguity or uncertainty in emotion perception. Unfortunately, the ambiguity or
uncertainty cannot be reflected in hard emotion labels. Emotion predictions
with uncertainty can be useful for risk controlling, but they are relatively
scarce in current deep models for emotion recognition. To address this issue,
we propose to apply the multi-generational self-distillation algorithm to
emotion recognition task towards better uncertainty estimation performance.
We firstly use deep ensembles to capture uncertainty, as an approximation to
Bayesian methods. Secondly, the deep ensemble provides soft labels to its
student models, while the student models can learn from the uncertainty
embedded in those soft labels. Thirdly, we iteratively train deep ensembles to
further improve the performance of emotion recognition and uncertainty
estimation. In the end, our algorithm results in a single student model that
can estimate in-domain uncertainty and a student ensemble that can detect
out-of-domain samples. We trained our Efficient Multitask Emotion Networks
(EMENet) on the Aff-wild2 dataset, and conducted extensive experiments on
emotion recognition and uncertainty estimation. Our algorithm gives more
reliable uncertainty estimates than Temperature Scaling and Monte Carol
Dropout.
- Abstract(参考訳): 感情を認識するとき、感情の微妙なニュアンスはしばしば感情知覚の曖昧さや不確実性を引き起こす。
残念ながら、曖昧さや不確実性はハードな感情ラベルには反映できない。
不確実性を伴う感情予測はリスクコントロールに有用であるが、現在の感情認識の深層モデルでは比較的少ない。
この問題に対処するために,多世代自己蒸留アルゴリズムを感情認識タスクに適用し,不確実性推定性能を向上させることを提案する。
まずディープアンサンブルを用いて不確実性を捉え、ベイズ法を近似する。
第二に、deep ensembleは学生モデルにソフトラベルを提供し、学生モデルはソフトラベルに埋め込まれた不確実性から学ぶことができる。
第3に,深いアンサンブルを反復的に訓練し,感情認識と不確実性評価のさらなる向上を図る。
最後に、アルゴリズムは、ドメイン内不確かさを推定できる単一の学生モデルと、ドメイン外サンプルを検出できる学生アンサンブルを生成する。
aff-wild2データセット上で効率的なマルチタスク感情ネットワーク(emenet)をトレーニングし,感情認識と不確実性推定に関する広範な実験を行った。
本アルゴリズムは,温度スケールやモンテキャロルドロップアウトよりも信頼性の高い不確実性推定を行う。
関連論文リスト
- Handling Ambiguity in Emotion: From Out-of-Domain Detection to
Distribution Estimation [45.53789836426869]
感情に対する主観的な認識は、人間の注釈からの矛盾したラベルにつながる。
本稿では,あいまいな感情を扱う3つの方法について検討する。
分類器にラベルを付けない発話を付加クラスとして組み込むことで、他の感情クラスの分類性能が低下することを示す。
また,明快な深層学習を用いた感情分類における不確実性を定量化することにより,不明瞭な感情を伴う発話を領域外サンプルとして検出することを提案する。
論文 参考訳(メタデータ) (2024-02-20T09:53:38Z) - Towards A Robust Group-level Emotion Recognition via Uncertainty-Aware
Learning [29.27161082428625]
グループレベルの感情認識(GER)は、人間の行動分析の不可分な部分である。
GERのためのより堅牢な表現を抽出する不確実性認識学習(UAL)手法を提案する。
我々は,強騒音に対するモデルの頑健性を高めるために,画像強調モジュールを開発した。
論文 参考訳(メタデータ) (2023-10-06T15:05:41Z) - Seeking Subjectivity in Visual Emotion Distribution Learning [93.96205258496697]
視覚感情分析(VEA)は、人々の感情を異なる視覚刺激に向けて予測することを目的としている。
既存の手法では、集団投票プロセスにおいて固有の主観性を無視して、統合されたネットワークにおける視覚的感情分布を予測することが多い。
視覚的感情分布の主観性を調べるために,新しいテキストサブジェクティビティ評価ネットワーク(SAMNet)を提案する。
論文 参考訳(メタデータ) (2022-07-25T02:20:03Z) - Multimodal Emotion Recognition with Modality-Pairwise Unsupervised
Contrastive Loss [80.79641247882012]
マルチモーダル感情認識(MER)のための教師なし特徴学習に着目した。
個別の感情を考慮し、モダリティテキスト、音声、視覚が使用される。
本手法は, 対のモダリティ間のコントラスト損失に基づくもので, MER文学における最初の試みである。
論文 参考訳(メタデータ) (2022-07-23T10:11:24Z) - Estimating the Uncertainty in Emotion Class Labels with
Utterance-Specific Dirichlet Priors [24.365876333182207]
本稿では,発話ごとのディリクレの事前分布に基づく新たな訓練損失を提案する。
ラベル付けの不確かさの高い試験発話を検出することで、さらなる測定値を用いて性能を評価する。
広く使われているIEMOCAPデータセットによる実験は、2分岐構造が最先端の分類結果を達成することを示した。
論文 参考訳(メタデータ) (2022-03-08T23:30:01Z) - MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal
Emotion Recognition [118.73025093045652]
マルチモーダル感情認識のための事前学習モデル textbfMEmoBERT を提案する。
従来の「訓練前、微妙な」パラダイムとは異なり、下流の感情分類タスクをマスク付きテキスト予測として再構成するプロンプトベースの手法を提案する。
提案するMEMOBERTは感情認識性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-10-27T09:57:00Z) - End-to-end label uncertainty modeling for speech emotion recognition
using Bayesian neural networks [16.708069984516964]
感情に固有の主観性を捉えるために,エンド・ツー・エンドのベイズニューラルネットワークアーキテクチャを導入する。
トレーニングにおいて、ネットワークは、主観的感情アノテーションに関連する本質的な不確実性を捉えるために、重みの分布を学習する。
AVEC'16感情認識データセットに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2021-10-07T09:34:28Z) - Multi-Classifier Interactive Learning for Ambiguous Speech Emotion
Recognition [9.856709988128515]
曖昧な発話感情に対処するために,MCIL (Multi-classifier Interactive Learning) 法を提案する。
MCILは、曖昧な感情の無矛盾な認識を持つ複数の個人を模倣し、新しい曖昧なラベルを構築する。
実験では、MCILは各分類器のパフォーマンスを向上させるだけでなく、認識の一貫性を中程度から実質的に向上させる。
論文 参考訳(メタデータ) (2020-12-10T02:58:34Z) - Facial Emotion Recognition with Noisy Multi-task Annotations [88.42023952684052]
ノイズの多いマルチタスクアノテーションを用いた顔の感情認識の新しい問題を提案する。
この新たな問題に対して,共同分布マッチングの観点からの定式化を提案する。
我々は,感情予測と共同分布学習を可能にする新しい手法を利用する。
論文 参考訳(メタデータ) (2020-10-19T20:39:37Z) - Continuous Emotion Recognition via Deep Convolutional Autoencoder and
Support Vector Regressor [70.2226417364135]
マシンはユーザの感情状態を高い精度で認識できることが不可欠である。
ディープニューラルネットワークは感情を認識する上で大きな成功を収めている。
表情認識に基づく連続的感情認識のための新しいモデルを提案する。
論文 参考訳(メタデータ) (2020-01-31T17:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。