論文の概要: Estimating the Uncertainty in Emotion Class Labels with
Utterance-Specific Dirichlet Priors
- arxiv url: http://arxiv.org/abs/2203.04443v1
- Date: Tue, 8 Mar 2022 23:30:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-10 15:21:31.045665
- Title: Estimating the Uncertainty in Emotion Class Labels with
Utterance-Specific Dirichlet Priors
- Title(参考訳): 発話特異的ディリクレ優先順位を用いた感情クラスラベルの不確かさの推定
- Authors: Wen Wu, Chao Zhang, Xixin Wu, Philip C. Woodland
- Abstract要約: 本稿では,発話ごとのディリクレの事前分布に基づく新たな訓練損失を提案する。
ラベル付けの不確かさの高い試験発話を検出することで、さらなる測定値を用いて性能を評価する。
広く使われているIEMOCAPデータセットによる実験は、2分岐構造が最先端の分類結果を達成することを示した。
- 参考スコア(独自算出の注目度): 24.365876333182207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotion recognition is a key attribute for artificial intelligence systems
that need to naturally interact with humans. However, the task definition is
still an open problem due to inherent ambiguity of emotions. In this paper, a
novel Bayesian training loss based on per-utterance Dirichlet prior
distributions is proposed for verbal emotion recognition, which models the
uncertainty in one-hot labels created when human annotators assign the same
utterance to different emotion classes. An additional metric is used to
evaluate the performance by detecting test utterances with high labelling
uncertainty. This removes a major limitation that emotion classification
systems only consider utterances with majority labels.Furthermore, a
frequentist approach is studied to leverage the continuous-valued "soft" labels
obtained by averaging the one-hot labels. We propose a two-branch model
structure for emotion classification on a per-utterance basis. Experiments with
the widely used IEMOCAP dataset demonstrate that the two-branch structure
achieves state-of-the-art classification results with all common IEMOCAP test
setups. Based on this, uncertainty estimation experiments were performed. The
best performance in terms of the area under the precision-recall curve when
detecting utterances with high uncertainty was achieved by interpolating the
Bayesian training loss with the Kullback-Leibler divergence training loss for
the soft labels.
- Abstract(参考訳): 感情認識は、人間と自然に対話する必要がある人工知能システムにとって重要な属性である。
しかし、タスク定義は感情のあいまいさのため、まだ未解決の問題である。
本稿では,人間のアノテータが同じ発話を異なる感情クラスに割り当てたときに生じる1ホットラベルの不確かさをモデル化した,発話ごとのディリクレの事前分布に基づく新しいベイズ訓練損失を提案する。
ラベル付けの不確かさの高い試験発話を検出することで、さらなる測定値を用いて性能を評価する。
これにより、感情分類システムが多数派ラベルの発話のみを考慮しているという大きな制限が取り除かれ、さらに、1つのホットラベル平均化によって得られる連続的な値の「ソフト」ラベルを活用するために、頻繁なアプローチが研究されている。
発話毎に感情分類を行うための2分岐モデル構造を提案する。
広く使われているIEMOCAPデータセットを用いた実験では、2分岐構造がすべての共通IEMOCAPテスト設定で最先端の分類結果を達成することを示した。
これに基づいて不確実性推定実験を行った。
ソフトラベルのkullback-leiblerダイバージェンストレーニング損失とベイズ学習損失を補間することにより,不確実度の高い発話を検出する際の精度リコール曲線下の領域の最適性能が得られた。
関連論文リスト
- Handling Ambiguity in Emotion: From Out-of-Domain Detection to
Distribution Estimation [45.53789836426869]
感情に対する主観的な認識は、人間の注釈からの矛盾したラベルにつながる。
本稿では,あいまいな感情を扱う3つの方法について検討する。
分類器にラベルを付けない発話を付加クラスとして組み込むことで、他の感情クラスの分類性能が低下することを示す。
また,明快な深層学習を用いた感情分類における不確実性を定量化することにより,不明瞭な感情を伴う発話を領域外サンプルとして検出することを提案する。
論文 参考訳(メタデータ) (2024-02-20T09:53:38Z) - Estimating the Uncertainty in Emotion Attributes using Deep Evidential
Regression [17.26466867595571]
自動感情認識では、異なる人間のアノテータによって同じ発話に割り当てられたラベルはしばしば矛盾する。
本稿では,感情属性の不確かさを推定するために,ベイズ的アプローチであるDeep obviousial emotion regression (DEER)を提案する。
広く使われているMSP-PodcastとIEMOCAPデータセットの実験では、DeERが最先端の結果を生み出した。
論文 参考訳(メタデータ) (2023-06-11T20:07:29Z) - Ambiguity-Resistant Semi-Supervised Learning for Dense Object Detection [98.66771688028426]
本研究では,一段階検出器のためのAmbiguity-Resistant Semi-supervised Learning (ARSL)を提案する。
擬似ラベルの分類とローカライズ品質を定量化するために,JCE(Joint-Confidence Estimation)を提案する。
ARSLは、曖昧さを効果的に軽減し、MS COCOおよびPASCALVOC上で最先端のSSOD性能を達成する。
論文 参考訳(メタデータ) (2023-03-27T07:46:58Z) - Exploiting Completeness and Uncertainty of Pseudo Labels for Weakly
Supervised Video Anomaly Detection [149.23913018423022]
弱教師付きビデオ異常検出は、ビデオレベルのラベルのみを用いて、ビデオ内の異常事象を特定することを目的としている。
2段階の自己学習法は擬似ラベルの自己生成によって著しく改善されている。
本稿では,自己学習のための完全性と不確実性を利用した強化フレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-08T05:53:53Z) - Unifying the Discrete and Continuous Emotion labels for Speech Emotion
Recognition [28.881092401807894]
音声からの感情検出のためのパラ言語分析では、感情は離散的または次元的(連続的な評価)ラベルと同一視されている。
本研究では,連続的感情特性と離散的感情特性を共同で予測するモデルを提案する。
論文 参考訳(メタデータ) (2022-10-29T16:12:31Z) - Debiased Pseudo Labeling in Self-Training [77.83549261035277]
ディープニューラルネットワークは、大規模ラベル付きデータセットの助けを借りて、幅広いタスクで顕著なパフォーマンスを達成する。
ラベル付きデータの要求を軽減するため、ラベル付けされていないデータに擬似ラベルを付けることにより、学術と産業の両方で自己学習が広く使われている。
疑似ラベルの生成と利用を2つの独立した頭文字で分離するデバイアスドを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:14:33Z) - MEmoBERT: Pre-training Model with Prompt-based Learning for Multimodal
Emotion Recognition [118.73025093045652]
マルチモーダル感情認識のための事前学習モデル textbfMEmoBERT を提案する。
従来の「訓練前、微妙な」パラダイムとは異なり、下流の感情分類タスクをマスク付きテキスト予測として再構成するプロンプトベースの手法を提案する。
提案するMEMOBERTは感情認識性能を大幅に向上させる。
論文 参考訳(メタデータ) (2021-10-27T09:57:00Z) - End-to-end label uncertainty modeling for speech emotion recognition
using Bayesian neural networks [16.708069984516964]
感情に固有の主観性を捉えるために,エンド・ツー・エンドのベイズニューラルネットワークアーキテクチャを導入する。
トレーニングにおいて、ネットワークは、主観的感情アノテーションに関連する本質的な不確実性を捉えるために、重みの分布を学習する。
AVEC'16感情認識データセットに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2021-10-07T09:34:28Z) - Label Distribution Amendment with Emotional Semantic Correlations for
Facial Expression Recognition [69.18918567657757]
意味空間における表現間の相関を利用して,各顔画像のラベル分布を補正する手法を提案する。
各画像のセマンティックグラフとタスククラス関連グラフを比較することにより、そのラベル分布の信頼性を評価する。
実験により,提案手法は最先端手法と比較した場合よりも有効であることが示された。
論文 参考訳(メタデータ) (2021-07-23T07:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。