論文の概要: Estimating the Uncertainty in Emotion Attributes using Deep Evidential
Regression
- arxiv url: http://arxiv.org/abs/2306.06760v1
- Date: Sun, 11 Jun 2023 20:07:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-13 16:58:55.713368
- Title: Estimating the Uncertainty in Emotion Attributes using Deep Evidential
Regression
- Title(参考訳): 深い証拠回帰による感情属性の不確かさの推定
- Authors: Wen Wu, Chao Zhang, Philip C. Woodland
- Abstract要約: 自動感情認識では、異なる人間のアノテータによって同じ発話に割り当てられたラベルはしばしば矛盾する。
本稿では,感情属性の不確かさを推定するために,ベイズ的アプローチであるDeep obviousial emotion regression (DEER)を提案する。
広く使われているMSP-PodcastとIEMOCAPデータセットの実験では、DeERが最先端の結果を生み出した。
- 参考スコア(独自算出の注目度): 17.26466867595571
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In automatic emotion recognition (AER), labels assigned by different human
annotators to the same utterance are often inconsistent due to the inherent
complexity of emotion and the subjectivity of perception. Though deterministic
labels generated by averaging or voting are often used as the ground truth, it
ignores the intrinsic uncertainty revealed by the inconsistent labels. This
paper proposes a Bayesian approach, deep evidential emotion regression (DEER),
to estimate the uncertainty in emotion attributes. Treating the emotion
attribute labels of an utterance as samples drawn from an unknown Gaussian
distribution, DEER places an utterance-specific normal-inverse gamma prior over
the Gaussian likelihood and predicts its hyper-parameters using a deep neural
network model. It enables a joint estimation of emotion attributes along with
the aleatoric and epistemic uncertainties. AER experiments on the widely used
MSP-Podcast and IEMOCAP datasets showed DEER produced state-of-the-art results
for both the mean values and the distribution of emotion attributes.
- Abstract(参考訳): 自動感情認識(aer)では、異なる人間の注釈者が同じ発話に割り当てるラベルは、感情の固有の複雑さと知覚の主観性のため、しばしば矛盾する。
平均化や投票によって生成される決定論的ラベルはしばしば基礎的真実として用いられるが、一貫性のないラベルによって明らかにされる本質的不確実性を無視している。
本稿では,感情属性の不確かさを推定するために,ベイズ的アプローチであるDeep obviousial emotion regression (DEER)を提案する。
未知のガウス分布から得られた標本として発話の感情属性ラベルを扱い、ガウス確率よりも先に発話固有の正規逆ガンマを配置し、ディープニューラルネットワークモデルを用いてハイパーパラメータを予測する。
情動特性と失語症およびてんかんの不確かさを共同で推定することができる。
広く使われているMSP-PodcastとIEMOCAPデータセットのAER実験では、DERが平均値と感情属性の分布の両方に対して、最先端の結果を生成した。
関連論文リスト
- Smile upon the Face but Sadness in the Eyes: Emotion Recognition based on Facial Expressions and Eye Behaviors [63.194053817609024]
視覚行動は、視覚行動支援型マルチモーダル感情認識データセットを作成するための重要な感情的手がかりとなる。
EMERデータセットに感情認識(ER)と表情認識(FER)の両方のアノテーションを初めて提供する。
具体的には、ERとFERの両方のパフォーマンスを同時に向上する新しいEMERTアーキテクチャを設計する。
論文 参考訳(メタデータ) (2024-11-08T04:53:55Z) - Handling Ambiguity in Emotion: From Out-of-Domain Detection to
Distribution Estimation [45.53789836426869]
感情に対する主観的な認識は、人間の注釈からの矛盾したラベルにつながる。
本稿では,あいまいな感情を扱う3つの方法について検討する。
分類器にラベルを付けない発話を付加クラスとして組み込むことで、他の感情クラスの分類性能が低下することを示す。
また,明快な深層学習を用いた感情分類における不確実性を定量化することにより,不明瞭な感情を伴う発話を領域外サンプルとして検出することを提案する。
論文 参考訳(メタデータ) (2024-02-20T09:53:38Z) - Towards Assumption-free Bias Mitigation [47.5131072745805]
本稿では,バイアス緩和のための特徴相互作用をモデル化することにより,関連する属性を自動的に検出する仮定フリーフレームワークを提案する。
4つの実世界のデータセットに対する実験結果から,提案手法が不公平な予測行動を著しく軽減できることが示された。
論文 参考訳(メタデータ) (2023-07-09T05:55:25Z) - Distribution-based Emotion Recognition in Conversation [17.26466867595571]
本稿では,感情分布推定のためのシーケンス・ツー・シーケンス問題としてERCを定式化する分布ベースフレームワークを提案する。
IEMOCAPデータセットの実験結果から,ERCは単一発話ベースシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-11-09T12:16:28Z) - Label Uncertainty Modeling and Prediction for Speech Emotion Recognition
using t-Distributions [15.16865739526702]
本稿では,学生のt分布を用いたラベル分布のモデル化を提案する。
我々は、対応するKulback-Leibler分散に基づく損失関数を導出し、感情ラベルの分布を推定するための推定器を訓練する。
その結果,我々のt分布に基づくアプローチは,最先端の不確実性モデリングの結果を伴うガウス的アプローチよりも改善されていることが明らかとなった。
論文 参考訳(メタデータ) (2022-07-25T12:38:20Z) - Seeking Subjectivity in Visual Emotion Distribution Learning [93.96205258496697]
視覚感情分析(VEA)は、人々の感情を異なる視覚刺激に向けて予測することを目的としている。
既存の手法では、集団投票プロセスにおいて固有の主観性を無視して、統合されたネットワークにおける視覚的感情分布を予測することが多い。
視覚的感情分布の主観性を調べるために,新しいテキストサブジェクティビティ評価ネットワーク(SAMNet)を提案する。
論文 参考訳(メタデータ) (2022-07-25T02:20:03Z) - Estimating the Uncertainty in Emotion Class Labels with
Utterance-Specific Dirichlet Priors [24.365876333182207]
本稿では,発話ごとのディリクレの事前分布に基づく新たな訓練損失を提案する。
ラベル付けの不確かさの高い試験発話を検出することで、さらなる測定値を用いて性能を評価する。
広く使われているIEMOCAPデータセットによる実験は、2分岐構造が最先端の分類結果を達成することを示した。
論文 参考訳(メタデータ) (2022-03-08T23:30:01Z) - End-to-end label uncertainty modeling for speech emotion recognition
using Bayesian neural networks [16.708069984516964]
感情に固有の主観性を捉えるために,エンド・ツー・エンドのベイズニューラルネットワークアーキテクチャを導入する。
トレーニングにおいて、ネットワークは、主観的感情アノテーションに関連する本質的な不確実性を捉えるために、重みの分布を学習する。
AVEC'16感情認識データセットに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2021-10-07T09:34:28Z) - Label Distribution Amendment with Emotional Semantic Correlations for
Facial Expression Recognition [69.18918567657757]
意味空間における表現間の相関を利用して,各顔画像のラベル分布を補正する手法を提案する。
各画像のセマンティックグラフとタスククラス関連グラフを比較することにより、そのラベル分布の信頼性を評価する。
実験により,提案手法は最先端手法と比較した場合よりも有効であることが示された。
論文 参考訳(メタデータ) (2021-07-23T07:46:14Z) - A Circular-Structured Representation for Visual Emotion Distribution
Learning [82.89776298753661]
視覚的感情分布学習に先立つ知識を活用するために,身近な円形構造表現を提案する。
具体的には、まず感情圏を構築し、その内にある感情状態を統一する。
提案した感情圏では、各感情分布は3つの属性で定義される感情ベクトルで表される。
論文 参考訳(メタデータ) (2021-06-23T14:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。