論文の概要: A Trustworthy Method for Multimodal Emotion Recognition
- arxiv url: http://arxiv.org/abs/2508.07625v1
- Date: Mon, 11 Aug 2025 05:08:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.949396
- Title: A Trustworthy Method for Multimodal Emotion Recognition
- Title(参考訳): マルチモーダル感情認識のための信頼できる方法
- Authors: Junxiao Xue, Xiaozhen Liu, Jie Wang, Xuecheng Wu, Bin Wu,
- Abstract要約: 信頼感情認識(TER)と呼ばれる新しい感情認識手法を提案する。
TERは、信頼度値に基づいて複数のモダリティの結果を組み合わせて、信頼された予測を出力する。
TERは、ミュージックビデオで最先端のパフォーマンスを達成し、82.40%のAccを達成した。
- 参考スコア(独自算出の注目度): 5.249683572771824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing emotion recognition methods mainly focus on enhancing performance by employing complex deep models, typically resulting in significantly higher model complexity. Although effective, it is also crucial to ensure the reliability of the final decision, especially for noisy, corrupted and out-of-distribution data. To this end, we propose a novel emotion recognition method called trusted emotion recognition (TER), which utilizes uncertainty estimation to calculate the confidence value of predictions. TER combines the results from multiple modalities based on their confidence values to output the trusted predictions. We also provide a new evaluation criterion to assess the reliability of predictions. Specifically, we incorporate trusted precision and trusted recall to determine the trusted threshold and formulate the trusted Acc. and trusted F1 score to evaluate the model's trusted performance. The proposed framework combines the confidence module that accordingly endows the model with reliability and robustness against possible noise or corruption. The extensive experimental results validate the effectiveness of our proposed model. The TER achieves state-of-the-art performance on the Music-video, achieving 82.40% Acc. In terms of trusted performance, TER outperforms other methods on the IEMOCAP and Music-video, achieving trusted F1 scores of 0.7511 and 0.9035, respectively.
- Abstract(参考訳): 既存の感情認識手法は、主に複雑な深層モデルを用いて性能を向上させることに重点を置いており、典型的にはモデルの複雑さが著しく高くなる。
効果はあるものの、最終決定の信頼性、特にノイズ、腐敗、アウト・オブ・ディストリビューションデータの信頼性を確保することは重要である。
そこで本研究では,不確実性推定を利用して予測の信頼度を算出する,信頼感情認識(TER)と呼ばれる新しい感情認識手法を提案する。
TERは、信頼度値に基づいて複数のモダリティの結果を組み合わせて、信頼された予測を出力する。
また,予測の信頼性を評価するための新たな評価基準も提供する。
具体的には、信頼された精度と信頼されたリコールを組み込んで、信頼されたしきい値を決定し、信頼されたAccを定式化する。
信頼されたF1スコアを使用して、モデルの信頼されたパフォーマンスを評価する。
提案するフレームワークは、信頼性モジュールを組み合わさって、モデルにノイズや破損の可能性に対して信頼性と堅牢性を付与する。
提案手法の有効性を実験的に検証した。
TERは、ミュージックビデオで最先端のパフォーマンスを達成し、82.40%のAccを達成した。
信頼できるパフォーマンスの面では、TERはIEMOCAPとミュージックビデオの他の手法よりも優れており、信頼されたF1スコアはそれぞれ0.7511と0.9035である。
関連論文リスト
- Language Models Prefer What They Know: Relative Confidence Estimation via Confidence Preferences [62.52739672949452]
言語モデル(LM)は、ユーザーがアウトプットの誤りを検知し、必要であれば人間の専門家に延期するのに役立つ、信頼性の高い信頼推定を提供する必要がある。
本稿では,相対的信頼度推定法を提案する。そこでは,相互に質問をマッチングし,モデルに信頼度を相対的に判断するよう求める。
各質問を、他の質問に対する「プレイヤー」として扱い、モデルの選好を一致結果として扱うことで、モデルの信頼性選好を信頼スコアに変換するために、Elo評価やBradley-Terryのようなランクアグリゲーション手法を使うことができる。
論文 参考訳(メタデータ) (2025-02-03T07:43:27Z) - Confidence Under the Hood: An Investigation into the Confidence-Probability Alignment in Large Language Models [14.5291643644017]
信頼性・確率アライメントの概念を紹介します。
モデルの内部と信頼感の一致を調査する。
分析したモデルのうち、OpenAIのGPT-4は信頼性と信頼性のアライメントが最強であった。
論文 参考訳(メタデータ) (2024-05-25T15:42:04Z) - A Confidence-based Partial Label Learning Model for Crowd-Annotated
Named Entity Recognition [74.79785063365289]
名前付きエンティティ認識(NER)のための既存のモデルは、主に大規模ラベル付きデータセットに基づいている。
我々は,クラウドアノテートNERに対する先行信頼度(アノテータによる提案)と後続信頼度(モデルによる学習)を統合するために,信頼に基づく部分ラベル学習(CPLL)手法を提案する。
論文 参考訳(メタデータ) (2023-05-21T15:31:23Z) - Trust, but Verify: Using Self-Supervised Probing to Improve
Trustworthiness [29.320691367586004]
我々は、訓練されたモデルに対する自信の過剰な問題をチェックおよび緩和することのできる、自己教師型探索の新しいアプローチを導入する。
既存の信頼性関連手法に対して,プラグイン・アンド・プレイ方式で柔軟に適用可能な,シンプルで効果的なフレームワークを提供する。
論文 参考訳(メタデータ) (2023-02-06T08:57:20Z) - Reliability-Aware Prediction via Uncertainty Learning for Person Image
Retrieval [51.83967175585896]
UALは、データ不確実性とモデル不確実性を同時に考慮し、信頼性に配慮した予測を提供することを目的としている。
データ不確実性はサンプル固有のノイズを捕捉する」一方、モデル不確実性はサンプルの予測に対するモデルの信頼を表現している。
論文 参考訳(メタデータ) (2022-10-24T17:53:20Z) - An evaluation of word-level confidence estimation for end-to-end
automatic speech recognition [70.61280174637913]
エンドツーエンド自動音声認識(ASR)における信頼度推定の検討
4つのよく知られた音声データセットにおける信頼度手法の広範なベンチマークを提供する。
以上の結果から,ロジットを学習温度でスケーリングすることで,強いベースラインが得られることが示唆された。
論文 参考訳(メタデータ) (2021-01-14T09:51:59Z) - Uncertainty-sensitive Activity Recognition: a Reliability Benchmark and
the CARING Models [37.60817779613977]
本稿では,現代の行動認識アーキテクチャの信頼度が,正しい結果の確率を反映していることを示す最初の研究を行う。
新たなキャリブレーションネットワークを通じて、モデル出力を現実的な信頼性推定に変換する新しいアプローチを紹介します。
論文 参考訳(メタデータ) (2021-01-02T15:41:21Z) - Binary Classification from Positive Data with Skewed Confidence [85.18941440826309]
肯定的信頼度(Pconf)分類は、有望な弱教師付き学習法である。
実際には、信頼はアノテーションプロセスで生じるバイアスによって歪められることがある。
本稿では、スキュード信頼度のパラメータ化モデルを導入し、ハイパーパラメータを選択する方法を提案する。
論文 参考訳(メタデータ) (2020-01-29T00:04:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。