論文の概要: Bayesian Spectral Emotion Transition Discovery from Multi-Annotator Disagreement
- arxiv url: http://arxiv.org/abs/2606.01906v1
- Date: Mon, 01 Jun 2026 08:44:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:31.625989
- Title: Bayesian Spectral Emotion Transition Discovery from Multi-Annotator Disagreement
- Title(参考訳): マルチアノテータによるベイズスペクトル運動遷移の発見
- Authors: Keito Inoshita, Takato Ueno,
- Abstract要約: マルチラターソフトラベルから感情伝達構造を発見するための2段階のフレームワークを提案する。
5ソースのクロスコーパス検証では、英語の0.91-0.98、中国語のM3EDに対する0.79-0.85、人間のハードラベルとLLM仮想ソフトラベルの間の0.979のペアワイズピアソン相関が得られる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotions evolve through the dynamics of conversation, and understanding their transition structure is foundational to applications ranging from mental-health screening to dialogue systems. However, existing studies typically compress multi-rater judgments into a single hard label by majority voting, discarding the uncertainty signal needed to understand turn-to-turn transitions. In this article, we propose Bayesian Spectral Emotion Transition Discovery (BSETD), a two-stage framework that discovers emotion-transition structure from multi-rater soft labels. In the first stage, a hierarchical Dirichlet-Multinomial posterior is constructed through the outer product of soft labels, equipping each cell of the K x K transition matrix with a credible interval and Benjamini-Hochberg (BH) false discovery rate (FDR)-controlled significance. In the second stage, the symmetrized graph Laplacian is spectrally decomposed to separate a low-frequency (inertia) component from a high-frequency (contagion) component. On EmotionLines, BSETD simultaneously recovers the signatures of two distinct affective spaces: the Plutchik-adjacent transitions disgust to anger (log2 lift +0.94) and anger to disgust (+0.86) are over-represented, while the Russell-valence-reversed transitions joy to anger (-0.90) and anger to joy (-0.89) are under-represented. A five-source cross-corpus validation yields pairwise Pearson correlations in 0.91-0.98 within English, 0.79-0.85 against Chinese M3ED, and 0.979 between the human hard labels and the LLM virtual soft labels on the same utterance set, demonstrating that a pipeline preserving annotator uncertainty bridges the computational study of emotion dynamics with established psychological theory.
- Abstract(参考訳): 感情は会話のダイナミクスを通じて進化し、その遷移構造を理解することは、メンタルヘルススクリーニングから対話システムまで幅広い応用の基礎となる。
しかし、既存の研究は通常、多数決によってマルチラターの判断を1つのハードラベルに圧縮し、ターン・ツー・ターンの遷移を理解するために必要な不確実性信号を捨てる。
本稿では,BSETD (Bayesian Spectral Emotion Transition Discovery) を提案する。
第1段階では、ソフトラベルの外積によって階層的なディリクレ・マルティノミアル後部が構築され、KxK遷移行列の各セルを信頼的な間隔で、ベンジャミン・ホックバーグ(BH)の偽発見速度(FDR)が支配的な重要性を持つ。
第2段階では、対称性グラフラプラシアンはスペクトル的に分解され、高周波(感染)成分から低周波(慣性)成分を分離する。
EmotionLines では、BSETD は2つの異なる感情空間のシグネチャを同時に回復する: プルトチク・アジャセント遷移は怒りへの嫌悪感(log2 lift +0.94)、嫌悪感への怒り(+0.86)は過剰に表現され、Russell-valence-reversed transition は怒りへの喜び(-0.90)、喜びへの怒り(-0.89)は低表現である。
5ソースのクロスコーパス検証では、英語の0.91-0.98、中国語のM3EDに対する0.79-0.85、同じ発話セット上の人間のハードラベルとLLM仮想ソフトラベルの間の0.979のペアワイズピアソン相関が得られ、アノテータが不確実性を保持するパイプラインが、確立された心理学理論による感情力学の計算的研究を橋渡しすることを示した。
関連論文リスト
- EmoMind: Decoding Affective Captions from Human Brain fMRI [6.129853202144421]
本稿では,fMRI信号から直接情動キャプションを復号する最初のエンドツーエンドパイプラインであるEmoMindを紹介する。
EmoMindはまず、脳でデコードされた視覚的特徴からセマンティックな接地されたニュートラルシーンを検索し、同じfMRI記録からデコードされた34次元の感情ベクトルを用いて書き直します。
論文 参考訳(メタデータ) (2026-05-16T01:32:45Z) - A Hormone-inspired Emotion Layer for Transformer language models (HELT) [0.0]
生体にインスパイアされたHormone Emotionでトランスフォーマー言語モデルを強化する新しいアーキテクチャであるHormoneT5を紹介する。
ホルモンT5は許容閾値0.15でホルモン当たりの精度が85%以上、ホルモンの分化範囲は6つのホルモン全てで0.85以上である。
論文 参考訳(メタデータ) (2026-04-13T11:53:51Z) - ADEPT: RL-Aligned Agentic Decoding of Emotion via Evidence Probing Tools -- From Consensus Learning to Ambiguity-Driven Emotion Reasoning [67.22219034602514]
ADEPT(Agentic Decoding of Emotion via Evidence Probing Tools)は,感情認識をマルチターン探索プロセスとして再構成するフレームワークである。
ADEPTはSLLMを進化する候補感情を維持するエージェントに変換し、専用のセマンティックおよび音響探査ツールを適応的に呼び出す。
ADEPTは、ほとんどの設定において主感情の精度を向上し、微妙な感情の特徴を著しく改善することを示した。
論文 参考訳(メタデータ) (2026-02-13T08:33:37Z) - HeLo: Heterogeneous Multi-Modal Fusion with Label Correlation for Emotion Distribution Learning [25.95933218051548]
マルチモーダル感情分布学習フレームワークHeLoを提案し,多モーダル感情データにおける不均一性と相補的情報について検討する。
2つの公開データセットに対する実験結果から,感情分布学習における提案手法の優位性を示した。
論文 参考訳(メタデータ) (2025-07-09T13:08:58Z) - Disentangle Identity, Cooperate Emotion: Correlation-Aware Emotional Talking Portrait Generation [63.94836524433559]
DICE-Talkは、感情と同一性を切り離し、類似した特徴を持つ感情を協調するフレームワークである。
我々は、モーダル・アテンションを通して、音声と視覚の感情の手がかりを共同でモデル化するアンタングル型感情埋め込み装置を開発した。
次に,学習可能な感情バンクを用いた相関強化感情調和モジュールを提案する。
第3に、拡散過程における感情の一貫性を強制する感情識別目標を設計する。
論文 参考訳(メタデータ) (2025-04-25T05:28:21Z) - Two in One Go: Single-stage Emotion Recognition with Decoupled Subject-context Transformer [78.35816158511523]
単段階の感情認識手法として,DSCT(Decoupled Subject-Context Transformer)を用いる。
広範に使われている文脈認識型感情認識データセットであるCAER-SとEMOTICの単段階フレームワークの評価を行った。
論文 参考訳(メタデータ) (2024-04-26T07:30:32Z) - Label Distribution Amendment with Emotional Semantic Correlations for
Facial Expression Recognition [69.18918567657757]
意味空間における表現間の相関を利用して,各顔画像のラベル分布を補正する手法を提案する。
各画像のセマンティックグラフとタスククラス関連グラフを比較することにより、そのラベル分布の信頼性を評価する。
実験により,提案手法は最先端手法と比較した場合よりも有効であることが示された。
論文 参考訳(メタデータ) (2021-07-23T07:46:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。