論文の概要: I Understand How You Feel: Enhancing Deeper Emotional Support Through Multilingual Emotional Validation in Dialogue System
- arxiv url: http://arxiv.org/abs/2606.11875v1
- Date: Wed, 10 Jun 2026 09:59:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-11 16:42:38.400886
- Title: I Understand How You Feel: Enhancing Deeper Emotional Support Through Multilingual Emotional Validation in Dialogue System
- Title(参考訳): I Understand how you Feel: Enhancing Deep Emotional Support through Multilingual Emotional Validation in Dialogue System
- Authors: Zi Haur Pang, Yahui Fu, Koji Inoue, Tatsuya Kawahara,
- Abstract要約: 対話システムにおける感情検証は、(i)応答識別、(ii)検証タイミング検出、(iii)応答生成の検証に分解することができる。
我々は、120kの多言語コーパスであるM-EDESConvと、多言語音声対話テストセットであるM-TESCをリリースする。
タイミング検出のためのMEGUMIを提案する。XLM-RoBERTaセマンティクスと言語固有の感情エンコーダを相互注意とゲート融合により融合する。
- 参考スコア(独自算出の注目度): 21.395985445579797
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emotional validation - explicitly acknowledging that a user's feelings make sense - has proven therapeutic value but has received little computational attention. Emotional validation in dialogue systems can be decomposed into (i) validating response identification, (ii) validation timing detection, and (iii) validating response generation. To support research on all three subtasks, we release M-EDESConv, a 120k English-Japanese multilingual corpus created through hybrid manual and automatic annotation, and M-TESC, a multilingual spoken-dialogue test set. For timing detection, we propose MEGUMI, a Multilingual Emotion-aware Gated Unit for Mutual Integration, that fuses frozen XLM-RoBERTa semantics with language-specific emotion encoders via cross-modal attention and gated fusion. MEGUMI shows superior performance on both the M-EDESConv and M-TESC datasets, both objectively and subjectively. Finally, our EmoValidBench benchmarks of GPT-4.1 Nano and Llama-3.1 8B indicate that current LLMs generate contextually similar and diverse validating responses, but emotional understanding remains a major area for improvement. Project page: https://github.com/zihaurpang/Multilingual-Emotional-Validation
- Abstract(参考訳): 感情的検証 (Emotional Validation) - ユーザの感情が理にかなっていることを明示的に認識する - は治療的価値を証明しているが、ほとんど計算的注意を払わなかった。
対話システムにおける感情検証は分解できる
(i)応答識別の検証
(二)検証タイミング検出、及び
三 応答生成の検証
3つのサブタスクすべてを対象とした研究を支援するため,M-EDESConv,120kの日英多言語コーパスをハイブリッドマニュアルと自動アノテーションで作成し,M-TESC,多言語音声対話テストセットを作成した。
タイミング検出のために,Multilingual Emotion-aware Gated Unit for Mutual Integrationを提案する。
MEGUMIは、M-EDESConvデータセットとM-TESCデータセットの両方において、客観的かつ主観的に優れたパフォーマンスを示す。
最後に、GPT-4.1 Nano と Llama-3.1 8B の EmoValidBench ベンチマークは、現在の LLM が文脈的に類似し、多様なバリデーション応答を生成することを示している。
プロジェクトページ:https://github.com/zihaurpang/Multilingual-Emotional-Validation
関連論文リスト
- VoxEmo: Benchmarking Speech Emotion Recognition with Speech LLMs [54.75016325571445]
音声大言語モデル (LLM) は, 音声の感情認識において, 生成インタフェースを介する大きな可能性を示す。
クローズドセットからオープンテキスト生成へのシフトは、ゼロショット性を導入し、プロンプトに非常に敏感な評価を与える。
本稿では,VoxEmoについて紹介する。VoxEmoは音声LLMのための15言語に35の感情コーパスを含む総合的なSERベンチマークである。
論文 参考訳(メタデータ) (2026-03-09T21:10:34Z) - Emotion-LLaMAv2 and MMEVerse: A New Framework and Benchmark for Multimodal Emotion Understanding [45.13650362585136]
Emotion-LLaMAv2 と MMEVerse のベンチマークを行い、感情認識と推論のための標準化された評価設定とともにエンドツーエンドのパイプラインを構築した。
エンドツーエンドのマルチビューエンコーダは、外部顔検出を排除し、よりリッチな空間的および時間的マルチビュートークンを介して、ニュアンス化された感情的手がかりをキャプチャする。
LLaMA2バックボーン内における認識と認識のカリキュラムのチューニングスキームは、感情認識と自由形式の感情推論を統一する。
論文 参考訳(メタデータ) (2026-01-23T05:02:43Z) - EM2LDL: A Multilingual Speech Corpus for Mixed Emotion Recognition through Label Distribution Learning [43.19985438293247]
本研究では,ラベル分布学習による混合感情認識の促進を目的とした多言語音声コーパスEM2LDLを提案する。
EM2LDLは、英語、マンダリン、カントン語で表現的な発声を含んでおり、香港やマカオなど多言語圏で広く使われている発声のコードスイッチングを捉えている。
論文 参考訳(メタデータ) (2025-11-25T09:26:15Z) - MME-Emotion: A Holistic Evaluation Benchmark for Emotional Intelligence in Multimodal Large Language Models [108.61337743051483]
MME-Emotionは,MLLMの感情的理解と推論能力の両方を評価するシステムベンチマークである。
MME-Emotionには6000以上のキュレートされたビデオクリップとタスク固有の質問回答(QA)ペアが含まれており、8つの感情的なタスクを定式化するための広いシナリオにまたがっている。
マルチエージェントシステムフレームワークを通じて分析された、感情認識と推論のためのハイブリッドメトリクスを備えた総合評価スイートが組み込まれている。
論文 参考訳(メタデータ) (2025-08-11T03:14:55Z) - MIKU-PAL: An Automated and Standardized Multi-Modal Method for Speech Paralinguistic and Affect Labeling [0.0]
本稿では、ラベルなしビデオデータから高一貫性の感情音声を抽出する完全自動マルチモーダルパイプラインMIKU-PALを提案する。
以上の結果から,MIKU-PALは人間レベルの精度(MELDでは68.5%)と優れた一貫性(0.93Fleiss kappaスコア)を達成できることが示された。
さらに,感情的テキスト音声と視覚的音声のクローニングのための新しいベンチマークとして,微粒な感情音声データセットMIKU-EmoBench(131.2時間)をリリースした。
論文 参考訳(メタデータ) (2025-05-21T17:23:12Z) - JNLP at SemEval-2025 Task 11: Cross-Lingual Multi-Label Emotion Detection Using Generative Models [3.1605924602008373]
本研究では,SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detectionについて述べる。
本研究は,(1)トラックA:マルチラベル感情検出,(2)トラックB:感情強度の2つのサブトラックに焦点を当てた。
入力を対応する感情ラベルに直接マッピングするベースメソッドと、入力テキストと各感情カテゴリの関係を個別にモデル化するペアワイズ手法の2つの方法を提案する。
論文 参考訳(メタデータ) (2025-05-19T15:24:53Z) - VAEmo: Efficient Representation Learning for Visual-Audio Emotion with Knowledge Injection [50.57849622045192]
本稿では,外部知識注入を用いた感情中心型VA表現学習のための効率的なフレームワークであるVAEmoを提案する。
VAEmoは、コンパクトな設計で最先端のパフォーマンスを実現し、統合されたクロスモーダルエンコーディングと感情認識のセマンティックガイダンスの利点を強調している。
論文 参考訳(メタデータ) (2025-05-05T03:00:51Z) - UMETTS: A Unified Framework for Emotional Text-to-Speech Synthesis with Multimodal Prompts [64.02363948840333]
UMETTSは、複数のモーダルからの感情的手がかりを利用して、表現力が高く感情的に共鳴する音声を生成する新しいフレームワークである。
EP-Alignは対照的な学習を用いて、テキスト、オーディオ、視覚的モダリティをまたいだ感情的特徴を整合させ、マルチモーダル情報のコヒーレントな融合を保証する。
EMI-TTSは、アライメントされた感情埋め込みと最先端のTSモデルを統合し、意図した感情を正確に反映した音声を合成する。
論文 参考訳(メタデータ) (2024-04-29T03:19:39Z) - Acknowledgment of Emotional States: Generating Validating Responses for
Empathetic Dialogue [21.621844911228315]
本研究は,共感的対話を有効活用するための最初の枠組みを紹介する。
本手法では,1)検証タイミング検出,2)ユーザの感情状態の同定,3)応答生成の検証を行う。
論文 参考訳(メタデータ) (2024-02-20T07:20:03Z) - EmoBench: Evaluating the Emotional Intelligence of Large Language Models [73.60839120040887]
EmoBenchは、確立された心理学理論に基づいて、マシン感情知能(EI)の包括的な定義を提案するベンチマークである。
EmoBenchには、英語と中国語で400の手作りの質問が含まれている。
以上の結果から,既存の大規模言語モデルのEIと平均的な人間の間には,かなりのギャップがみられ,今後の研究に向けての有望な方向性が浮かび上がっている。
論文 参考訳(メタデータ) (2024-02-19T11:48:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。