論文の概要: M-MELD: A Multilingual Multi-Party Dataset for Emotion Recognition in
Conversations
- arxiv url: http://arxiv.org/abs/2203.16799v4
- Date: Fri, 31 Mar 2023 13:25:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 17:35:56.217407
- Title: M-MELD: A Multilingual Multi-Party Dataset for Emotion Recognition in
Conversations
- Title(参考訳): M-MELD:会話における感情認識のための多言語多人数データセット
- Authors: Sreyan Ghosh and S Ramaneswaran and Utkarsh Tyagi and Harshvardhan
Srivastava and Samden Lepcha and S Sakshi and Dinesh Manocha
- Abstract要約: 会話における感情認識(英: Emotion Recognition in conversation、ERC)は、会話における各発話の背後にある感情を識別する研究分野である。
我々は、Multilingual MELD(M-MELD)を紹介し、Multimodal EmotionLinesデータセット(MELD)を英語以外の4言語に拡張する。
また,ERCのための対話対話において,逐次的・対話的な会話コンテキストを利用する新しいアーキテクチャであるDisdisLSTMを提案する。
- 参考スコア(独自算出の注目度): 42.512843360461886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Expression of emotions is a crucial part of daily human communication.
Emotion recognition in conversations (ERC) is an emerging field of study, where
the primary task is to identify the emotion behind each utterance in a
conversation. Though a lot of work has been done on ERC in the past, these
works only focus on ERC in the English language, thereby ignoring any other
languages. In this paper, we present Multilingual MELD (M-MELD), where we
extend the Multimodal EmotionLines Dataset (MELD) \cite{poria2018meld} to 4
other languages beyond English, namely Greek, Polish, French, and Spanish.
Beyond just establishing strong baselines for all of these 4 languages, we also
propose a novel architecture, DiscLSTM, that uses both sequential and
conversational discourse context in a conversational dialogue for ERC. Our
proposed approach is computationally efficient, can transfer across languages
using just a cross-lingual encoder, and achieves better performance than most
uni-modal text approaches in the literature on both MELD and M-MELD. We make
our data and code publicly on GitHub.
- Abstract(参考訳): 感情の表現は人間の日常コミュニケーションの重要な部分である。
会話における感情認識(英: Emotion Recognition in conversation、ERC)は、会話における各発話の背後にある感情を識別する研究分野である。
ercでは過去に多くの作業が行われているが、これらの作業は英語でのercのみに焦点を当てており、他の言語を無視している。
本稿では,Multilingual MELD (M-MELD)を紹介し,Multimodal EmotionLines Dataset (MELD) \cite{poria2018meld} を英語以外の4言語(ギリシャ語,ポーランド語,フランス語,スペイン語)に拡張する。
これら4言語すべてに対して強力なベースラインを確立するだけでなく、ERCの対話対話における逐次的・対話的会話コンテキストを利用する新しいアーキテクチャであるCDLSTMも提案する。
提案手法は計算効率が高く,言語間エンコーダのみを用いて言語間を移動可能であり,MELD と M-MELD の両方の文献において,ほとんどのユニモーダルテキストアプローチよりも優れた性能を実現する。
データとコードをGitHubで公開しています。
関連論文リスト
- BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages [93.92804151830744]
BRIGHTERは28の言語で感情アノテートされたデータセットの集合である。
データ収集とアノテーションプロセスとこれらのデータセット構築の課題について説明する。
BRIGHTERデータセットは、テキストベースの感情認識のギャップを埋めるためのステップであることを示す。
論文 参考訳(メタデータ) (2025-02-17T15:39:50Z) - Akan Cinematic Emotions (ACE): A Multimodal Multi-party Dataset for Emotion Recognition in Movie Dialogues [4.894647740789939]
アカン会話感情データセット(Akan Conversation Emotion dataset)は、アフリカ語における最初のマルチモーダル感情対話データセットである。
385の感情ラベル付き対話と6,162の発話が音声、視覚、テキストのモダリティにわたって含まれている。
このデータセットに韻律ラベルがあることは、最初の韻律的に注釈付けされたアフリカの言語データセットにもなった。
論文 参考訳(メタデータ) (2025-02-16T03:24:33Z) - Leveraging Cross-Attention Transformer and Multi-Feature Fusion for Cross-Linguistic Speech Emotion Recognition [60.58049741496505]
音声感情認識(SER)は、人間とコンピュータの相互作用を強化する上で重要な役割を担っている。
本稿では,HuBERT,MFCC,および韻律特性を組み合わせたHuMP-CATを提案する。
HMP-CATは、ターゲットデータセットから少量の音声でソースモデルを微調整することにより、平均78.75%の精度が得られることを示す。
論文 参考訳(メタデータ) (2025-01-06T14:31:25Z) - Evaluating the Capabilities of Large Language Models for Multi-label Emotion Understanding [20.581470997286146]
EthioEmoは、4つのエチオピア語に対するマルチラベル感情分類データセットである。
SemEval 2018 Task 1から追加の英語マルチラベル感情データセットで広範な実験を行う。
その結果,高精度なマルチラベル感情分類は,ハイソース言語においても依然として不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-12-17T07:42:39Z) - Parrot: Multilingual Visual Instruction Tuning [66.65963606552839]
視覚エンコーダとマルチモーダル大言語モデル(MLLM)の整合性に着目した既存手法
そこで本研究では,テキストガイダンスを用いて視覚的トークンアライメントを言語レベルで促進する新しい手法であるParrotを紹介する。
本手法は,多言語MMBenchおよびMMMB上での最先端性能を示すだけでなく,多モーダルタスクにも優れる。
論文 参考訳(メタデータ) (2024-06-04T17:56:28Z) - Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining
for Task-Oriented Dialog [67.20796950016735]
Multi2WOZデータセットは、中国語、ドイツ語、アラビア語、ロシア語の4つの言語にまたがる。
本稿では,任意の下流TODタスクに対する言語間移動を容易にすることを目的とした,事前学習言語モデル(PrLM)の多言語会話特化のための新しいフレームワークを提案する。
実験の結果,目標言語における(I)会話の特殊化と,(II)具体的なTODタスクのための少数ショット転送の組み合わせが,ほとんどの場合,最高の性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-05-20T18:35:38Z) - Challenges and Considerations with Code-Mixed NLP for Multilingual
Societies [1.6675267471157407]
本稿では,NLP研究の現状,限界,予測可能な落とし穴について論じる。
また,社会福祉のための多言語NLPアプリケーションにおける現在の研究を著しく進めることができる未来的データセット,モデル,ツールも提案する。
論文 参考訳(メタデータ) (2021-06-15T00:53:55Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。