論文の概要: M-MELD: A Multilingual Multi-Party Dataset for Emotion Recognition in
Conversations
- arxiv url: http://arxiv.org/abs/2203.16799v4
- Date: Fri, 31 Mar 2023 13:25:05 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-03 17:35:56.217407
- Title: M-MELD: A Multilingual Multi-Party Dataset for Emotion Recognition in
Conversations
- Title(参考訳): M-MELD:会話における感情認識のための多言語多人数データセット
- Authors: Sreyan Ghosh and S Ramaneswaran and Utkarsh Tyagi and Harshvardhan
Srivastava and Samden Lepcha and S Sakshi and Dinesh Manocha
- Abstract要約: 会話における感情認識(英: Emotion Recognition in conversation、ERC)は、会話における各発話の背後にある感情を識別する研究分野である。
我々は、Multilingual MELD(M-MELD)を紹介し、Multimodal EmotionLinesデータセット(MELD)を英語以外の4言語に拡張する。
また,ERCのための対話対話において,逐次的・対話的な会話コンテキストを利用する新しいアーキテクチャであるDisdisLSTMを提案する。
- 参考スコア(独自算出の注目度): 42.512843360461886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Expression of emotions is a crucial part of daily human communication.
Emotion recognition in conversations (ERC) is an emerging field of study, where
the primary task is to identify the emotion behind each utterance in a
conversation. Though a lot of work has been done on ERC in the past, these
works only focus on ERC in the English language, thereby ignoring any other
languages. In this paper, we present Multilingual MELD (M-MELD), where we
extend the Multimodal EmotionLines Dataset (MELD) \cite{poria2018meld} to 4
other languages beyond English, namely Greek, Polish, French, and Spanish.
Beyond just establishing strong baselines for all of these 4 languages, we also
propose a novel architecture, DiscLSTM, that uses both sequential and
conversational discourse context in a conversational dialogue for ERC. Our
proposed approach is computationally efficient, can transfer across languages
using just a cross-lingual encoder, and achieves better performance than most
uni-modal text approaches in the literature on both MELD and M-MELD. We make
our data and code publicly on GitHub.
- Abstract(参考訳): 感情の表現は人間の日常コミュニケーションの重要な部分である。
会話における感情認識(英: Emotion Recognition in conversation、ERC)は、会話における各発話の背後にある感情を識別する研究分野である。
ercでは過去に多くの作業が行われているが、これらの作業は英語でのercのみに焦点を当てており、他の言語を無視している。
本稿では,Multilingual MELD (M-MELD)を紹介し,Multimodal EmotionLines Dataset (MELD) \cite{poria2018meld} を英語以外の4言語(ギリシャ語,ポーランド語,フランス語,スペイン語)に拡張する。
これら4言語すべてに対して強力なベースラインを確立するだけでなく、ERCの対話対話における逐次的・対話的会話コンテキストを利用する新しいアーキテクチャであるCDLSTMも提案する。
提案手法は計算効率が高く,言語間エンコーダのみを用いて言語間を移動可能であり,MELD と M-MELD の両方の文献において,ほとんどのユニモーダルテキストアプローチよりも優れた性能を実現する。
データとコードをGitHubで公開しています。
関連論文リスト
- Evaluating Dialect Robustness of Language Models via Conversation Understanding [3.2047868962340327]
私たちはタブーの言葉遊びをする人間の間での英語(アメリカ英語またはインド英語)の会話を使います。」
目的語予測(TWP)と目標語選択(TWS)の2つの評価課題を定式化する。
M-MD3 は USEng と IndEng のサブセットを持つ MD3 のターゲットワードマス化バージョンである。
AIGen と AITrans で行った結果から,LLM はトレーニングデータの構成に基づいて独自の方言を学ぶことができ,方言の堅牢性は確かに困難な課題であることがわかった。
論文 参考訳(メタデータ) (2024-05-09T11:38:23Z) - How do Large Language Models Handle Multilingualism? [87.06210331315451]
大規模言語モデル(LLM)は、様々な言語で顕著な性能を示す。
LLMの多言語入力処理を記述したフレームワークを提案する。
さらに,特定の言語処理における言語特異的ニューロンの存在について検討する。
論文 参考訳(メタデータ) (2024-02-29T02:55:26Z) - CLARA: Multilingual Contrastive Learning for Audio Representation
Acquisition [5.520654376217889]
CLARAはラベル付きデータへの依存を最小限に抑え、言語間の一般化を強化する。
我々のアプローチは、主観的評価問題を克服し、音声における感情的ニュアンスを十分に捉えている。
低リソース言語に適応し、多言語音声表現学習の進歩を示す。
論文 参考訳(メタデータ) (2023-10-18T09:31:56Z) - LVP-M3: Language-aware Visual Prompt for Multilingual Multimodal Machine
Translation [94.33019040320507]
マルチモーダル機械翻訳(MMT)は、視覚的特徴を持つテキストのみの翻訳を強化することに焦点を当てている。
最近の進歩は、各言語ペアごとに別々のモデルをトレーニングすることに苦慮している。
7つの言語をカバーする2つのMultilingual MMTベンチマークデータセットを確立することで,Multilingual MMTタスクを提案する。
論文 参考訳(メタデータ) (2022-10-19T12:21:39Z) - Multi2WOZ: A Robust Multilingual Dataset and Conversational Pretraining
for Task-Oriented Dialog [67.20796950016735]
Multi2WOZデータセットは、中国語、ドイツ語、アラビア語、ロシア語の4つの言語にまたがる。
本稿では,任意の下流TODタスクに対する言語間移動を容易にすることを目的とした,事前学習言語モデル(PrLM)の多言語会話特化のための新しいフレームワークを提案する。
実験の結果,目標言語における(I)会話の特殊化と,(II)具体的なTODタスクのための少数ショット転送の組み合わせが,ほとんどの場合,最高の性能を示すことがわかった。
論文 参考訳(メタデータ) (2022-05-20T18:35:38Z) - Challenges and Considerations with Code-Mixed NLP for Multilingual
Societies [1.6675267471157407]
本稿では,NLP研究の現状,限界,予測可能な落とし穴について論じる。
また,社会福祉のための多言語NLPアプリケーションにおける現在の研究を著しく進めることができる未来的データセット,モデル,ツールも提案する。
論文 参考訳(メタデータ) (2021-06-15T00:53:55Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z) - FILTER: An Enhanced Fusion Method for Cross-lingual Language
Understanding [85.29270319872597]
我々は,XLMファインタニングの入力として言語間データを利用する拡張融合法を提案する。
推論中は、ターゲット言語で入力されたテキストとソース言語の翻訳に基づいて予測を行う。
この問題に対処するため,対象言語における翻訳テキストのための自動生成ソフト擬似ラベルに基づくモデル学習のためのKL分割自己学習損失を提案する。
論文 参考訳(メタデータ) (2020-09-10T22:42:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。