論文の概要: Persian Emotion Detection using ParsBERT and Imbalanced Data Handling
Approaches
- arxiv url: http://arxiv.org/abs/2211.08029v2
- Date: Thu, 17 Nov 2022 12:13:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 12:50:09.929528
- Title: Persian Emotion Detection using ParsBERT and Imbalanced Data Handling
Approaches
- Title(参考訳): ParsBERTと不均衡データ処理手法を用いたペルシャ感情検出
- Authors: Amirhossein Abaskohi, Nazanin Sabri, Behnam Bahrak
- Abstract要約: EmoParsとArmanEmoは、ペルシャ語のための新しい人間のラベル付き感情データセットである。
EmoParsを評価し,ArmanEmoと比較した。
我々のモデルはArmanEmoとEmoParsでそれぞれ0.81と0.76のマクロ平均F1スコアに達する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Emotion recognition is one of the machine learning applications which can be
done using text, speech, or image data gathered from social media spaces.
Detecting emotion can help us in different fields, including opinion mining.
With the spread of social media, different platforms like Twitter have become
data sources, and the language used in these platforms is informal, making the
emotion detection task difficult. EmoPars and ArmanEmo are two new
human-labeled emotion datasets for the Persian language. These datasets,
especially EmoPars, are suffering from inequality between several samples
between two classes. In this paper, we evaluate EmoPars and compare them with
ArmanEmo. Throughout this analysis, we use data augmentation techniques, data
re-sampling, and class-weights with Transformer-based Pretrained Language
Models(PLMs) to handle the imbalance problem of these datasets. Moreover,
feature selection is used to enhance the models' performance by emphasizing the
text's specific features. In addition, we provide a new policy for selecting
data from EmoPars, which selects the high-confidence samples; as a result, the
model does not see samples that do not have specific emotion during training.
Our model reaches a Macro-averaged F1-score of 0.81 and 0.76 on ArmanEmo and
EmoPars, respectively, which are new state-of-the-art results in these
benchmarks.
- Abstract(参考訳): 感情認識は、ソーシャルメディア空間から収集したテキスト、音声、画像データを使って行うことができる機械学習アプリケーションの1つである。
感情を検出することは、意見マイニングなど、さまざまな分野で役立ちます。
ソーシャルメディアの普及に伴い、Twitterのようなさまざまなプラットフォームがデータソースとなり、これらのプラットフォームで使用される言語は非公式であり、感情検出作業が困難になっている。
EmoParsとArmanEmoは、ペルシャ語のための新しい人間のラベル付き感情データセットである。
これらのデータセット、特にエモパルは、2つのクラス間のいくつかのサンプル間の不平等に苦しんでいる。
本稿では,EmoParsを評価し,ArmanEmoと比較する。
この分析を通じて,データ拡張法,データ再サンプリング法,クラス重み付け法,トランスフォーマティブ型事前学習言語モデル(plms)を用いて,これらのデータセットの不均衡問題に対処する。
また、テキストの特徴を強調することで、モデルの性能を高めるために特徴選択が用いられる。
さらに,高信頼度サンプルを選択するEmoParsからデータを選択するための新しいポリシーを提供する。その結果,トレーニング中に特定の感情を持たないサンプルは見つからない。
このモデルでは,armanemo と emopars では,マクロ平均 f1-score が 0.81 と 0.76 に到達した。
関連論文リスト
- MEMO-Bench: A Multiple Benchmark for Text-to-Image and Multimodal Large Language Models on Human Emotion Analysis [53.012111671763776]
そこで本研究では、7,145枚の肖像画からなる総合的なベンチマークであるMEMO-Benchを紹介した。
以上の結果から,既存のT2Iモデルは負のモデルよりも肯定的な感情を生成するのに効果的であることが示唆された。
MLLMは人間の感情の識別と認識に一定の効果を示すが、人間のレベルの正確さには欠ける。
論文 参考訳(メタデータ) (2024-11-18T02:09:48Z) - Emotion Rendering for Conversational Speech Synthesis with Heterogeneous
Graph-Based Context Modeling [50.99252242917458]
会話音声合成(CSS)は,会話環境の中で適切な韻律と感情のインフレクションで発話を正確に表現することを目的としている。
データ不足の問題に対処するため、私たちはカテゴリと強度の点で感情的なラベルを慎重に作成します。
我々のモデルは感情の理解と表現においてベースラインモデルよりも優れています。
論文 参考訳(メタデータ) (2023-12-19T08:47:50Z) - Language Models (Mostly) Do Not Consider Emotion Triggers When Predicting Emotion [87.18073195745914]
人間の感情が感情の予測において有意であると考えられる特徴とどのように相関するかを検討する。
EmoTriggerを用いて、感情のトリガーを識別する大規模言語モデルの能力を評価する。
分析の結果、感情のトリガーは感情予測モデルにとって健全な特徴ではなく、様々な特徴と感情検出のタスクの間に複雑な相互作用があることが判明した。
論文 参考訳(メタデータ) (2023-11-16T06:20:13Z) - Data Augmentation for Emotion Detection in Small Imbalanced Text Data [0.0]
課題の1つは、感情で注釈付けされた利用可能なデータセットが不足していることだ。
我々は、小さな不均衡なデータセットに適用した場合に、データ拡張技術が与える影響を正確に調査した。
実験結果から,分類器モデルの訓練に拡張データを用いることで,大幅な改善が得られた。
論文 参考訳(メタデータ) (2023-10-25T21:29:36Z) - Reevaluating Data Partitioning for Emotion Detection in EmoWOZ [0.0]
EmoWozは、対話のための感情ラベルを提供するMultiWOZの拡張である。
MultiWOZは、当初別の目的のために分割され、新しい感情認識の目的を考えると、分布の変化が生じる。
この問題に対処し、データセットの分布を改善し、データセットシフトを減らすために、感情タグに基づく階層化サンプリング手法を提案する。
論文 参考訳(メタデータ) (2023-03-15T03:06:13Z) - Emotion Detection From Tweets Using a BERT and SVM Ensemble Model [0.0]
本稿では,感情認識のための支援ベクトルマシンとトランスフォーマーからの双方向表現について検討する。
2つのBERTモデルとSVMモデルを組み合わせた新しいアンサンブルモデルを提案する。
実験の結果,提案モデルでは,ツイート中の感情認識の精度が0.91であることがわかった。
論文 参考訳(メタデータ) (2022-08-09T05:32:29Z) - ArmanEmo: A Persian Dataset for Text-based Emotion Detection [0.0]
ArmanEmoは、7000以上のペルシア語の文を7つのカテゴリに分類した人間ラベル付きデータセットである。
ラベルはエックマンの6つの基本的な感情に基づいている。
我々の最良のモデルは、テストデータセット全体で平均75.39パーセントのマクロ平均F1スコアを達成する。
論文 参考訳(メタデータ) (2022-07-24T20:35:23Z) - DeepEmotex: Classifying Emotion in Text Messages using Deep Transfer
Learning [0.0]
テキスト中の感情を検出する効果的なシーケンシャルトランスファー学習法としてDeepEmotexを提案する。
キュレートされたTwitterデータセットとベンチマークデータセットの両方を用いて実験を行った。
DeepEmotexモデルは、テストデータセット上でのマルチクラスの感情分類において91%以上の精度を達成する。
論文 参考訳(メタデータ) (2022-06-12T03:23:40Z) - EMOVIE: A Mandarin Emotion Speech Dataset with a Simple Emotional
Text-to-Speech Model [56.75775793011719]
音声ファイルを含む9,724のサンプルとその感情ラベル付きアノテーションを含むマンダリン感情音声データセットを導入,公開する。
入力として追加の参照音声を必要とするこれらのモデルとは異なり、我々のモデルは入力テキストから直接感情ラベルを予測し、感情埋め込みに基づいてより表現力のある音声を生成することができる。
実験段階では、まず感情分類タスクによってデータセットの有効性を検証し、次に提案したデータセットに基づいてモデルをトレーニングし、一連の主観評価を行う。
論文 参考訳(メタデータ) (2021-06-17T08:34:21Z) - Affect2MM: Affective Analysis of Multimedia Content Using Emotion
Causality [84.69595956853908]
本稿では,マルチメディアコンテンツを対象とした時系列感情予測学習手法であるAffect2MMを提案する。
私たちの目標は、現実の人間中心の状況や行動でキャラクターが描く様々な感情を自動的に捉えることです。
論文 参考訳(メタデータ) (2021-03-11T09:07:25Z) - Modality-Transferable Emotion Embeddings for Low-Resource Multimodal
Emotion Recognition [55.44502358463217]
本稿では、上記の問題に対処するため、感情を埋め込んだモダリティ変換可能なモデルを提案する。
我々のモデルは感情カテゴリーのほとんどで最先端のパフォーマンスを達成する。
私たちのモデルは、目に見えない感情に対するゼロショットと少数ショットのシナリオにおいて、既存のベースラインよりも優れています。
論文 参考訳(メタデータ) (2020-09-21T06:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。