論文の概要: ArmanEmo: A Persian Dataset for Text-based Emotion Detection
- arxiv url: http://arxiv.org/abs/2207.11808v1
- Date: Sun, 24 Jul 2022 20:35:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-26 13:17:59.826809
- Title: ArmanEmo: A Persian Dataset for Text-based Emotion Detection
- Title(参考訳): ArmanEmo: テキストベースの感情検出のためのペルシャのデータセット
- Authors: Hossein Mirzaee (1), Javad Peymanfard (2), Hamid Habibzadeh Moshtaghin
(3), Hossein Zeinali (1) ((1) Amirkabir University of Technology, (2) Iran
University of Science and Technology, (3) Allameh Tabataba'i University)
- Abstract要約: ArmanEmoは、7000以上のペルシア語の文を7つのカテゴリに分類した人間ラベル付きデータセットである。
ラベルはエックマンの6つの基本的な感情に基づいている。
我々の最良のモデルは、テストデータセット全体で平均75.39パーセントのマクロ平均F1スコアを達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: With the recent proliferation of open textual data on social media platforms,
Emotion Detection (ED) from Text has received more attention over the past
years. It has many applications, especially for businesses and online service
providers, where emotion detection techniques can help them make informed
commercial decisions by analyzing customers/users' feelings towards their
products and services. In this study, we introduce ArmanEmo, a human-labeled
emotion dataset of more than 7000 Persian sentences labeled for seven
categories. The dataset has been collected from different resources, including
Twitter, Instagram, and Digikala (an Iranian e-commerce company) comments.
Labels are based on Ekman's six basic emotions (Anger, Fear, Happiness, Hatred,
Sadness, Wonder) and another category (Other) to consider any other emotion not
included in Ekman's model. Along with the dataset, we have provided several
baseline models for emotion classification focusing on the state-of-the-art
transformer-based language models. Our best model achieves a macro-averaged F1
score of 75.39 percent across our test dataset. Moreover, we also conduct
transfer learning experiments to compare our proposed dataset's generalization
against other Persian emotion datasets. Results of these experiments suggest
that our dataset has superior generalizability among the existing Persian
emotion datasets. ArmanEmo is publicly available for non-commercial use at
https://github.com/Arman-Rayan-Sharif/arman-text-emotion.
- Abstract(参考訳): 近年,ソーシャルメディアプラットフォーム上でのオープンテキストデータの増加に伴い,テキストからの感情検出(ED)が近年注目されている。
企業やオンラインサービスプロバイダなど、多くのアプリケーションがあり、顧客やユーザの製品やサービスに対する感情を分析することで、感情検出技術が商業的な意思決定に役立ちます。
本研究では,7つのカテゴリでラベル付けされた7000以上のペルシャ文の感情データセットであるarmanemoについて紹介する。
データセットはTwitter、Instagram、Digikala(イランのeコマース企業)のコメントなど、さまざまなリソースから収集されている。
レーベルは、エクマンの6つの基本的な感情(アンガー、恐怖、幸福、憎しみ、悲しみ、不思議)と他のカテゴリー(他の)に基づいて、エクマンのモデルに含まれない他の感情を検討する。
データセットとともに、最先端のトランスフォーマーベースの言語モデルに注目した感情分類のベースラインモデルをいくつか提供した。
我々の最良のモデルは、テストデータセット全体で平均75.39パーセントのマクロ平均F1スコアを達成する。
さらに,提案するデータセットの一般化を他のペルシャ感情データセットと比較するために,転送学習実験を行う。
これらの実験の結果,既存のペルシャ感情データセットよりもデータセットの一般化性が優れていることが示唆された。
armanemoは、https://github.com/arman-rayan-sharif/arman-text-emotionで非商用利用が可能。
関連論文リスト
- Emotion and Intent Joint Understanding in Multimodal Conversation: A Benchmarking Dataset [74.74686464187474]
Emotion and Intent Joint Understanding in Multimodal Conversation (MC-EIU)は、マルチモーダルな会話履歴に現れる意味情報をデコードすることを目的としている。
MC-EIUは多くのヒューマン・コンピュータ・インタフェースのテクノロジーを実現している。
MC-EIUデータセットは,7つの感情カテゴリー,9つの意図カテゴリ,3つのモダリティ,すなわちテキスト,音響,視覚的内容,および英語とマンダリンの2つの言語を特徴とする。
論文 参考訳(メタデータ) (2024-07-03T01:56:00Z) - Language Models (Mostly) Do Not Consider Emotion Triggers When Predicting Emotion [87.18073195745914]
人間の感情が感情の予測において有意であると考えられる特徴とどのように相関するかを検討する。
EmoTriggerを用いて、感情のトリガーを識別する大規模言語モデルの能力を評価する。
分析の結果、感情のトリガーは感情予測モデルにとって健全な特徴ではなく、様々な特徴と感情検出のタスクの間に複雑な相互作用があることが判明した。
論文 参考訳(メタデータ) (2023-11-16T06:20:13Z) - WEARS: Wearable Emotion AI with Real-time Sensor data [0.8740570557632509]
スマートウォッチセンサを用いてユーザの感情を予測するシステムを提案する。
英語と地域語を併用した動画をリアルタイムに収集する枠組みを設計する。
また、心拍数、加速度計、ジャイロセンサーデータなどの特徴が気分に与える影響について、アブレーション調査を行った。
論文 参考訳(メタデータ) (2023-08-22T11:03:00Z) - LEIA: Linguistic Embeddings for the Identification of Affect [0.23848027137382474]
我々は、600万以上の投稿のデータセットでトレーニングされたテキスト中の感情識別モデルであるLEIAを提示する。
LEIAは、モデル事前学習中の感情語の学習を強化する単語マスキング法に基づいている。
以上の結果から, LEIAは, 訓練対象領域を超えて, 怒り, 幸福, 悲しみの分類を一般化していることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-21T14:17:10Z) - Persian Emotion Detection using ParsBERT and Imbalanced Data Handling
Approaches [0.0]
EmoParsとArmanEmoは、ペルシャ語のための新しい人間のラベル付き感情データセットである。
EmoParsを評価し,ArmanEmoと比較した。
我々のモデルはArmanEmoとEmoParsでそれぞれ0.81と0.76のマクロ平均F1スコアに達する。
論文 参考訳(メタデータ) (2022-11-15T10:22:49Z) - MAFW: A Large-scale, Multi-modal, Compound Affective Database for
Dynamic Facial Expression Recognition in the Wild [56.61912265155151]
大規模複合感情データベースMAFWを提案する。
各クリップには、複雑な感情カテゴリーと、クリップ内の被験者の感情行動を記述する2つの文が注釈付けされている。
複合感情のアノテーションでは、それぞれのクリップは、怒り、嫌悪感、恐怖、幸福、中立、悲しみ、驚き、軽蔑、不安、無力感、失望など、広く使われている11の感情のうちの1つ以上に分類される。
論文 参考訳(メタデータ) (2022-08-01T13:34:33Z) - It is Okay to Not Be Okay: Overcoming Emotional Bias in Affective Image
Captioning by Contrastive Data Collection [22.209744124318966]
ArtEmisは最近、言語の説明とともに、画像に対する感情反応の大規模なデータセットとして紹介された。
その結果、訓練されたニューラルスピーカーは、表現不足の感情の記述において正確さを損なうことが判明した。
我々は、ArtEmisと新しい補完的データセットのバランスをとるために、対照的なデータ収集手法を提案する。
論文 参考訳(メタデータ) (2022-04-15T22:08:45Z) - Chat-Capsule: A Hierarchical Capsule for Dialog-level Emotion Analysis [70.98130990040228]
本稿では,発話レベルと対話レベルの両方の感情とその相互関係をモデル化したコンテキストベースの階層的注意カプセル(Chat-Capsule)モデルを提案する。
Eコマースプラットフォームの顧客サポートから収集したダイアログデータセットでは,ユーザの満足度や感情曲線のカテゴリも予測できる。
論文 参考訳(メタデータ) (2022-03-23T08:04:30Z) - Affective Image Content Analysis: Two Decades Review and New
Perspectives [132.889649256384]
我々は,過去20年間の情緒的イメージコンテンツ分析(AICA)の発展を包括的にレビューする。
我々は、感情的ギャップ、知覚主観性、ラベルノイズと欠如という3つの主要な課題に関して、最先端の手法に焦点を当てる。
画像の内容やコンテキスト理解,グループ感情クラスタリング,ビューアーとイメージのインタラクションなど,今後の課題や研究の方向性について論じる。
論文 参考訳(メタデータ) (2021-06-30T15:20:56Z) - A Circular-Structured Representation for Visual Emotion Distribution
Learning [82.89776298753661]
視覚的感情分布学習に先立つ知識を活用するために,身近な円形構造表現を提案する。
具体的には、まず感情圏を構築し、その内にある感情状態を統一する。
提案した感情圏では、各感情分布は3つの属性で定義される感情ベクトルで表される。
論文 参考訳(メタデータ) (2021-06-23T14:53:27Z) - GoEmotions: A Dataset of Fine-Grained Emotions [16.05879383442812]
GoEmotionsは、英語で58万件のRedditコメントを手動で注釈付けした最大のデータセットで、27の感情カテゴリまたはニュートラルにラベル付けされている。
BERTベースのモデルでは、提案された分類学で平均F1スコアの.46を達成し、改善の余地を多く残している。
論文 参考訳(メタデータ) (2020-05-01T18:00:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。