論文の概要: NepEMO: A Multi-Label Emotion and Sentiment Analysis on Nepali Reddit with Linguistic Insights and Temporal Trends
- arxiv url: http://arxiv.org/abs/2512.22823v1
- Date: Sun, 28 Dec 2025 07:27:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.241286
- Title: NepEMO: A Multi-Label Emotion and Sentiment Analysis on Nepali Reddit with Linguistic Insights and Temporal Trends
- Title(参考訳): NepEMO: ネパールのRedditにおける多ラベル感情・感情分析と言語的洞察と時間的傾向
- Authors: Sameer Sitoula, Tej Bahadur Shahi, Laxmi Prasad Bhatt, Anisha Pokhrel, Arjun Neupane,
- Abstract要約: ネパールのサブレディットポストにマルチラベル感情(MLE)と感情分類(SC)のための新しいデータセットNepEMOを提案する。
私たちは5つの感情のために、英語、ルーマニア語ネパール語、デバナガリ語の4,462件の注釈付きデータセットを手作業でキュレートし、構築します。
我々は、感情傾向、感情の共起、感情固有のn-gram、トピックモデリングなど、言語的な洞察を捉えるポストを詳細に分析する。
- 参考スコア(独自算出の注目度): 0.4077787659104315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media (SM) platforms (e.g. Facebook, Twitter, and Reddit) are increasingly leveraged to share opinions and emotions, specifically during challenging events, such as natural disasters, pandemics, and political elections, and joyful occasions like festivals and celebrations. Among the SM platforms, Reddit provides a unique space for its users to anonymously express their experiences and thoughts on sensitive issues such as health and daily life. In this work, we present a novel dataset, called NepEMO, for multi-label emotion (MLE) and sentiment classification (SC) on the Nepali subreddit post. We curate and build a manually annotated dataset of 4,462 posts (January 2019- June 2025) written in English, Romanised Nepali and Devanagari script for five emotions (fear, anger, sadness, joy, and depression) and three sentiment classes (positive, negative, and neutral). We perform a detailed analysis of posts to capture linguistic insights, including emotion trends, co-occurrence of emotions, sentiment-specific n-grams, and topic modelling using Latent Dirichlet Allocation and TF-IDF keyword extraction. Finally, we compare various traditional machine learning (ML), deep learning (DL), and transformer models for MLE and SC tasks. The result shows that transformer models consistently outperform the ML and DL models for both tasks.
- Abstract(参考訳): ソーシャルメディア(SM)プラットフォーム(Facebook、Twitter、Redditなど)は、特に自然災害やパンデミック、政治選挙といった困難な出来事や、祭りや祝祭などの楽しい行事において、意見や感情を共有するためにますます活用されている。
SMプラットフォームの中でRedditは、ユーザーが健康や日常生活といったセンシティブな問題について匿名で経験や考えを表現できるユニークなスペースを提供している。
本研究では,ネパールのサブレディットポスト上で,マルチラベル感情(MLE)と感情分類(SC)のための新しいデータセットNepEMOを提案する。
英語で書かれた4,462件(2019年1月~2025年6月)の注釈付きデータセットを,5つの感情(怒り,怒り,悲しみ,喜び,抑うつ)と3つの感情(肯定的,否定的,中立的)に対して,手作業で作成します。
本研究では,感情傾向,感情の共起,感情特異的なn-gram,ラテントディリクレアロケーションとTF-IDFキーワード抽出を用いたトピックモデリングなど,言語的洞察を捉えた投稿の詳細な分析を行う。
最後に、従来の機械学習(ML)、ディープラーニング(DL)、およびMLEおよびSCタスクのトランスフォーマーモデルを比較した。
その結果、トランスモデルは、両方のタスクにおいて、MLモデルとDLモデルよりも一貫して優れていることがわかった。
関連論文リスト
- UDDETTS: Unifying Discrete and Dimensional Emotions for Controllable Emotional Text-to-Speech [61.989360995528905]
制御可能な感情的TTSのための離散的感情と次元的感情を統一する普遍的なフレームワークであるUDDETTSを提案する。
このモデルは、次元的感情記述のための解釈可能なArousal-Dominance-Valence(ADV)空間を導入し、離散的な感情ラベルまたは非線形に定量化されたADV値によって駆動される感情制御をサポートする。
実験の結果, UDDETTSは3次元の線形感情制御を実現し, エンドツーエンドの感情音声合成能力に優れていた。
論文 参考訳(メタデータ) (2025-05-15T12:57:19Z) - EmoMeta: A Multimodal Dataset for Fine-grained Emotion Classification in Chinese Metaphors [16.510791655003096]
中国語のマルチモーダルデータセットは、5000のテキストイメージ対の比喩広告を含んでいる。
各エントリは、メタファーの発生、ドメインの関係、きめ細かい感情分類のために慎重に注釈付けされる。
論文 参考訳(メタデータ) (2025-05-12T10:23:39Z) - Emo Pillars: Knowledge Distillation to Support Fine-Grained Context-Aware and Context-Less Emotion Classification [56.974545305472304]
感情分析のためのほとんどのデータセットは、意見が表現された文脈を欠き、感情理解に不可欠であり、主にいくつかの感情カテゴリーによって制限される。
我々はLLMベースのデータ合成パイプラインを設計し、よりアクセスしやすい軽量BERT型エンコーダモデルのトレーニング例を生成するために、大規模モデルMistral-7bを利用する。
Emo Pillarsモデルは、GoEmotions、ISEAR、IEMOCAP、EmoContextといった特定のタスクに調整された場合、新しいドメインに対して高い適応性を示し、最初の3つでSOTAのパフォーマンスに達した。
論文 参考訳(メタデータ) (2025-04-23T16:23:17Z) - EmoVoice: LLM-based Emotional Text-To-Speech Model with Freestyle Text Prompting [48.56693150755667]
感情制御可能な新しいTSモデルであるEmoVoiceを提案する。
EmoVoiceは、大きな言語モデル(LLM)を利用して、きめ細かいフリースタイルの自然言語感情制御を可能にする。
EmoVoiceは、英語のEmoVoice-DBテストセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-04-17T11:50:04Z) - LEIA: Linguistic Embeddings for the Identification of Affect [0.23848027137382474]
我々は、600万以上の投稿のデータセットでトレーニングされたテキスト中の感情識別モデルであるLEIAを提示する。
LEIAは、モデル事前学習中の感情語の学習を強化する単語マスキング法に基づいている。
以上の結果から, LEIAは, 訓練対象領域を超えて, 怒り, 幸福, 悲しみの分類を一般化していることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-21T14:17:10Z) - Using Emotion Embeddings to Transfer Knowledge Between Emotions,
Languages, and Annotation Formats [0.0]
私たちは、異なる構成間で移行可能な単一のモデルを構築する方法を示します。
Demuxはゼロショット方式で知識を新しい言語に同時に転送できることを示す。
論文 参考訳(メタデータ) (2022-10-31T22:32:36Z) - Challenges in Translation of Emotions in Multilingual User-Generated
Content: Twitter as a Case Study [1.3999481573773072]
異なる言語における感情の翻訳において,Twitterデータに特有の言語現象が存在することを示す。
また、テキスト中の感情の保存に関して、MTシステムの性能を評価するためによく使われる手法の能力を評価する。
論文 参考訳(メタデータ) (2021-06-20T16:12:48Z) - EMOVIE: A Mandarin Emotion Speech Dataset with a Simple Emotional
Text-to-Speech Model [56.75775793011719]
音声ファイルを含む9,724のサンプルとその感情ラベル付きアノテーションを含むマンダリン感情音声データセットを導入,公開する。
入力として追加の参照音声を必要とするこれらのモデルとは異なり、我々のモデルは入力テキストから直接感情ラベルを予測し、感情埋め込みに基づいてより表現力のある音声を生成することができる。
実験段階では、まず感情分類タスクによってデータセットの有効性を検証し、次に提案したデータセットに基づいてモデルをトレーニングし、一連の主観評価を行う。
論文 参考訳(メタデータ) (2021-06-17T08:34:21Z) - SpanEmo: Casting Multi-label Emotion Classification as Span-prediction [15.41237087996244]
マルチラベル感情分類をスパンプレディションとした新しいモデル「SpanEmo」を提案する。
入力文中の複数の共存感情をモデル化することに焦点を当てた損失関数を導入する。
SemEval2018マルチラベル感情データを3つの言語セットで実験した結果,本手法の有効性が示された。
論文 参考訳(メタデータ) (2021-01-25T12:11:04Z) - Annotation of Emotion Carriers in Personal Narratives [69.07034604580214]
我々は、個人的物語(PN) - 話されたり書かれたり - 事実、出来事、思考の記憶 - を理解する問題に興味を持っている。
PNでは、感情担体(英: emotion carriers)は、ユーザの感情状態を最もよく説明する音声またはテキストセグメントである。
本研究は,音声対話における感情担持者を特定するためのアノテーションモデルを提案し,評価する。
論文 参考訳(メタデータ) (2020-02-27T15:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。