論文の概要: EmoBang: Detecting Emotion From Bengali Texts
- arxiv url: http://arxiv.org/abs/2511.07077v1
- Date: Mon, 10 Nov 2025 13:07:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.262068
- Title: EmoBang: Detecting Emotion From Bengali Texts
- Title(参考訳): EmoBang:ベンガルのテキストから感情を検出する
- Authors: Abdullah Al Maruf, Aditi Golder, Zakaria Masud Jiyad, Abdullah Al Numan, Tarannum Shaila Zaman,
- Abstract要約: 大規模で標準化されたデータセットの欠如は、感情検出のための低リソース言語としてBengaliを分類している。
既存の研究は主に古典的な機械学習モデルと伝統的な特徴工学を用いており、性能は限られている。
これはベンガルの感情検出のための最初の包括的なベンチマークである。
- 参考スコア(独自算出の注目度): 0.809033071566296
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Emotion detection from text seeks to identify an individual's emotional or mental state - positive, negative, or neutral - based on linguistic cues. While significant progress has been made for English and other high-resource languages, Bengali remains underexplored despite being the world's fourth most spoken language. The lack of large, standardized datasets classifies Bengali as a low-resource language for emotion detection. Existing studies mainly employ classical machine learning models with traditional feature engineering, yielding limited performance. In this paper, we introduce a new Bengali emotion dataset annotated across eight emotion categories and propose two models for automatic emotion detection: (i) a hybrid Convolutional Recurrent Neural Network (CRNN) model (EmoBangHybrid) and (ii) an AdaBoost-Bidirectional Encoder Representations from Transformers (BERT) ensemble model (EmoBangEnsemble). Additionally, we evaluate six baseline models with five feature engineering techniques and assess zero-shot and few-shot large language models (LLMs) on the dataset. To the best of our knowledge, this is the first comprehensive benchmark for Bengali emotion detection. Experimental results show that EmoBangH and EmoBangE achieve accuracies of 92.86% and 93.69%, respectively, outperforming existing methods and establishing strong baselines for future research.
- Abstract(参考訳): テキストからの感情検出は、言語的手がかりに基づいて個人の感情や精神状態(肯定的、否定的、中立的)を特定しようとする。
ベンガル語は、英語やその他の高資源言語に大きな進歩を遂げているが、ベンガル語は世界第4位の言語であるにもかかわらず、未発見のままである。
大規模で標準化されたデータセットの欠如は、感情検出のための低リソース言語としてBengaliを分類している。
既存の研究は主に古典的な機械学習モデルと伝統的な特徴工学を用いており、性能は限られている。
本稿では,8つの感情カテゴリにアノテートされたベンガル感情データセットを導入し,自動感情検出のための2つのモデルを提案する。
(i)ハイブリッド畳み込みリカレントニューラルネットワーク(CRNN)モデル(EmoBangHybrid)と
(ii)変換器(BERT)アンサンブルモデル(EmoBangEnsemble)からのAdaBoost-Bidirectional Encoder表現。
さらに,5つの特徴工学的手法を用いた6つのベースラインモデルを評価し,データセット上でゼロショットおよび少数ショット大言語モデル(LLM)を評価する。
私たちの知る限りでは、ベンガルの感情検出のための総合的なベンチマークとしてはこれが初めてです。
実験の結果、EmoBangHとEmoBangEはそれぞれ92.86%、93.69%のアキュラシーを達成し、既存の手法を上回り、将来の研究の強力なベースラインを確立することが示されている。
関連論文リスト
- HausaNLP at SemEval-2025 Task 11: Hausa Text Emotion Detection [0.0]
本稿では,SemEval Track Aのための低リソースアフリカ言語Hausaにおけるマルチラベル感情検出手法を提案する。
アフリカの言語で事前訓練されたトランスフォーマーベースのモデルであるAfriBERTaを微調整して、Hausaテキストを怒り、嫌悪感、恐怖、喜び、悲しみ、驚きの6つの感情に分類しました。
論文 参考訳(メタデータ) (2025-06-19T15:19:35Z) - EmoBench-UA: A Benchmark Dataset for Emotion Detection in Ukrainian [55.08460390792863]
EmoBench-UAはウクライナのテキストで感情を検出するための最初の注釈付きデータセットである。
その結果,ウクライナ語のような非主流言語における感情分類の課題が浮き彫りになった。
論文 参考訳(メタデータ) (2025-05-29T09:49:57Z) - JNLP at SemEval-2025 Task 11: Cross-Lingual Multi-Label Emotion Detection Using Generative Models [3.1605924602008373]
本研究では,SemEval-2025 Task 11: Bridging the Gap in Text-Based Emotion Detectionについて述べる。
本研究は,(1)トラックA:マルチラベル感情検出,(2)トラックB:感情強度の2つのサブトラックに焦点を当てた。
入力を対応する感情ラベルに直接マッピングするベースメソッドと、入力テキストと各感情カテゴリの関係を個別にモデル化するペアワイズ手法の2つの方法を提案する。
論文 参考訳(メタデータ) (2025-05-19T15:24:53Z) - Leveraging Cross-Attention Transformer and Multi-Feature Fusion for Cross-Linguistic Speech Emotion Recognition [60.58049741496505]
音声感情認識(SER)は、人間とコンピュータの相互作用を強化する上で重要な役割を担っている。
本稿では,HuBERT,MFCC,および韻律特性を組み合わせたHuMP-CATを提案する。
HMP-CATは、ターゲットデータセットから少量の音声でソースモデルを微調整することにより、平均78.75%の精度が得られることを示す。
論文 参考訳(メタデータ) (2025-01-06T14:31:25Z) - Emotion Detection in Reddit: Comparative Study of Machine Learning and Deep Learning Techniques [0.0]
本研究は,GoEmotionsデータセットを利用したテキストによる感情検出に焦点を当てた。
このタスクには、6つの機械学習モデル、3つのアンサンブルモデル、Long Short-Term Memory(LSTM)モデルなど、さまざまなモデルを使用しました。
結果は、Stacking分類器が他のモデルよりも精度と性能が優れていることを示している。
論文 参考訳(メタデータ) (2024-11-15T16:28:25Z) - EmoBench: Evaluating the Emotional Intelligence of Large Language Models [73.60839120040887]
EmoBenchは、確立された心理学理論に基づいて、マシン感情知能(EI)の包括的な定義を提案するベンチマークである。
EmoBenchには、英語と中国語で400の手作りの質問が含まれている。
以上の結果から,既存の大規模言語モデルのEIと平均的な人間の間には,かなりのギャップがみられ,今後の研究に向けての有望な方向性が浮かび上がっている。
論文 参考訳(メタデータ) (2024-02-19T11:48:09Z) - Emotion Classification in a Resource Constrained Language Using
Transformer-based Approach [2.8101673772585736]
本研究は,ベンガルテキストを6つの基本的な感情の1つに分類するトランスフォーマティブベース手法を提案する。
分類作業のために6243のテキストからなるベンガル感情コーパスを開発した。
論文 参考訳(メタデータ) (2021-04-17T18:28:39Z) - HeBERT & HebEMO: a Hebrew BERT Model and a Tool for Polarity Analysis
and Emotion Recognition [0.30458514384586394]
HeBERTは現代ヘブライ語テキストのトランスフォーマーベースのモデルである。
HebEMOはHeBERTを使って極性を検出し、Hebrewのユーザ生成コンテンツから感情を抽出するツールだ。
論文 参考訳(メタデータ) (2021-02-03T06:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。