論文の概要: Benchmarking PyCaret AutoML Against BiLSTM for Fine-Grained Emotion Classification: A Comparative Study on 20-Class Emotion Detection
- arxiv url: http://arxiv.org/abs/2604.26310v1
- Date: Wed, 29 Apr 2026 05:31:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-30 15:59:36.261697
- Title: Benchmarking PyCaret AutoML Against BiLSTM for Fine-Grained Emotion Classification: A Comparative Study on 20-Class Emotion Detection
- Title(参考訳): 細粒度感情分類のためのBiLSTMに対するPyCaret AutoMLのベンチマーク:20種類の感情検出の比較検討
- Authors: Arya Muda Siregar, Arielva Simon Siahaan, Haikal Fransisko Simbolon, Luluk Muthoharoh, Ardika Satria, Martin C. T. Manullang,
- Abstract要約: 本研究では、20クラスの感情分類のための古典的機械学習とディープラーニングアプローチをベンチマークする。
その結果, BiLSTMは89%の精度, 重み付きF1スコア0.89で最高の総合性能を達成できた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fine-grained emotion classification, which identifies specific emotional states such as happiness, anger, sadness, and fear, remains a challenging task in natural language processing. This study benchmarks classical machine learning and deep learning approaches for 20-class emotion classification using the 20-Emotion Text Classification Dataset containing 79,595 English sentences. On the machine learning side, Logistic Regression, Multinomial Naive Bayes, and Support Vector Machine are evaluated using TF-IDF features. On the deep learning side, Bidirectional Long Short-Term Memory, Gated Recurrent Unit, and a lightweight Transformer implemented in PyTorch are compared. The results show that BiLSTM achieves the best overall performance with 89% accuracy and a weighted F1-score of 0.89, slightly outperforming the best machine learning model, SVM, which reaches 88.11% accuracy. The findings indicate that while traditional machine learning models remain competitive and computationally efficient, sequence-based deep learning models better capture contextual emotional cues in text.
- Abstract(参考訳): 幸福、怒り、悲しみ、恐怖といった特定の感情状態を特定する、きめ細かい感情分類は、自然言語処理において難しい課題である。
本研究では、79,595の英文を含む20感情テキスト分類データセットを用いて、20クラスの感情分類のための古典的機械学習とディープラーニングのアプローチをベンチマークする。
機械学習の面では、TF-IDF機能を用いて、ロジスティック回帰、マルチノミアルニーブベイズ、サポートベクトルマシンを評価する。
ディープラーニング側では、PyTorchで実装された双方向長短期記憶、Gated Recurrent Unit、軽量変換器を比較した。
その結果、BiLSTMは89%の精度で、重み付きF1スコアは0.89で、最高の機械学習モデルであるSVMよりもわずかに優れており、精度は88.11%である。
この結果は、従来の機械学習モデルは競争力と計算効率を保ちながら、シーケンスベースのディープラーニングモデルは、文脈的感情的な手がかりをテキストでよりよく捉えていることを示している。
関連論文リスト
- Benchmarking PyCaret AutoML Against IndoBERT Fine-Tuning for Sentiment Analysis on Indonesian IKN Twitter Data [0.0]
本稿では、PyCaret AutoMLに基づく古典的な機械学習アプローチと、IndoBERTに基づくディープラーニングアプローチをベンチマークする。
データセットには1,472個の手作業によるラベル付きサンプルが含まれており、780個の否定的なコメントと692個の肯定的なコメントで構成されている。
論文 参考訳(メタデータ) (2026-04-28T09:02:24Z) - Fine-Grained Emotion Detection on GoEmotions: Experimental Comparison of Classical Machine Learning, BiLSTM, and Transformer Models [4.417564179511245]
微粒な感情認識はラベル重複とクラス不均衡による多ラベルNLP課題である。
TF-IDFをベースとしたロジスティック回帰システム,注目度の高いBiLSTM,マルチラベル分類のためのBERTモデル,の3つのモデルファミリをベンチマークした。
我々は,ロジスティック回帰が0.51マイクロF1の最高値に達するのに対して,BERTは公式論文の報告結果を上回る総合的なバランスを達成していることを観察した。
論文 参考訳(メタデータ) (2026-01-26T05:29:27Z) - AI Generated Text Detection [0.0]
本稿では,従来の機械学習モデルとトランスフォーマーベースアーキテクチャの両方を含む,AIテキスト検出手法の評価を行う。
我々は、HC3とDAIGT v2という2つのデータセットを使用して、統一されたベンチマークを構築し、情報漏洩を防止するためにトピックベースのデータ分割を適用する。
その結果、文脈モデリングは語彙的特徴よりもはるかに優れていることが示され、話題記憶の緩和の重要性が強調された。
論文 参考訳(メタデータ) (2026-01-07T11:18:10Z) - Emotion Detection in Speech Using Lightweight and Transformer-Based Models: A Comparative and Ablation Study [0.41292255339309664]
本稿では,軽量トランスモデルであるDistilHuBERTとPaSSTの比較分析を行う。
MFCC機能を用いた従来のCNN-LSTMベースラインモデルと比較した。
DistilHuBERTは、非常に小さなモデルサイズ(0.02MB)を維持しながら、優れた精度(70.64%)とF1スコア(70.36%)を示す。
論文 参考訳(メタデータ) (2025-11-01T05:01:04Z) - Logits-Based Finetuning [48.18151583153572]
本稿では,教師付き学習と知識蒸留の強みを統合したロジットに基づく微調整フレームワークを提案する。
提案手法は,教師のロジットと地上の真理ラベルを組み合わせ,正確性と言語的多様性を両立させることにより,充実した訓練目標を構築する。
論文 参考訳(メタデータ) (2025-05-30T10:57:09Z) - Leveraging Cross-Attention Transformer and Multi-Feature Fusion for Cross-Linguistic Speech Emotion Recognition [60.58049741496505]
音声感情認識(SER)は、人間とコンピュータの相互作用を強化する上で重要な役割を担っている。
本稿では,HuBERT,MFCC,および韻律特性を組み合わせたHuMP-CATを提案する。
HMP-CATは、ターゲットデータセットから少量の音声でソースモデルを微調整することにより、平均78.75%の精度が得られることを示す。
論文 参考訳(メタデータ) (2025-01-06T14:31:25Z) - Emotion-LLaMA: Multimodal Emotion Recognition and Reasoning with Instruction Tuning [55.127202990679976]
28,618粒の粗粒と4,487粒の細粒のアノテートサンプルを含むMERRデータセットを導入した。
このデータセットは、さまざまなシナリオから学習し、現実のアプリケーションに一般化することを可能にする。
本研究では,感情特異的エンコーダによる音声,視覚,テキスト入力をシームレスに統合するモデルであるEmotion-LLaMAを提案する。
論文 参考訳(メタデータ) (2024-06-17T03:01:22Z) - Exploring Text-to-Motion Generation with Human Preference [59.28730218998923]
本稿では,テキスト・トゥ・モーション・ジェネレーションにおける嗜好学習の探索について述べる。
テキスト・トゥ・モーション・ジェネレーションの現在の改善は、まだモーションキャプチャシステムを備えたエキスパート・ラベラーを必要とするデータセットに依存していることがわかった。
我々は、好み学習が、現在のテキスト・ツー・モーション生成モデルを大幅に改善する可能性があることを示す。
論文 参考訳(メタデータ) (2024-04-15T04:14:42Z) - Bag of Tricks for Effective Language Model Pretraining and Downstream
Adaptation: A Case Study on GLUE [93.98660272309974]
このレポートでは、ジェネラル言語理解評価のリーダーボードに関するVega v1を簡潔に紹介します。
GLUEは、質問応答、言語受容性、感情分析、テキスト類似性、パラフレーズ検出、自然言語推論を含む9つの自然言語理解タスクのコレクションである。
最適化された事前学習と微調整の戦略により、13億のモデルは4/9タスクに新しい最先端のタスクを設定し、91.3の平均スコアを達成しました。
論文 参考訳(メタデータ) (2023-02-18T09:26:35Z) - DeepEmotex: Classifying Emotion in Text Messages using Deep Transfer
Learning [0.0]
テキスト中の感情を検出する効果的なシーケンシャルトランスファー学習法としてDeepEmotexを提案する。
キュレートされたTwitterデータセットとベンチマークデータセットの両方を用いて実験を行った。
DeepEmotexモデルは、テストデータセット上でのマルチクラスの感情分類において91%以上の精度を達成する。
論文 参考訳(メタデータ) (2022-06-12T03:23:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。