論文の概要: Optimism, Expectation, or Sarcasm? Multi-Class Hope Speech Detection in Spanish and English
- arxiv url: http://arxiv.org/abs/2504.17974v1
- Date: Thu, 24 Apr 2025 23:00:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:53.595655
- Title: Optimism, Expectation, or Sarcasm? Multi-Class Hope Speech Detection in Spanish and English
- Title(参考訳): 最適化, 期待, サーカスム? スペイン語と英語における複数クラスホープ音声検出
- Authors: Sabur Butt, Fazlourrahman Balouchzahi, Ahmad Imam Amjad, Maaz Amjad, Hector G. Ceballos, Salud Maria Jimenez-Zafra,
- Abstract要約: 英語とスペイン語で3万以上の注釈付きツイートからなる多言語できめ細かな希望音声データセットであるPolyHope V2を紹介する。
このリソースは、Generalized、Realistic、Unrealistic、Sarcasticの4つのサブタイプを区別し、Sarcasticインスタンスを明示的にラベル付けすることで既存のデータセットを強化する。
- 参考スコア(独自算出の注目度): 2.424469485586727
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hope is a complex and underexplored emotional state that plays a significant role in education, mental health, and social interaction. Unlike basic emotions, hope manifests in nuanced forms ranging from grounded optimism to exaggerated wishfulness or sarcasm, making it difficult for Natural Language Processing systems to detect accurately. This study introduces PolyHope V2, a multilingual, fine-grained hope speech dataset comprising over 30,000 annotated tweets in English and Spanish. This resource distinguishes between four hope subtypes Generalized, Realistic, Unrealistic, and Sarcastic and enhances existing datasets by explicitly labeling sarcastic instances. We benchmark multiple pretrained transformer models and compare them with large language models (LLMs) such as GPT 4 and Llama 3 under zero-shot and few-shot regimes. Our findings show that fine-tuned transformers outperform prompt-based LLMs, especially in distinguishing nuanced hope categories and sarcasm. Through qualitative analysis and confusion matrices, we highlight systematic challenges in separating closely related hope subtypes. The dataset and results provide a robust foundation for future emotion recognition tasks that demand greater semantic and contextual sensitivity across languages.
- Abstract(参考訳): ホープは複雑で未解明の感情状態であり、教育、メンタルヘルス、社会的相互作用において重要な役割を果たしている。
基本的な感情とは異なり、希望は楽観主義から誇張された希望や皮肉まで、曖昧な形で現れ、自然言語処理システムが正確に検出することは困難である。
英語とスペイン語で3万以上の注釈付きツイートからなる多言語できめ細かな希望音声データセットであるPolyHope V2を紹介する。
このリソースは、Generalized、Realistic、Unrealistic、Sarcasticの4つのサブタイプを区別し、Sarcasticインスタンスを明示的にラベル付けすることで既存のデータセットを強化する。
GPT 4 や Llama 3 のような大規模言語モデル (LLM) をゼロショットと少数ショットの条件下で比較した。
以上の結果から,微調整トランスフォーマーは,特にニュアンスド・ホープとサルカズムの区別において,プロンプトベースのLDMよりも優れていた。
定性的分析と混乱行列を通じて、密接に関連する希望のサブタイプを分離する体系的な課題を強調した。
このデータセットと結果は、将来の感情認識タスクの堅牢な基盤を提供する。
関連論文リスト
- BRIGHTER: BRIdging the Gap in Human-Annotated Textual Emotion Recognition Datasets for 28 Languages [93.92804151830744]
BRIGHTER - 28の異なる言語のマルチラベルデータセットのコレクション。
データ収集とアノテーションプロセスとこれらのデータセット構築の課題について説明する。
BRIGHTERデータセットは、テキストベースの感情認識のギャップを埋めるためのステップであることを示す。
論文 参考訳(メタデータ) (2025-02-17T15:39:50Z) - Sarcasm Detection in a Less-Resourced Language [0.0]
我々はSlovenianのような低リソースの言語のためのSarcasm検出データセットを構築した。
機械翻訳特化中型変圧器モデルと、非常に大きな生成言語モデルである。
以上の結果から,より大型のモデルの方がより小型モデルより優れており,アンサンブルにより肉腫検出性能がわずかに向上することが示唆された。
論文 参考訳(メタデータ) (2024-10-16T16:10:59Z) - Sentiment-enhanced Graph-based Sarcasm Explanation in Dialogue [63.32199372362483]
本稿では,SEntiment-enhanceD Graph を用いたマルチモーダルサルカズム記述フレームワーク EDGE を提案する。
特に,まずレキシコン誘導型発話感情推論モジュールを提案し,そこでは発話感情改善戦略を考案する。
次に,マルチモーダル感情分析モデル JCA を拡張し,映像音声クリップ毎に共同感情ラベルを導出することにより,JCA-SI (Joint Cross Attention-based Sentiment Inference) というモジュールを開発する。
論文 参考訳(メタデータ) (2024-02-06T03:14:46Z) - SAIDS: A Novel Approach for Sentiment Analysis Informed of Dialect and
Sarcasm [0.0]
本稿では,アラビア語ツイートの感情,皮肉,方言を予測する新しいシステム(SAIDS)を紹介する。
すべてのタスクを一緒にトレーニングすることで、SAIDSの結果は75.98 FPN、59.09 F1スコア、71.13 F1スコアで、それぞれ感情分析、肉腫検出、方言識別を行う。
論文 参考訳(メタデータ) (2023-01-06T14:19:46Z) - Explaining (Sarcastic) Utterances to Enhance Affect Understanding in
Multimodal Dialogues [40.80696210030204]
本稿では,マルチモーダル(皮肉)対話インスタンスを入力とし,その説明として自然言語文を生成する深層ニューラルネットワーク MOSES を提案する。
本研究では, サルカズム検出, ユーモア識別, 感情認識など, 対話型対話システムにおいて, 様々な自然言語理解タスクに対して生成した説明を活用する。
評価結果から,MOSESはSEDの最先端システムよりも平均2%高い性能を示した。
論文 参考訳(メタデータ) (2022-11-20T18:05:43Z) - PolyHope: Two-Level Hope Speech Detection from Tweets [68.8204255655161]
その重要性にもかかわらず、希望はソーシャルメディア分析タスクとして研究されることはめったにない。
本稿では、まず各ツイートを「ホップ」と「ノーホープ」に分類するホープ音声データセットを提案する。
2022年前半の英語のつぶやきは、このデータセットを構築するために集められた。
論文 参考訳(メタデータ) (2022-10-25T16:34:03Z) - IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and
Languages [87.5457337866383]
画像認識言語理解評価ベンチマークについて紹介する。
IGLUEは、視覚的質問応答、クロスモーダル検索、グラウンドド推論、20言語にわたるグラウンドドエンターテイメントタスクをまとめて提供する。
翻訳-テストの転送はゼロショットの転送よりも優れており、少数ショットの学習は多くのタスクに役立てることが難しい。
論文 参考訳(メタデータ) (2022-01-27T18:53:22Z) - Exploiting BERT For Multimodal Target SentimentClassification Through
Input Space Translation [75.82110684355979]
オブジェクト認識変換器を用いて入力空間内の画像を変換する2ストリームモデルを提案する。
次に、翻訳を利用して、言語モデルに多モーダル情報を提供する補助文を構築する。
2つのマルチモーダルTwitterデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-08-03T18:02:38Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Interpretable Multi-Head Self-Attention model for Sarcasm Detection in
social media [0.0]
sarcastic expressionの曖昧さは、sarcasmの発見を非常に困難にしている。
マルチヘッドセルフアテンションとゲートリカレントユニットを用いた解釈可能なディープラーニングモデルを開発する。
本稿では,複数のデータセットで最新の結果を得る手法の有効性を示す。
論文 参考訳(メタデータ) (2021-01-14T21:39:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。