論文の概要: Detecting Hope Across Languages: Multiclass Classification for Positive Online Discourse
- arxiv url: http://arxiv.org/abs/2509.25752v1
- Date: Tue, 30 Sep 2025 04:16:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.421501
- Title: Detecting Hope Across Languages: Multiclass Classification for Positive Online Discourse
- Title(参考訳): 言語横断の希望を検出する: 肯定的オンライン談話のための多クラス分類
- Authors: T. O. Abiola, K. D. Abiodun, O. E. Olumide, O. O. Adebanji, O. Hiram Calvo, Grigori Sidorov,
- Abstract要約: 我々は、英語、ウルドゥー語、スペイン語を含む複数の言語にわたる複数クラスホープ音声検出のための機械学習アプローチを提案する。
我々は、トランスフォーマーベースのモデル、特にXLM-RoBERTaを利用して、希望のスピーチを3つの異なるクラス(一般化希望、現実的希望、非現実的希望)に分類する。
提案手法は,PolyHope-M 2025共有タスクのPolyHopeデータセットを用いて評価し,全言語間での競合性能を実現する。
- 参考スコア(独自算出の注目度): 4.905674855734124
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The detection of hopeful speech in social media has emerged as a critical task for promoting positive discourse and well-being. In this paper, we present a machine learning approach to multiclass hope speech detection across multiple languages, including English, Urdu, and Spanish. We leverage transformer-based models, specifically XLM-RoBERTa, to detect and categorize hope speech into three distinct classes: Generalized Hope, Realistic Hope, and Unrealistic Hope. Our proposed methodology is evaluated on the PolyHope dataset for the PolyHope-M 2025 shared task, achieving competitive performance across all languages. We compare our results with existing models, demonstrating that our approach significantly outperforms prior state-of-the-art techniques in terms of macro F1 scores. We also discuss the challenges in detecting hope speech in low-resource languages and the potential for improving generalization. This work contributes to the development of multilingual, fine-grained hope speech detection models, which can be applied to enhance positive content moderation and foster supportive online communities.
- Abstract(参考訳): ソーシャルメディアにおける希望的スピーチの検出は、肯定的な言論と幸福を促進する重要な課題として浮上している。
本稿では,英語,ウルドゥー語,スペイン語を含む複数の言語を対象とした,複数クラスの希望音声検出のための機械学習手法を提案する。
我々は、トランスフォーマーベースのモデル、特にXLM-RoBERTaを利用して、希望のスピーチを3つの異なるクラス(一般化希望、現実的希望、非現実的希望)に分類する。
提案手法は,PolyHope-M 2025共有タスクのPolyHopeデータセットを用いて評価し,全言語間での競合性能を実現する。
実験結果と既存モデルを比較し,提案手法がマクロF1スコアにおいて先行技術より有意に優れていることを示す。
また,低リソース言語における希望語検出の課題と,一般化向上の可能性についても論じる。
本研究は, 肯定的コンテンツのモデレーションを高め, 支援的なオンラインコミュニティを育成するための, 多言語, きめ細かい音声検出モデルの開発に寄与する。
関連論文リスト
- AIxcellent Vibes at GermEval 2025 Shared Task on Candy Speech Detection: Improving Model Performance by Span-Level Training [0.0]
46k-comment German YouTube corpusにおいて,キャンディー音声を確実に検出する方法について検討した。
マルチリンガルなXLM-RoBERTa-Largeモデルは,スパンレベルでのキャンディー音声の検出を訓練し,他の手法よりも優れていることがわかった。
我々は、スパンベーストレーニング、多言語機能、絵文字対応トークン化器による検出性能の向上を推察した。
論文 参考訳(メタデータ) (2025-09-09T07:29:14Z) - CODEOFCONDUCT at Multilingual Counterspeech Generation: A Context-Aware Model for Robust Counterspeech Generation in Low-Resource Languages [1.9263811967110864]
本稿では,MCG-COING-2025共有タスクにおいて大きな成功を収めた,頑健な対音声生成のための文脈認識モデルを提案する。
多言語データセットに微調整されたシミュレーションアニーリングアルゴリズムを活用することで、モデルはヘイトスピーチに対する現実的に正確な応答を生成する。
4つの言語で最先端のパフォーマンスを実証し、バスク語で第1位、イタリア語で第2位、英語とスペイン語で第3位にランク付けしました。
論文 参考訳(メタデータ) (2025-01-01T03:36:31Z) - PolyHope: Two-Level Hope Speech Detection from Tweets [68.8204255655161]
その重要性にもかかわらず、希望はソーシャルメディア分析タスクとして研究されることはめったにない。
本稿では、まず各ツイートを「ホップ」と「ノーホープ」に分類するホープ音声データセットを提案する。
2022年前半の英語のつぶやきは、このデータセットを構築するために集められた。
論文 参考訳(メタデータ) (2022-10-25T16:34:03Z) - Self-Supervised Speech Representation Learning: A Review [105.1545308184483]
自己教師付き表現学習法は、幅広いタスクやドメインに利益をもたらす単一の普遍的モデルを約束する。
音声表現学習は、生成的、コントラスト的、予測的という3つの主要なカテゴリで同様の進歩を経験している。
本稿では,自己指導型音声表現学習のアプローチと,他の研究領域との関係について述べる。
論文 参考訳(メタデータ) (2022-05-21T16:52:57Z) - A New Generation of Perspective API: Efficient Multilingual
Character-level Transformers [66.9176610388952]
Google JigsawのAspective APIの次期バージョンの基礎を提示する。
このアプローチの中心は、単一の多言語トークンフリーなCharformerモデルである。
静的な語彙を強制することで、さまざまな設定で柔軟性が得られます。
論文 参考訳(メタデータ) (2022-02-22T20:55:31Z) - IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and
Languages [87.5457337866383]
画像認識言語理解評価ベンチマークについて紹介する。
IGLUEは、視覚的質問応答、クロスモーダル検索、グラウンドド推論、20言語にわたるグラウンドドエンターテイメントタスクをまとめて提供する。
翻訳-テストの転送はゼロショットの転送よりも優れており、少数ショットの学習は多くのタスクに役立てることが難しい。
論文 参考訳(メタデータ) (2022-01-27T18:53:22Z) - Exploring Teacher-Student Learning Approach for Multi-lingual
Speech-to-Intent Classification [73.5497360800395]
複数の言語をサポートするエンドツーエンドシステムを開発した。
我々は、事前訓練された多言語自然言語処理モデルからの知識を利用する。
論文 参考訳(メタデータ) (2021-09-28T04:43:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。