論文の概要: AraHopeCorpus: Annotation Guidelines and Dataset for Hope Speech in Arabic Social Media Crisis Discourse
- arxiv url: http://arxiv.org/abs/2605.23325v1
- Date: Fri, 22 May 2026 07:39:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.245778
- Title: AraHopeCorpus: Annotation Guidelines and Dataset for Hope Speech in Arabic Social Media Crisis Discourse
- Title(参考訳): AraHopeCorpus: Annotation Guidelines and Dataset for Hope Speech in Arabic Social Media Crisis Discourse (英語)
- Authors: Esra'a Sharqawi, Wajdi Zaghouani,
- Abstract要約: AraHopeCorpusは1万のYouTubeコメントから収集されたアラビア語希望音声の注釈付きデータセットである。
このデータセットは、希望的な言語が支配的であり、全コメントの64%以上を占めていることを示している。
約13%を表す希望のスピーチは、絶望と幻滅を反映しておらず、残りのコメントは中立あるいは混成コンテンツを含んでいる。
- 参考スコア(独自算出の注目度): 0.6546712656847457
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social media has become a crucial arena for shaping public narratives during armed conflicts, providing space for both harmful and constructive communication. While hate speech and misinformation have been widely studied, expressions that promote resilience, solidarity, and optimism remain underexplored, particularly in Arabic contexts. This paper introduces AraHopeCorpus, the first annotated dataset of Arabic hope speech collected from ten thousand YouTube comments related to the war on Gaza between 2023 and 2024. Using a detailed annotation framework, comments were classified into three categories: hope speech, no hope speech, and neutral or unclear discourse. The dataset shows that hopeful language dominates, accounting for more than sixty four percent of all comments. These expressions of hope appear mainly as religious encouragement, collective solidarity, and optimism for endurance and justice. No hope speech, representing about thirteen percent, reflects despair and disillusionment, while the rest of the comments contain neutral or mixed content. Inter-Annotator Agreement reached substantial levels (Cohen's Kappa equals 0.71), though dialectal variation, sarcasm, and implicit meaning posed annotation challenges. A comparative analysis between human annotators and ChatGPT revealed that large language models can support annotation but remain limited in handling dialectal and culturally embedded expressions. AraHopeCorpus will be released for research purposes under an open and non commercial license. It provides a valuable resource for studying constructive digital discourse, enabling further research on hope speech detection, crisis communication, and resilience in Arabic social media.
- Abstract(参考訳): ソーシャルメディアは、武装紛争の間、大衆の物語を形成するための重要な場となり、有害で建設的なコミュニケーションのためのスペースを提供してきた。
ヘイトスピーチと誤報は広く研究されているが、弾力性、連帯性、楽観主義を促進する表現は、特にアラビアの文脈では未発見のままである。
AraHopeCorpusは、2023年から2024年にかけてのガザでの戦争に関するYouTubeコメント10万件から収集された、アラビア語の希望演説の注釈付きデータセットである。
詳細なアノテーションの枠組みを用いて、コメントは希望演説、希望演説、中立的あるいは不明瞭な言説の3つのカテゴリに分類された。
このデータセットは、希望的な言語が支配的であり、全コメントの64%以上を占めていることを示している。
これらの希望の表現は、主に宗教的奨励、集合的な連帯、永続性と正義に対する楽観主義として現れる。
約13%を表す希望のスピーチは、絶望と幻滅を反映しておらず、残りのコメントは中立あるいは混成コンテンツを含んでいる。
アノテーション間協定は、方言のバリエーション、皮肉、暗黙的な意味がアノテーションの課題を提起するにもかかわらず、かなりの水準に達した(コーエンのカッパは0.71に等しい)。
人間のアノテータとChatGPTの比較分析により、大きな言語モデルではアノテーションをサポートできるが、方言や文化的に埋め込まれた表現の扱いには制限があることが明らかとなった。
AraHopeCorpusは、オープンかつ非商用ライセンスの下で研究目的でリリースされる。
建設的なデジタル談話の研究に貴重なリソースを提供し、アラビア語のソーシャルメディアにおける希望のスピーチの検出、危機コミュニケーション、レジリエンスについてさらなる研究を可能にする。
関連論文リスト
- EmoHopeSpeech: An Annotated Dataset of Emotions and Hope Speech in English and Arabic [0.021665899581403608]
本研究では,アラビア語の23,456項目と英語の10,036項目からなるバイリンガルデータセットを提案する。
このデータセットは、感情の強さ、複雑さ、原因を捉える包括的なアノテーションと、希望のスピーチのための詳細な分類とサブカテゴリを提供する。
論文 参考訳(メタデータ) (2025-05-17T11:21:58Z) - Sentiment-enhanced Graph-based Sarcasm Explanation in Dialogue [63.32199372362483]
本稿では,SEntiment-enhanceD Graph を用いたマルチモーダルサルカズム記述フレームワーク EDGE を提案する。
特に,まずレキシコン誘導型発話感情推論モジュールを提案し,そこでは発話感情改善戦略を考案する。
次に,マルチモーダル感情分析モデル JCA を拡張し,映像音声クリップ毎に共同感情ラベルを導出することにより,JCA-SI (Joint Cross Attention-based Sentiment Inference) というモジュールを開発する。
論文 参考訳(メタデータ) (2024-02-06T03:14:46Z) - Beyond Negativity: Re-Analysis and Follow-Up Experiments on Hope Speech
Detection [0.0]
ホープスピーチは、サポート、安心、提案、インスピレーション、洞察を提供するコメント、投稿、その他のソーシャルメディアメッセージを指す。
本研究は,希望音声検出のための効率的かつ同等かつ優れた手法を見つけることを目的としている。
論文 参考訳(メタデータ) (2023-05-10T18:38:48Z) - CoSyn: Detecting Implicit Hate Speech in Online Conversations Using a
Context Synergized Hyperbolic Network [52.85130555886915]
CoSynは、オンライン会話における暗黙のヘイトスピーチを検出するために、ユーザと会話のコンテキストを明示的に組み込んだ、コンテキスト中心のニューラルネットワークである。
我々は、CoSynが、1.24%から57.8%の範囲で絶対的に改善された暗黙のヘイトスピーチを検出することで、我々のベースラインを全て上回っていることを示す。
論文 参考訳(メタデータ) (2023-03-02T17:30:43Z) - PolyHope: Two-Level Hope Speech Detection from Tweets [68.8204255655161]
その重要性にもかかわらず、希望はソーシャルメディア分析タスクとして研究されることはめったにない。
本稿では、まず各ツイートを「ホップ」と「ノーホープ」に分類するホープ音声データセットを提案する。
2022年前半の英語のつぶやきは、このデータセットを構築するために集められた。
論文 参考訳(メタデータ) (2022-10-25T16:34:03Z) - Hope Speech detection in under-resourced Kannada language [0.1759008116536278]
そこで我々は,英語・カナダ・ホープ音声データセットKanHopeを提案する。
データセットは、6,176件のユーザー生成コメントからなる。
我々は、カンホープの英語翻訳を付加訓練に用い、希望音声検出を促進する二重チャネルモデルであるDC-BERT4HOPEを紹介する。
論文 参考訳(メタデータ) (2021-08-10T11:59:42Z) - "Notic My Speech" -- Blending Speech Patterns With Multimedia [65.91370924641862]
音声認識と理解における視点依存と視覚的重要性の両方をモデル化するための視点時間的注意機構を提案する。
提案手法は, ビセム誤差率において, 既存の作業よりも4.99%優れていた。
モデルでは,多視点音声に対する理解と人間の知覚との間に強い相関関係があることが示されている。
論文 参考訳(メタデータ) (2020-06-12T06:51:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。