論文の概要: Audience Engagement with Arabic Women's Social Empowerment and Wellbeing: A Decadal Corpus
- arxiv url: http://arxiv.org/abs/2605.22204v1
- Date: Thu, 21 May 2026 09:10:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.181806
- Title: Audience Engagement with Arabic Women's Social Empowerment and Wellbeing: A Decadal Corpus
- Title(参考訳): アラビア語女性の社会的エンパワーメントとウェルビーイングによるオーディエンスエンゲージメント:デカナルコーパス
- Authors: Wajdi Zaghouani, Mabrouka Bessghaier, MD. Rafiul Biswas, Shimaa Amer Ibrahim,
- Abstract要約: アラブ女性社会法人は、女性のエンパワーメントと社会福祉に関連する公的なアラブ系Facebook投稿252,487件の10年間のコレクションである。
コーパスは2013年から2024年にかけて77カ国の51,660ページから収集され、ユーザインタラクションは2億6700万を超えている。
- 参考スコア(独自算出の注目度): 0.7665402410737511
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents the Arabic Women and Society Corpus, a ten year collection of 252,487 public Arabic Facebook posts related to women's empowerment and social wellbeing. The corpus was collected from 51,660 pages across 77 countries between 2013 and 2024, resulting in more than 267 million user interactions. Each post includes engagement metrics such as shares, comments, and emotional reactions, providing a unique view of audience sentiment and social attention. The data were processed using an automated pipeline with language identification, normalization, and metadata cleaning to ensure reliability and reproducibility. The corpus enables large scale analysis of gender discourse, social reform, and emotional engagement across Arabic dialects. It supports research in Arabic natural language processing, computational social science, and digital communication studies. The dataset and accompanying documentation will be released under request for research use.
- Abstract(参考訳): 本稿は、女性のエンパワーメントと社会福祉に関連する公的なアラビアFacebook投稿252,487件の10年間のコレクションであるアラビア女性社会コーパスを提示する。
コーパスは2013年から2024年にかけて77カ国の51,660ページから収集され、ユーザインタラクションは2億6700万を超えている。
各投稿には、共有、コメント、感情的な反応といったエンゲージメントの指標が含まれており、聴衆の感情や社会的注意のユニークなビューを提供する。
データは、言語識別、正規化、メタデータのクリーニングを備えた自動パイプラインを使用して処理され、信頼性と再現性を確保した。
コーパスは、アラビア語の方言をまたいだジェンダーの言説、社会改革、感情的なエンゲージメントの大規模分析を可能にする。
アラビア語の自然言語処理、計算社会科学、デジタルコミュニケーションの研究を支援している。
データセットと付随するドキュメントは、研究使用の要求に基づいてリリースされる。
関連論文リスト
- JobArabi: An Arabic Corpus and Analysis of Job Announcements from Social Media [1.6784509158098027]
JobArabi(ジョブアラビ)は、2024年1月から2025年10月までにソーシャルメディアから収集された大規模なアラビア語の求人情報コーパスである。
データセットには、Xからの20,528のパブリックポストが含まれており、2年以上にわたる雇用に関する議論を捉えている。
論文 参考訳(メタデータ) (2026-05-20T09:45:33Z) - SenWave: A Fine-Grained Multi-Language Sentiment Analysis Dataset Sourced from COVID-19 Tweets [42.98177831933239]
SenWaveは、新型コロナウイルス(COVID-19)のツイートを分析するために特別に設計された、新しい微粒な多言語感情分析データセットである。
このデータセットは、英語とアラビア語でそれぞれ1万の注釈付きツイートと、スペイン語、フランス語、イタリア語で3万の翻訳ツイートで構成されている。
本研究は,言語,国,トピック間の進化する情緒的景観を詳細に分析し,時間とともに重要な洞察を明らかにする。
論文 参考訳(メタデータ) (2025-10-09T13:38:05Z) - taz2024full: Analysing German Newspapers for Gender Bias and Discrimination across Decades [0.20971479389679337]
われわれは1980年から2024年にかけてドイツで発行された新聞記事の最大のコーパスであるtaz2024fullを紹介している。
偏見と差別研究のためのコーパスの有用性の実証として、私たちは40年間の報告を通して性別の表現を分析した。
スケーラブルで構造化された分析パイプラインを用いて、ドイツのジャーナリストのテキストでアクターの言及、感情、言語的フレーミングを研究する基盤を提供する。
論文 参考訳(メタデータ) (2025-06-03T16:24:33Z) - Social Support Detection from Social Media Texts [44.096359084699]
ソーシャルメディアのような様々な相互作用やプラットフォームを通じて伝えられる社会支援は、所有意識を育む上で重要な役割を担っている。
本稿では,自然言語処理(NLP)タスクとしてのソーシャルサポート検出(SSD)について紹介する。
我々は1万のYouTubeコメントからなるデータセットで実験を行った。
論文 参考訳(メタデータ) (2024-11-04T20:23:03Z) - Arabic Text Sentiment Analysis: Reinforcing Human-Performed Surveys with
Wider Topic Analysis [49.1574468325115]
詳細な研究は、2002年から2020年の間に英語で出版された133のASA論文を手作業で分析する。
主な発見は、機械学習、レキシコンベース、ハイブリッドアプローチといった、ASAで使用されるさまざまなアプローチを示している。
アラビア文字SAについては、業界だけでなく学術分野でも使用できるASAツールを開発する必要がある。
論文 参考訳(メタデータ) (2024-03-04T10:37:48Z) - Less than one percent of words would be affected by gender-inclusive
language in German press texts [43.16629507708997]
平均して、すべてのトークンの1%以下は、ジェンダー非包摂的言語に影響されることが示されている。
この小さな割合は、ジェンダーを包含するドイツ語が言語を理解し学習する上で大きな障壁となるかどうかに疑問を呈している。
論文 参考訳(メタデータ) (2024-02-06T10:32:34Z) - AfriSenti: A Twitter Sentiment Analysis Benchmark for African Languages [45.88640066767242]
アフリカには6以上の言語族から2000以上の言語があり、全大陸で最高の言語多様性がある。
しかし、アフリカ語で実施されているNLP研究はほとんどない。そのような研究を可能にする上で重要なのは、高品質な注釈付きデータセットが利用可能であることだ。
本稿では,14のアフリカ語で110,000以上のツイートを含む感情分析ベンチマークであるAfriSentiを紹介する。
論文 参考訳(メタデータ) (2023-02-17T15:40:12Z) - The Arabic Parallel Gender Corpus 2.0: Extensions and Analyses [17.253633576291897]
本研究では,性別識別と書き直しのための新しいコーパスを提案する。
アラビア語は、ジェンダーマークに富む形態的言語である。
論文 参考訳(メタデータ) (2021-10-18T12:06:17Z) - BOLD: Dataset and Metrics for Measuring Biases in Open-Ended Language
Generation [42.34923623457615]
Open-Ended Language Generationデータセットのバイアスは23,679の英語テキスト生成プロンプトで構成されている。
3つの人気のある言語モデルから生成されたテキストを調べると、これらのモデルの大半は、人によるウィキペディアのテキストよりも大きな社会的バイアスを示すことが明らかになっている。
論文 参考訳(メタデータ) (2021-01-27T22:07:03Z) - Quantifying Intimacy in Language [14.030859691804412]
親密性は、社会的設定における他者との関わりの基本的な側面である。
言語における親密性の表現を研究するための新しい計算フレームワークを提案する。
個人が言語における対人的実践的行動を用いて、親密さと社会的設定を一致させることが示される。
論文 参考訳(メタデータ) (2020-11-05T18:27:20Z) - ParsEL 1.0: Unsupervised Entity Linking in Persian Social Media Texts [6.866104126509981]
ソーシャルメディアデータの大部分は自然言語テキストである。
最近、ペルシャの知識グラフであるFarsBaseが50万近いエンティティを含む形で導入された。
本稿では,教師なしペルシャのエンティティリンクシステムを提案する。
論文 参考訳(メタデータ) (2020-04-22T19:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。