論文の概要: ArabGend: Gender Analysis and Inference on Arabic Twitter
- arxiv url: http://arxiv.org/abs/2203.00271v1
- Date: Tue, 1 Mar 2022 07:13:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-02 14:49:44.359102
- Title: ArabGend: Gender Analysis and Inference on Arabic Twitter
- Title(参考訳): ArabGend: アラビア語のTwitterで性分析と推論
- Authors: Hamdy Mubarak, Shammur Absar Chowdhury, Firoj Alam
- Abstract要約: アラビアのTwitter圏における男女間の違いを広範囲に分析した。
また、性別分析とともに、ユーザー名、プロフィール画像、つぶやき、友人のネットワークを利用して性別を推定する方法を提案する。
提案手法は,F1スコアが82.1%であり,過半数ベースラインよりも47.3%高い。
- 参考スコア(独自算出の注目度): 8.373984536015842
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Gender analysis of Twitter can reveal important socio-cultural differences
between male and female users. There has been a significant effort to analyze
and automatically infer gender in the past for most widely spoken languages'
content, however, to our knowledge very limited work has been done for Arabic.
In this paper, we perform an extensive analysis of differences between male and
female users on the Arabic Twitter-sphere. We study differences in user
engagement, topics of interest, and the gender gap in professions. Along with
gender analysis, we also propose a method to infer gender by utilizing
usernames, profile pictures, tweets, and networks of friends. In order to do
so, we manually annotated gender and locations for ~166K Twitter accounts
associated with ~92K user location, which we plan to make publicly available at
http://anonymous.com. Our proposed gender inference method achieve an F1 score
of 82.1%, which is 47.3% higher than majority baseline. In addition, we also
developed a demo and made it publicly available.
- Abstract(参考訳): twitterの性別分析は、男性と女性の間の重要な社会文化的違いを明らかにすることができる。
これまで、最も広く話されている言語のコンテンツについて、性別を分析・推定する努力は盛んに行われてきたが、我々の知識により、アラビア語では非常に限定的な作業が行われている。
本稿では,アラビア語のtwitter界における男女間の差異を広範囲に分析する。
専門職におけるユーザエンゲージメントの違い,関心トピック,男女差について検討した。
また、性別分析とともに、友達のユーザ名、プロフィール写真、ツイート、ネットワークを利用して性別を推測する手法を提案する。
そのために私たちは,約92Kのユーザロケーションに関連付けられた166万のTwitterアカウントの性別と位置情報を手作業でアノテートしました。
提案手法は,F1スコアが82.1%であり,過半数ベースラインよりも47.3%高い。
さらに、デモを開発して公開しました。
関連論文リスト
- Multilingual Text-to-Image Generation Magnifies Gender Stereotypes and Prompt Engineering May Not Help You [64.74707085021858]
多言語モデルは、モノリンガルモデルと同様に、有意な性別バイアスに悩まされていることを示す。
多言語モデルにおけるジェンダーバイアスの研究を促進するための新しいベンチマークMAGBIGを提案する。
以上の結果から,モデルが強い性バイアスを示すだけでなく,言語によって異なる行動を示すことが明らかとなった。
論文 参考訳(メタデータ) (2024-01-29T12:02:28Z) - Gender inference: can chatGPT outperform common commercial tools? [0.0]
生成人工知能(AI)ツールChatGPTと、市販のリストベースおよび機械学習ベースの性推論ツール3つを比較した。
具体的には、オリンピック選手の大規模なデータセットを使用して、入力のバリエーション(例えば、ファーストネームとファーストネームとラストネーム)が予測の正確さにどのように影響するかを報告します。
ChatGPTは少なくともNamsorと同様に動作し、特に国または/または名字情報が利用可能な女性のサンプルでは、その性能に優れることが多い。
論文 参考訳(メタデータ) (2023-11-24T22:09:14Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - Voices of Her: Analyzing Gender Differences in the AI Publication World [26.702520904075044]
我々は、AI分野における78K研究者のAI Scholarデータセットを用いて、いくつかの性別差を同定する。
女性第一著者の論文は、より長い文章、よりポジティブな感情の言葉、よりキャッチーなタイトルなど、異なる言語スタイルを示している。
私たちの分析は、私たちのAIコミュニティにおける現在の人口統計トレンドの窓口を提供し、将来、より多くの男女平等と多様性を奨励します。
論文 参考訳(メタデータ) (2023-05-24T00:40:49Z) - Auditing Gender Presentation Differences in Text-to-Image Models [54.16959473093973]
我々は、テキスト・ツー・イメージ・モデルにおいて、ジェンダーがどのように異なる形で提示されるかを研究する。
入力テキスト中の性指標を探索することにより、プレゼンテーション中心属性の周波数差を定量化する。
このような違いを推定する自動手法を提案する。
論文 参考訳(メタデータ) (2023-02-07T18:52:22Z) - The Arabic Parallel Gender Corpus 2.0: Extensions and Analyses [17.253633576291897]
本研究では,性別識別と書き直しのための新しいコーパスを提案する。
アラビア語は、ジェンダーマークに富む形態的言語である。
論文 参考訳(メタデータ) (2021-10-18T12:06:17Z) - 2020 U.S. Presidential Election: Analysis of Female and Male Users on
Twitter [8.651122862855495]
現在の文献は、主にユーザーの性別を考慮せずにツイートの内容を分析することに焦点を当てている。
この調査は、2020年の米大統領選挙中に投稿された大量のツイートを収集、分析する。
今回の発見は、税、気候変動、新型コロナウイルスのパンデミックなど、幅広いトピックに基づいています。
論文 参考訳(メタデータ) (2021-08-21T01:31:03Z) - Quantifying Gender Bias Towards Politicians in Cross-Lingual Language
Models [104.41668491794974]
代名詞として政治家の名前を取り巻く言語モデルによって生成される形容詞と動詞の用法を定量化する。
死者や指定された言葉が男女の政治家と関連しているのに対し、美人や離婚といった特定の言葉が主に女性政治家に関係していることが判明した。
論文 参考訳(メタデータ) (2021-04-15T15:03:26Z) - They, Them, Theirs: Rewriting with Gender-Neutral English [56.14842450974887]
私たちは、英語でジェンダーインクルージョンを促進する一般的な方法である特異点についてケーススタディを行います。
本研究では, 人為的データを持たない1%の単語誤り率で, ジェンダーニュートラルな英語を学習できるモデルについて述べる。
論文 参考訳(メタデータ) (2021-02-12T21:47:48Z) - Is Japanese gendered language used on Twitter ? A large scale study [0.0]
この調査は、2015年から2019年までの日本のツイート4800万件と、2355件のTwitterアカウントのタイムラインを、性別とカテゴリー(政治家、ミュージシャンなど)に分類したサンプルから始まった。
このコーパス上で大規模テキスト解析を行い、文末粒子(SFP)とテキストに現れる1人称代名詞を特定し、検討する。
事実、性別付き言語はTwitter上でも約6%のツイートで使われており、「男性」と「女性」の分類は、例外を除いて常に期待を満たさないことが判明した。
論文 参考訳(メタデータ) (2020-06-29T11:07:10Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。