論文の概要: Is Japanese gendered language used on Twitter ? A large scale study
- arxiv url: http://arxiv.org/abs/2006.15935v2
- Date: Thu, 9 Jul 2020 08:59:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 14:57:10.776185
- Title: Is Japanese gendered language used on Twitter ? A large scale study
- Title(参考訳): 日本語はTwitterで使われているか?
大規模な研究は
- Authors: Tiziana Carpi and Stefano Maria Iacus
- Abstract要約: この調査は、2015年から2019年までの日本のツイート4800万件と、2355件のTwitterアカウントのタイムラインを、性別とカテゴリー(政治家、ミュージシャンなど)に分類したサンプルから始まった。
このコーパス上で大規模テキスト解析を行い、文末粒子(SFP)とテキストに現れる1人称代名詞を特定し、検討する。
事実、性別付き言語はTwitter上でも約6%のツイートで使われており、「男性」と「女性」の分類は、例外を除いて常に期待を満たさないことが判明した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study analyzes the usage of Japanese gendered language on Twitter.
Starting from a collection of 408 million Japanese tweets from 2015 till 2019
and an additional sample of 2355 manually classified Twitter accounts timelines
into gender and categories (politicians, musicians, etc). A large scale textual
analysis is performed on this corpus to identify and examine sentence-final
particles (SFPs) and first-person pronouns appearing in the texts. It turns out
that gendered language is in fact used also on Twitter, in about 6% of the
tweets, and that the prescriptive classification into "male" and "female"
language does not always meet the expectations, with remarkable exceptions.
Further, SFPs and pronouns show increasing or decreasing trends, indicating an
evolution of the language used on Twitter.
- Abstract(参考訳): 本研究は,日本語のtwitter上での利用状況を分析した。
2015年から2019年にかけての4億8800万ツイートの収集から始まり、さらに2355の手動でtwitterアカウントのタイムラインを性別やカテゴリー(政治、ミュージシャンなど)に分類した。
このコーパス上で大規模テキスト解析を行い、文末粒子(SFP)とテキストに現れる1人称代名詞を特定し、検討する。
性別付き言語は実際にはtwitterでも使用されており、ツイートの約6%を占めており、"male"と"female"言語への規範的な分類は、注目すべき例外を除いて常に期待を満たしているとは限らない。
さらに、SFPや代名詞は増加または減少傾向を示し、Twitterで使用される言語の進化を示している。
関連論文リスト
- 'Since Lawyers are Males..': Examining Implicit Gender Bias in Hindi Language Generation by LLMs [4.021517742561241]
本研究はヒンディー語のテキスト生成における性差の暗黙的偏見を調査し,それを英語のそれと比較する。
以上の結果から, ヒンディー語では87.8%, 英語では33.4%であった。
この研究は、言語間での性別バイアスの変化を強調し、生成的AIシステムにおいてこれらのバイアスをナビゲートするための考察を提供する。
論文 参考訳(メタデータ) (2024-09-20T13:16:58Z) - What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Multilingual Text-to-Image Generation Magnifies Gender Stereotypes and Prompt Engineering May Not Help You [64.74707085021858]
多言語モデルは、モノリンガルモデルと同様に、有意な性別バイアスに悩まされていることを示す。
多言語モデルにおけるジェンダーバイアスの研究を促進するための新しいベンチマークMAGBIGを提案する。
以上の結果から,モデルが強い性バイアスを示すだけでなく,言語によって異なる行動を示すことが明らかとなった。
論文 参考訳(メタデータ) (2024-01-29T12:02:28Z) - ArabGend: Gender Analysis and Inference on Arabic Twitter [8.373984536015842]
アラビアのTwitter圏における男女間の違いを広範囲に分析した。
また、性別分析とともに、ユーザー名、プロフィール画像、つぶやき、友人のネットワークを利用して性別を推定する方法を提案する。
提案手法は,F1スコアが82.1%であり,過半数ベースラインよりも47.3%高い。
論文 参考訳(メタデータ) (2022-03-01T07:13:09Z) - The Arabic Parallel Gender Corpus 2.0: Extensions and Analyses [17.253633576291897]
本研究では,性別識別と書き直しのための新しいコーパスを提案する。
アラビア語は、ジェンダーマークに富む形態的言語である。
論文 参考訳(メタデータ) (2021-10-18T12:06:17Z) - 2020 U.S. Presidential Election: Analysis of Female and Male Users on
Twitter [8.651122862855495]
現在の文献は、主にユーザーの性別を考慮せずにツイートの内容を分析することに焦点を当てている。
この調査は、2020年の米大統領選挙中に投稿された大量のツイートを収集、分析する。
今回の発見は、税、気候変動、新型コロナウイルスのパンデミックなど、幅広いトピックに基づいています。
論文 参考訳(メタデータ) (2021-08-21T01:31:03Z) - Quantifying Gender Bias Towards Politicians in Cross-Lingual Language
Models [104.41668491794974]
代名詞として政治家の名前を取り巻く言語モデルによって生成される形容詞と動詞の用法を定量化する。
死者や指定された言葉が男女の政治家と関連しているのに対し、美人や離婚といった特定の言葉が主に女性政治家に関係していることが判明した。
論文 参考訳(メタデータ) (2021-04-15T15:03:26Z) - Understanding the Hoarding Behaviors during the COVID-19 Pandemic using
Large Scale Social Media Data [77.34726150561087]
われわれは、2020年3月1日から4月30日まで、米国で4万2000人以上のユニークTwitterユーザーによる嫌がらせと反嫌悪のパターンを分析した。
ホアーディンググループと反ホアーディンググループの両方の女性の比率が、一般のTwitter利用者の比率よりも高いことがわかりました。
LIWCの不安度はTwitterの不安度よりもかなり高い。
論文 参考訳(メタデータ) (2020-10-15T16:02:25Z) - Improving Sentiment Analysis over non-English Tweets using Multilingual
Transformers and Automatic Translation for Data-Augmentation [77.69102711230248]
我々は、英語のつぶやきを事前学習し、自動翻訳を用いてデータ拡張を適用して非英語の言語に適応する多言語トランスフォーマーモデルを提案する。
我々のフランス語、スペイン語、ドイツ語、イタリア語での実験は、この手法が非英語のツイートの小さなコーパスよりも、トランスフォーマーの結果を改善する効果的な方法であることを示唆している。
論文 参考訳(メタデータ) (2020-10-07T15:44:55Z) - LEBANONUPRISING: a thorough study of Lebanese tweets [0.0]
10月17日、レバノンは革命の開始を目撃し、レバノンアップライジングのハッシュタグはTwitter上でバイラルになった。
10月18日から21日までに10万のツイートからなるデータセットが収集された。
我々は、異なる機械学習アルゴリズムを用いて、レバノンアップライジングハッシュタグに関連するレバノン・アラビア語話者のツイートに対する感情分析を行った。
論文 参考訳(メタデータ) (2020-09-30T05:50:08Z) - #MeToo on Campus: Studying College Sexual Assault at Scale Using Data
Reported on Social Media [71.74529365205053]
我々は、#トレンドが大学フォロワーのプールに与える影響を分析した。
その結果、これらの#ツイートに埋め込まれたトピックの大部分は、セクシャルハラスメントのストーリーを詳述している。
この傾向といくつかの主要地理的地域に関する公式な報告との間には大きな相関関係がある。
論文 参考訳(メタデータ) (2020-01-16T18:05:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。