論文の概要: Exploring Wikipedia Gender Diversity Over Time $\unicode{x2013}$ The Wikipedia Gender Dashboard (WGD)
- arxiv url: http://arxiv.org/abs/2501.12610v1
- Date: Wed, 22 Jan 2025 03:28:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-23 16:53:35.942701
- Title: Exploring Wikipedia Gender Diversity Over Time $\unicode{x2013}$ The Wikipedia Gender Dashboard (WGD)
- Title(参考訳): Wikipedia Gender Diversity Over Time $\unicode{x2013}$ The Wikipedia Gender Dashboard (WGD)
- Authors: Yahya Yunus, Tianwa Chen, Gianluca Demartini,
- Abstract要約: 本稿では、ジェンダー配信データとのインタラクションを可能にするツールであるウィキペディア・ジェンダー・ダッシュボード(WGD)について述べる。
分析の結果、女性記事はウィキペディアの約17%に過ぎなかったが、過去20年間で着実に伸びている。
「人」のサブクラスのほとんどは男性支配である。
- 参考スコア(独自算出の注目度): 4.292453466361998
- License:
- Abstract: The Wikipedia editors' community has been actively pursuing the intent of achieving gender equality. To that end, it is important to explore the historical evolution of underlying gender disparities in Wikipedia articles. This paper presents the Wikipedia Gender Dashboard (WGD), a tool designed to enable the interaction with gender distribution data, including the average age in every subclass of individuals (i.e. Astronauts, Politicians, etc.) over the years. Wikipedia APIs, DBpedia, and Wikidata endpoints were used to query the data to ensure persistent data collection. The WGD was then created with Microsoft Power BI before being embedded on a public website. The analysis of the data available in the WGD found that female articles only represent around 17% of English Wikipedia, but it has been growing steadily over the last 20 years. Meanwhile, the average age across genders decreased over time. WGD also shows that most subclasses of `Person' are male-dominated. Wikipedia editors can make use of WGD to locate areas with marginalized genders in Wikipedia, and increase their efforts to produce more content providing coverage for those genders to achieve better gender equality in Wikipedia.
- Abstract(参考訳): Wikipedia編集者のコミュニティは、ジェンダー平等を達成する意図を積極的に追求している。
そのために、ウィキペディアの記事における男女格差の歴史的進化を探求することが重要である。
本論文は、長年にわたり、宇宙飛行士、政治家など)のすべてのサブクラスの平均年齢を含む、性別分布データとのインタラクションを可能にするツールであるウィキペディア・ジェンダー・ダッシュボード(WGD)を提示する。
Wikipedia API、DBpedia、Wikidataエンドポイントは、永続的なデータ収集を保証するためにデータクエリに使用された。
WGDはその後Microsoft Power BIで作成され、公開ウェブサイトに埋め込まれた。
WGDのデータ分析によると、女性記事はウィキペディアの約17%にすぎないが、この20年間で着実に伸びている。
一方、性別ごとの平均年齢は時間とともに減少した。
WGDはまた、「パーソン」のほとんどのサブクラスが男性に支配されていることも示している。
ウィキペディアの編集者はWGDを利用して、ウィキペディアの男女間距離を狭める領域を見つけ、ウィキペディアのジェンダー平等を向上するために、これらのジェンダーをカバーできるコンテンツを増やす努力を増すことができる。
関連論文リスト
- Survival of the Notable: Gender Asymmetry in Wikipedia Collective Deliberations [0.0]
ウィキペディアにおける削除記事(AfD)の議論により、編集者は既存の記事の可読性を評価することができる。
編集長が女性削除の合意に達するまでに長い時間を要するにもかかわらず、女性の伝記は男性よりも早く削除にノミネートされていることが判明した。
歴史人物に関するAfDは、議論中の伝記を他の百科事典にリダイレクトまたはマージする傾向が強い。
論文 参考訳(メタデータ) (2024-11-07T00:37:24Z) - Estimating Gender Completeness in Wikipedia [4.292453466361998]
本論文の目的は,ウィキペディアコミュニティに対して,異なるエンティティタイプに対する問題の規模を推定する手段を提供することである。
以上の結果から,ウィキペディアでは,異なるサブクラスの人に対してどのジェンダーが一般的かだけでなく,異なるジェンダーとサブクラスの人に対するカバー範囲の完全性についても考察した。
論文 参考訳(メタデータ) (2024-01-17T06:03:31Z) - The Gender-GAP Pipeline: A Gender-Aware Polyglot Pipeline for Gender
Characterisation in 55 Languages [51.2321117760104]
本稿では,55言語を対象とした大規模データセットにおけるジェンダー表現を特徴付ける自動パイプラインであるGender-GAP Pipelineについて述べる。
このパイプラインは、性別付き人称名詞の多言語語彙を用いて、テキスト中の性別表現を定量化する。
本稿では、WMTのトレーニングデータとNewsタスクの開発データにジェンダー表現を報告し、現在のデータが男性表現にスキューされていることを確認する。
論文 参考訳(メタデータ) (2023-08-31T17:20:50Z) - Publishing Wikipedia usage data with strong privacy guarantees [6.410779699541235]
約20年間、ウィキメディア財団はウィキペディアの各ページを毎日何人訪問したかという統計を公表してきた。
2023年6月、ウィキメディア財団はこれらの統計データをより細かい粒度で公開し始めた。
本稿では、このデータ公開について、その目標、プロセスの展開開始とデータリリースの結果について述べる。
論文 参考訳(メタデータ) (2023-08-30T19:58:56Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - WikiDes: A Wikipedia-Based Dataset for Generating Short Descriptions
from Paragraphs [66.88232442007062]
ウィキデックスはウィキペディアの記事の短い記述を生成するデータセットである。
データセットは、6987のトピックに関する80万以上の英語サンプルで構成されている。
本論文は,ウィキペディアとウィキデータに多くの記述が欠落していることから,実際的な影響を示すものである。
論文 参考訳(メタデータ) (2022-09-27T01:28:02Z) - Gender Stereotype Reinforcement: Measuring the Gender Bias Conveyed by
Ranking Algorithms [68.85295025020942]
本稿では,性別ステレオタイプをサポートする検索エンジンの傾向を定量化するジェンダーステレオタイプ強化(GSR)尺度を提案する。
GSRは、表現上の害を定量化できる情報検索のための、最初の特別に調整された尺度である。
論文 参考訳(メタデータ) (2020-09-02T20:45:04Z) - Global gender differences in Wikipedia readership [14.112831377937107]
ウィキペディアの読者層における性別差の新たな証拠と,そのユーザの行動記録にどのように現れるかを示す。
より具体的には、(1)ウィキペディアの読者の間では女性が不足していること、(2)女性は男性よりも読書セッション当たりのページ数が少ないこと、(3)男女が同様の理由でウィキペディアを訪れていること、(4)男女が特定のトピックの好みを示すことを報告している。
論文 参考訳(メタデータ) (2020-07-20T18:40:32Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z) - Entity Extraction from Wikipedia List Pages [2.3605348648054463]
私たちは、DBpediaをバックボーンとして、カテゴリとリストページから大規模な分類を構築します。
遠隔監視により、リストページ内の新しいエンティティの識別のためのトレーニングデータを抽出する。
我々はDBpediaを7.5万の新しい型ステートメントと380万の高精度な新しい事実で拡張する。
論文 参考訳(メタデータ) (2020-03-11T07:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。