論文の概要: Multilingual Contextual Affective Analysis of LGBT People Portrayals in
Wikipedia
- arxiv url: http://arxiv.org/abs/2010.10820v2
- Date: Thu, 8 Apr 2021 08:20:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 23:52:06.856845
- Title: Multilingual Contextual Affective Analysis of LGBT People Portrayals in
Wikipedia
- Title(参考訳): ウィキペディアにおけるLGBTの多言語的文脈影響分析
- Authors: Chan Young Park, Xinru Yan, Anjalie Field, Yulia Tsvetkov
- Abstract要約: 物語文における特定の語彙選択は、物語の中の人々に対する作家の態度を反映し、聴衆の反応に影響を与える。
言語や文化によって単語の意味がどう異なるかを示し、既存の英語データセットを一般化することの難しさを浮き彫りにしている。
次に、LGBTコミュニティのメンバーのウィキペディアの伝記ページを3つの言語で分析することで、本手法の有用性を実証する。
- 参考スコア(独自算出の注目度): 34.183132688084534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Specific lexical choices in narrative text reflect both the writer's
attitudes towards people in the narrative and influence the audience's
reactions. Prior work has examined descriptions of people in English using
contextual affective analysis, a natural language processing (NLP) technique
that seeks to analyze how people are portrayed along dimensions of power,
agency, and sentiment. Our work presents an extension of this methodology to
multilingual settings, which is enabled by a new corpus that we collect and a
new multilingual model. We additionally show how word connotations differ
across languages and cultures, highlighting the difficulty of generalizing
existing English datasets and methods. We then demonstrate the usefulness of
our method by analyzing Wikipedia biography pages of members of the LGBT
community across three languages: English, Russian, and Spanish. Our results
show systematic differences in how the LGBT community is portrayed across
languages, surfacing cultural differences in narratives and signs of social
biases. Practically, this model can be used to identify Wikipedia articles for
further manual analysis -- articles that might contain content gaps or an
imbalanced representation of particular social groups.
- Abstract(参考訳): 物語における特定の語彙選択は、物語中の人々に対する作家の態度と観客の反応の両方を反映している。
先行研究は、文脈的感情分析(英語版)、自然言語処理(英語版) (NLP) 技術を用いて、人々が力、代理、感情の次元に沿ってどのように描写されるかを分析する。
我々は,この手法を多言語設定に拡張し,収集した新しいコーパスと新しい多言語モデルによって実現した。
さらに,単語の意味が言語や文化によってどのように異なるかを示し,既存の英語データセットや手法を一般化する難しさを強調した。
次に、英語、ロシア語、スペイン語の3言語のlgbtコミュニティのメンバーのウィキペディアの伝記ページを分析し、本手法の有用性を示す。
以上の結果から,lgbtコミュニティの言語間における表現方法の系統的差異が示唆され,物語の文化的差異や社会的バイアスの兆候が示唆された。
このモデルは、コンテンツギャップや特定の社会的グループの不均衡な表現を含むかもしれない記事など、ウィキペディアの記事のさらなる手動分析に使用することができる。
関連論文リスト
- Locating Information Gaps and Narrative Inconsistencies Across Languages: A Case Study of LGBT People Portrayals on Wikipedia [49.80565462746646]
我々は,情報ギャップと矛盾を事実レベルで特定するための,効率的かつ信頼性の高い手法であるInfoGap法を紹介した。
我々は、LGBTの人々の描写を分析してInfoGapを評価し、英語、ロシア語、フランス語のウィキペディアの2.7Kの伝記ページを解析した。
論文 参考訳(メタデータ) (2024-10-05T20:40:49Z) - What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Inclusivity in Large Language Models: Personality Traits and Gender Bias in Scientific Abstracts [49.97673761305336]
我々は,3つの大きな言語モデル (LLM) を,人間の物語スタイルと潜在的な性別バイアスに適合させることで評価した。
以上の結果から,これらのモデルは一般的にヒトの投稿内容によく似たテキストを生成するが,スタイル的特徴の変化は有意な性差を示すことが示唆された。
論文 参考訳(メタデータ) (2024-06-27T19:26:11Z) - Cordyceps@LT-EDI: Patching Language-Specific Homophobia/Transphobia
Classifiers with a Multilingual Understanding [0.0]
ホモフォビアおよびトランスフォビアヘイトスピーチ検出のための多言語(M-L)と言語固有の(L-S)アプローチを提案する。
M-Lモデルは、特定の言語では一般的でない、あるいは欠落している単語、フレーズ、概念をキャッチするために必要である。
L-Sモデルは、通常特定の言語で書くユーザーの文化的・言語的文脈を理解するのに適している。
論文 参考訳(メタデータ) (2023-09-24T06:37:54Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Whose Opinions Matter? Perspective-aware Models to Identify Opinions of
Hate Speech Victims in Abusive Language Detection [6.167830237917662]
異なるコミュニティから生まれる偏極的な意見をモデル化するための詳細な研究を提示する。
この情報に頼ることで、アノテータを同様の視点を共有するグループに分割できると考えています。
本稿では,オンライン虐待を特徴付けるためのサブカテゴリによって注釈付けされた,新しいリソース,多視点英語データセットを提案する。
論文 参考訳(メタデータ) (2021-06-30T08:35:49Z) - Pick a Fight or Bite your Tongue: Investigation of Gender Differences in
Idiomatic Language Usage [9.892162266128306]
我々は、話者の性別に注釈を付けた、新しくて大きくて多様な自発言語生成コーパスをコンパイルする。
本研究は,男性と女性におけるテクスト表現言語の使用における区別に関する大規模な実証的研究である。
論文 参考訳(メタデータ) (2020-10-31T18:44:07Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。