論文の概要: Multilingual Contextual Affective Analysis of LGBT People Portrayals in
Wikipedia
- arxiv url: http://arxiv.org/abs/2010.10820v2
- Date: Thu, 8 Apr 2021 08:20:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 23:52:06.856845
- Title: Multilingual Contextual Affective Analysis of LGBT People Portrayals in
Wikipedia
- Title(参考訳): ウィキペディアにおけるLGBTの多言語的文脈影響分析
- Authors: Chan Young Park, Xinru Yan, Anjalie Field, Yulia Tsvetkov
- Abstract要約: 物語文における特定の語彙選択は、物語の中の人々に対する作家の態度を反映し、聴衆の反応に影響を与える。
言語や文化によって単語の意味がどう異なるかを示し、既存の英語データセットを一般化することの難しさを浮き彫りにしている。
次に、LGBTコミュニティのメンバーのウィキペディアの伝記ページを3つの言語で分析することで、本手法の有用性を実証する。
- 参考スコア(独自算出の注目度): 34.183132688084534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Specific lexical choices in narrative text reflect both the writer's
attitudes towards people in the narrative and influence the audience's
reactions. Prior work has examined descriptions of people in English using
contextual affective analysis, a natural language processing (NLP) technique
that seeks to analyze how people are portrayed along dimensions of power,
agency, and sentiment. Our work presents an extension of this methodology to
multilingual settings, which is enabled by a new corpus that we collect and a
new multilingual model. We additionally show how word connotations differ
across languages and cultures, highlighting the difficulty of generalizing
existing English datasets and methods. We then demonstrate the usefulness of
our method by analyzing Wikipedia biography pages of members of the LGBT
community across three languages: English, Russian, and Spanish. Our results
show systematic differences in how the LGBT community is portrayed across
languages, surfacing cultural differences in narratives and signs of social
biases. Practically, this model can be used to identify Wikipedia articles for
further manual analysis -- articles that might contain content gaps or an
imbalanced representation of particular social groups.
- Abstract(参考訳): 物語における特定の語彙選択は、物語中の人々に対する作家の態度と観客の反応の両方を反映している。
先行研究は、文脈的感情分析(英語版)、自然言語処理(英語版) (NLP) 技術を用いて、人々が力、代理、感情の次元に沿ってどのように描写されるかを分析する。
我々は,この手法を多言語設定に拡張し,収集した新しいコーパスと新しい多言語モデルによって実現した。
さらに,単語の意味が言語や文化によってどのように異なるかを示し,既存の英語データセットや手法を一般化する難しさを強調した。
次に、英語、ロシア語、スペイン語の3言語のlgbtコミュニティのメンバーのウィキペディアの伝記ページを分析し、本手法の有用性を示す。
以上の結果から,lgbtコミュニティの言語間における表現方法の系統的差異が示唆され,物語の文化的差異や社会的バイアスの兆候が示唆された。
このモデルは、コンテンツギャップや特定の社会的グループの不均衡な表現を含むかもしれない記事など、ウィキペディアの記事のさらなる手動分析に使用することができる。
関連論文リスト
- Computer Vision Datasets and Models Exhibit Cultural and Linguistic
Diversity in Perception [28.716435050743957]
異なる文化的背景を持つ人々が、同じ視覚刺激を視る場合でも、いかに異なる概念を観察するかを考察する。
同じ画像に対して7つの言語で生成されたテキスト記述を比較することで,意味内容と言語表現に有意な差が認められた。
私たちの研究は、コンピュータビジョンコミュニティにおける人間の知覚の多様性を考慮し、受け入れる必要性に注目しています。
論文 参考訳(メタデータ) (2023-10-22T16:51:42Z) - Cordyceps@LT-EDI: Patching Language-Specific Homophobia/Transphobia
Classifiers with a Multilingual Understanding [0.0]
ホモフォビアおよびトランスフォビアヘイトスピーチ検出のための多言語(M-L)と言語固有の(L-S)アプローチを提案する。
M-Lモデルは、特定の言語では一般的でない、あるいは欠落している単語、フレーズ、概念をキャッチするために必要である。
L-Sモデルは、通常特定の言語で書くユーザーの文化的・言語的文脈を理解するのに適している。
論文 参考訳(メタデータ) (2023-09-24T06:37:54Z) - Multi-lingual and Multi-cultural Figurative Language Understanding [69.47641938200817]
図形言語は人間のコミュニケーションに浸透するが、NLPでは比較的過小評価されている。
Hindi, Indonesian, Javanese, Kannada, Sundanese, Swahili, Yorubaの7つの多様な言語に関するデータセットを作成しました。
我々のデータセットから,各言語は,同じ領域から派生した言語間で最も高い重なり合いを持つ,図形表現の文化的・地域的概念に依存していることが明らかとなった。
全ての言語は、事前学習データと微調整データの可用性を反映した性能の変化により、英語と比較して大きな欠陥がある。
論文 参考訳(メタデータ) (2023-05-25T15:30:31Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Whose Opinions Matter? Perspective-aware Models to Identify Opinions of
Hate Speech Victims in Abusive Language Detection [6.167830237917662]
異なるコミュニティから生まれる偏極的な意見をモデル化するための詳細な研究を提示する。
この情報に頼ることで、アノテータを同様の視点を共有するグループに分割できると考えています。
本稿では,オンライン虐待を特徴付けるためのサブカテゴリによって注釈付けされた,新しいリソース,多視点英語データセットを提案する。
論文 参考訳(メタデータ) (2021-06-30T08:35:49Z) - Pick a Fight or Bite your Tongue: Investigation of Gender Differences in
Idiomatic Language Usage [9.892162266128306]
我々は、話者の性別に注釈を付けた、新しくて大きくて多様な自発言語生成コーパスをコンパイルする。
本研究は,男性と女性におけるテクスト表現言語の使用における区別に関する大規模な実証的研究である。
論文 参考訳(メタデータ) (2020-10-31T18:44:07Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z) - A Framework for the Computational Linguistic Analysis of Dehumanization [52.735780962665814]
我々は1986年から2015年にかけてニューヨーク・タイムズでLGBTQの人々に関する議論を分析した。
LGBTQの人々の人為的な記述は、時間とともにますます増えています。
大規模に非人間化言語を分析する能力は、メディアバイアスを自動的に検出し、理解するだけでなく、オンラインで乱用する言語にも影響を及ぼす。
論文 参考訳(メタデータ) (2020-03-06T03:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。