Fugu-MT 論文翻訳(概要): Unmasking Contextual Stereotypes: Measuring and Mitigating BERT's Gender Bias

論文の概要: Unmasking Contextual Stereotypes: Measuring and Mitigating BERT's Gender Bias

arxiv url: http://arxiv.org/abs/2010.14534v1
Date: Tue, 27 Oct 2020 18:06:09 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-02 11:56:37.662693
Title: Unmasking Contextual Stereotypes: Measuring and Mitigating BERT's Gender Bias
Title（参考訳）: 文脈ステレオタイプをアンマキングする:BERTの性バイアスの測定と緩和
Authors: Marion Bartl and Malvina Nissim and Albert Gatt
Abstract要約: 文脈化された単語の埋め込みは、NLPシステムにおける標準的な埋め込みを置き換えている。英語とドイツ語の専門職名と性別記述対象語との関係を調べた結果,性別バイアスを測定した。偏見を測定する手法はドイツ語のような豊かでジェンダーの指標を持つ言語に適していることを示す。
参考スコア（独自算出の注目度）: 12.4543414590979
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Contextualized word embeddings have been replacing standard embeddings as the representational knowledge source of choice in NLP systems. Since a variety of biases have previously been found in standard word embeddings, it is crucial to assess biases encoded in their replacements as well. Focusing on BERT (Devlin et al., 2018), we measure gender bias by studying associations between gender-denoting target words and names of professions in English and German, comparing the findings with real-world workforce statistics. We mitigate bias by fine-tuning BERT on the GAP corpus (Webster et al., 2018), after applying Counterfactual Data Substitution (CDS) (Maudslay et al., 2019). We show that our method of measuring bias is appropriate for languages such as English, but not for languages with a rich morphology and gender-marking, such as German. Our results highlight the importance of investigating bias and mitigation techniques cross-linguistically, especially in view of the current emphasis on large-scale, multilingual language models.
Abstract（参考訳）: 文脈的単語埋め込みは、NLPシステムにおける表現的知識源として標準埋め込みを置き換える。これまで様々なバイアスが標準的な単語埋め込みに見られてきたため、置換に符号化されたバイアスも評価することが重要である。 BERT (Devlin et al., 2018) に着目し, 性別を示す対象語と, 英語とドイツ語の職業名との関連性を調査し, 実世界の労働統計との比較を行った。我々は,GAPコーパス(Webster et al., 2018)上でBERTを微調整し,CDS(Maudslay et al., 2019)を適用した上でバイアスを軽減する。偏りを測定する方法は英語などの言語には適しているが、ドイツ語のような豊かな形態素と性標示を持つ言語には適さないことを示す。本研究は,近年の大規模多言語モデルを重視したバイアスと緩和手法を言語横断的に検討することの重要性を浮き彫りにした。

関連論文リスト

EuroGEST: Investigating gender stereotypes in multilingual language models [53.88459905621724]
大規模言語モデルはますます複数の言語をサポートするようになったが、ほとんどのベンチマークは英語中心のままである。 EuroGESTは、英語と29のヨーロッパ言語にまたがるLLMにおける性別ステレオタイプ推論を計測するためのデータセットである。
論文参考訳（メタデータ） (2025-06-04T11:58:18Z)
The Lou Dataset -- Exploring the Impact of Gender-Fair Language in German Text Classification [57.06913662622832]
ジェンダーフェア言語は、すべての性別に対処したり、中立形を使用することによって包摂性を促進する。ジェンダーフェア言語はラベルを反転させ、確実性を減らし、注意パターンを変化させることで予測に大きな影響を及ぼす。ドイツ語のテキスト分類への影響について最初の知見を提供する一方で、他の言語にもその知見が当てはまる可能性が高い。
論文参考訳（メタデータ） (2024-09-26T15:08:17Z)
Beyond Binary Gender: Evaluating Gender-Inclusive Machine Translation with Ambiguous Attitude Words [85.48043537327258]
既存の機械翻訳の性別バイアス評価は主に男性と女性の性別に焦点を当てている。本研究では,AmbGIMT (Gender-Inclusive Machine Translation with Ambiguous attitude words) のベンチマークを示す。本研究では,感情的態度スコア(EAS)に基づく性別バイアス評価手法を提案する。
論文参考訳（メタデータ） (2024-07-23T08:13:51Z)
Leveraging Large Language Models to Measure Gender Representation Bias in Gendered Language Corpora [9.959039325564744]
大規模言語モデル(LLM)は、しばしば、トレーニングデータに埋め込まれた社会的バイアスを継承し、増幅する。性バイアスとは、特定の役割や特性と特定の性別の関連性である。ジェンダー表現バイアスは、性別の異なる個人への参照の不平等な頻度である。
論文参考訳（メタデータ） (2024-06-19T16:30:58Z)
What is Your Favorite Gender, MLM? Gender Bias Evaluation in Multilingual Masked Language Models [8.618945530676614]
本稿では,中国語,英語,ドイツ語,ポルトガル語,スペイン語の5言語から,多言語辞書の性別バイアスを推定する手法を提案する。ジェンダーバイアスのより堅牢な分析のための文対を生成するために,新しいモデルに基づく手法を提案する。以上の結果から,複数の評価指標をベストプラクティスとして用いた大規模データセットでは,性別バイアスを研究すべきであることが示唆された。
論文参考訳（メタデータ） (2024-04-09T21:12:08Z)
Target-Agnostic Gender-Aware Contrastive Learning for Mitigating Bias in Multilingual Machine Translation [28.471506840241602]
ジェンダーバイアスは機械翻訳において重要な問題であり、バイアス軽減技術の研究が進行中である。本稿では,新しいアプローチに基づくバイアス緩和手法を提案する。 Gender-Aware Contrastive Learning, GACLは、文脈性情報を非明示性単語の表現にエンコードする。
論文参考訳（メタデータ） (2023-05-23T12:53:39Z)
Language-Agnostic Bias Detection in Language Models with Bias Probing [22.695872707061078]
プレトレーニング言語モデル(PLM)はNLPの主要な構成要素であるが、強い社会的バイアスを含んでいる。本研究では,PAMにおける社会的バイアスを頑健かつ言語に依存しない方法で評価するための,LABDetと呼ばれるバイアス探索手法を提案する。歴史的・政治的文脈に整合した6つの言語において,一貫した民族性バイアスパターンがモノリンガル PLM にまたがっていることがわかった。
論文参考訳（メタデータ） (2023-05-22T17:58:01Z)
Efficient Gender Debiasing of Pre-trained Indic Language Models [0.0]
言語モデルが事前訓練されたデータに存在する性別バイアスは、これらのモデルを使用するシステムに反映される。本稿では,ヒンディー語モデルにおける職業に関する性別バイアスを測定した。以上の結果から,提案手法の適応後のバイアスが低減されることが示唆された。
論文参考訳（メタデータ） (2022-09-08T09:15:58Z)
Evaluating Gender Bias in Hindi-English Machine Translation [0.1503974529275767]
我々は,ヒンディー語の文法的考察に基づいて,TGBI計量の修正版を実装した。我々は、事前学習した埋め込みのための複数のメトリクスと、機械翻訳モデルで学習したメトリクスを比較して比較する。
論文参考訳（メタデータ） (2021-06-16T10:35:51Z)
Decoding and Diversity in Machine Translation [90.33636694717954]
NMTが楽しむBLEUスコアに対して支払う費用の多様性の違いを特徴付ける。本研究は,ジェンダー代名詞を翻訳する際に,検索が既知バイアスの正解源となることを示唆する。
論文参考訳（メタデータ） (2020-11-26T21:09:38Z)
Gender Stereotype Reinforcement: Measuring the Gender Bias Conveyed by Ranking Algorithms [68.85295025020942]
本稿では,性別ステレオタイプをサポートする検索エンジンの傾向を定量化するジェンダーステレオタイプ強化(GSR)尺度を提案する。 GSRは、表現上の害を定量化できる情報検索のための、最初の特別に調整された尺度である。
論文参考訳（メタデータ） (2020-09-02T20:45:04Z)
Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文参考訳（メタデータ） (2020-05-02T04:34:37Z)
Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文参考訳（メタデータ） (2020-05-01T21:23:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。