論文の概要: Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation
- arxiv url: http://arxiv.org/abs/2005.00965v1
- Date: Sun, 3 May 2020 02:33:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-07 06:04:27.664671
- Title: Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation
- Title(参考訳): Double-Hard Debias: ジェンダーバイアス軽減のための単語埋め込み
- Authors: Tianlu Wang, Xi Victoria Lin, Nazneen Fatema Rajani, Bryan McCann,
Vicente Ordonez, Caiming Xiong
- Abstract要約: 本稿では,性別サブスペースの推測と削除に先立って,コーパス正規性に対する単語埋め込みを浄化する手法を提案する。
本手法は,事前学習した単語埋め込みの分布的意味を保ちつつ,性別バイアスを従来の手法よりもはるかに大きい程度に低減する。
- 参考スコア(独自算出の注目度): 94.98656228690233
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Word embeddings derived from human-generated corpora inherit strong gender
bias which can be further amplified by downstream models. Some commonly adopted
debiasing approaches, including the seminal Hard Debias algorithm, apply
post-processing procedures that project pre-trained word embeddings into a
subspace orthogonal to an inferred gender subspace. We discover that
semantic-agnostic corpus regularities such as word frequency captured by the
word embeddings negatively impact the performance of these algorithms. We
propose a simple but effective technique, Double Hard Debias, which purifies
the word embeddings against such corpus regularities prior to inferring and
removing the gender subspace. Experiments on three bias mitigation benchmarks
show that our approach preserves the distributional semantics of the
pre-trained word embeddings while reducing gender bias to a significantly
larger degree than prior approaches.
- Abstract(参考訳): 人間生成コーパスから派生した単語埋め込みは、下流モデルによってさらに増幅される強いジェンダーバイアスを継承する。
seminal hard debiasアルゴリズムを含む、一般的に採用されているデバイアスアプローチのいくつかは、前訓練された単語が推論された性部分空間に直交する部分空間に埋め込まれる後処理の手順を適用する。
単語埋め込みによって捉えた単語頻度などの意味認識型コーパス規則が,これらのアルゴリズムの性能に悪影響を及ぼすことがわかった。
そこで本稿では,性別サブスペースの推測と削除に先立って,このようなコーパス正規性に対して単語を埋め込む,単純だが効果的な手法であるDouble Hard Debiasを提案する。
3つのバイアス緩和ベンチマーク実験により, 事前学習した単語埋め込みの分布的意味を保ちつつ, 性別バイアスを従来よりもかなり大きく抑えることができた。
関連論文リスト
- The Impact of Debiasing on the Performance of Language Models in
Downstream Tasks is Underestimated [70.23064111640132]
我々は、幅広いベンチマークデータセットを用いて、複数の下流タスクのパフォーマンスに対するデバイアスの影響を比較した。
実験により、デバイアスの効果は全てのタスクにおいて一貫して見積もられていることが示されている。
論文 参考訳(メタデータ) (2023-09-16T20:25:34Z) - Counter-GAP: Counterfactual Bias Evaluation through Gendered Ambiguous
Pronouns [53.62845317039185]
バイアス測定データセットは、言語モデルのバイアスされた振る舞いを検出する上で重要な役割を果たす。
本稿では, 多様な, 自然な, 最小限のテキストペアを, 対物生成によって収集する新しい手法を提案する。
事前学習された4つの言語モデルは、各グループ内よりも、異なる性別グループ間でかなり不整合であることを示す。
論文 参考訳(メタデータ) (2023-02-11T12:11:03Z) - MABEL: Attenuating Gender Bias using Textual Entailment Data [20.489427903240017]
我々は、文脈化表現における性別バイアスを軽減するための中間的事前学習手法であるMABELを提案する。
このアプローチの鍵となるのは、非現実的に強化されたジェンダーバランスのエンターメントペアに対して、対照的な学習目標を使用することである。
我々はMABELが従来のタスク非依存のデバイアスアプローチよりも公平性で優れていることを示す。
論文 参考訳(メタデータ) (2022-10-26T18:36:58Z) - Balancing out Bias: Achieving Fairness Through Training Reweighting [58.201275105195485]
自然言語処理におけるバイアスは、性別や人種などの著者の特徴を学習するモデルから生じる。
既存のバイアスの緩和と測定方法は、著者の人口統計学と言語変数の相関を直接考慮していない。
本稿では,インスタンス再重み付けを用いたバイアス対策法を提案する。
論文 参考訳(メタデータ) (2021-09-16T23:40:28Z) - Dictionary-based Debiasing of Pre-trained Word Embeddings [28.378270372391498]
予め訓練された単語埋め込みを辞書で解読する手法を提案する。
提案手法では,単語リストの形で事前に定義するバイアスの種類は必要としない。
標準ベンチマークデータセットの実験結果から,前訓練された単語埋め込みにエンコードされた不公平なバイアスを正確に除去できることが示された。
論文 参考訳(メタデータ) (2021-01-23T15:44:23Z) - Exploring the Linear Subspace Hypothesis in Gender Bias Mitigation [57.292988892028134]
Bolukbasi et al. は、単語表現のための最初の性別バイアス緩和手法の1つである。
我々はそれらの手法を、カーネル化された非線形バージョンに一般化する。
我々は、バイアス部分空間が実際に線型であるかどうかを経験的に分析する。
論文 参考訳(メタデータ) (2020-09-20T14:13:45Z) - MDR Cluster-Debias: A Nonlinear WordEmbedding Debiasing Pipeline [3.180013942295509]
単語埋め込みの既存の手法は、しばしば表面的には、特定の性別とステレオタイプに結びついている単語は、デバイアスされた空間で一緒にクラスタ化される。
本稿では、この残差クラスタリングがなぜ存在するのか、どのように対処されるのかを考察する。
残留バイアスが存在する2つの潜在的な理由を特定し、このバイアスを軽減するために新しいパイプラインであるMDR Cluster-Debiasを開発する。
論文 参考訳(メタデータ) (2020-06-20T20:03:07Z) - Nurse is Closer to Woman than Surgeon? Mitigating Gender-Biased
Proximities in Word Embeddings [37.65897382453336]
単語ベクターの空間配置に隠された性別バイアスを緩和することは,既存の単語埋め込みの処理方法では不可能である。
我々は,単語ベクトルに存在するバイアスを排除し,隣接するベクトルの空間分布を変化させる,新しいジェンダーデバイアス手法であるRAN-Debiasを提案する。
我々はまた、新しいバイアス評価指標、ジェンダーベースIllicit Proximity Estimate (GIPE)を提案する。
論文 参考訳(メタデータ) (2020-06-02T20:50:43Z) - Mitigating Gender Bias Amplification in Distribution by Posterior
Regularization [75.3529537096899]
本稿では,男女差の増幅問題について,分布の観点から検討する。
後続正則化に基づくバイアス緩和手法を提案する。
私たちの研究はバイアス増幅の理解に光を当てている。
論文 参考訳(メタデータ) (2020-05-13T11:07:10Z) - Neutralizing Gender Bias in Word Embedding with Latent Disentanglement
and Counterfactual Generation [25.060917870666803]
適応的な勾配反転層を有するシアム自動エンコーダ構造を導入する。
我々の構造は,単語の意味潜時情報と性別潜時情報を,非結合潜時次元に分離することを可能にする。
論文 参考訳(メタデータ) (2020-04-07T05:16:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。