論文の概要: Gender Bias in Meta-Embeddings
- arxiv url: http://arxiv.org/abs/2205.09867v1
- Date: Thu, 19 May 2022 21:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-24 09:44:47.671891
- Title: Gender Bias in Meta-Embeddings
- Title(参考訳): メタエンベディングにおけるジェンダーバイアス
- Authors: Masahiro Kaneko, Danushka Bollegala, Naoaki Okazaki
- Abstract要約: マルチソース・ノン・デバイアス、マルチソース・シングル・デバイアス、シングルソース・マルチ・デバイアスの3種類のメタ・エンベッドにおけるバイアスについて検討する。
その結果,3つのバイアス評価ベンチマークのうち,2つ中2つでデバイアスが最良であることが判明した。
- 参考スコア(独自算出の注目度): 33.044775876807826
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Combining multiple source embeddings to create meta-embeddings is considered
effective to obtain more accurate embeddings. Different methods have been
proposed to develop meta-embeddings from a given set of source embeddings.
However, the source embeddings can contain unfair gender bias, and the bias in
the combination of multiple embeddings and debiasing it effectively have not
been studied yet. In this paper, we investigate the bias in three types of
meta-embeddings: (1) Multi-Source No-Debiasing: meta-embedding from multiple
source embeddings without any debiasing. The experimental results show that
meta-embedding amplifies the gender bias compared to those of input source
embeddings; (2) Multi-Source Single-Debiasing: meta-embedding from multiple
source embeddings debiased by a single method and it can be created in three
ways: debiasing each source embedding, debiasing the learned meta-embeddings,
and debiasing both source embeddings and meta-embeddings. The results show that
debiasing both is the best in two out of three bias evaluation benchmarks; (3)
Single-Source Multi-Debiasing: meta-embedding from the same source embedding
debiased by different methods. It performed more effectively than its source
embeddings debiased with a single method in all three bias evaluation
benchmarks.
- Abstract(参考訳): メタ埋め込みを作成するために複数のソース埋め込みを組み合わせることは、より正確な埋め込みを得るのに効果的であると考えられる。
与えられたソース組込みからメタ組込みを開発するために異なる方法が提案されている。
しかし、ソース埋め込みには不公平な性別バイアスがあり、複数の埋め込みとデバイアスの組合せにおけるバイアスはまだ研究されていない。
本稿では,(1)マルチソース・ノー・デビジング:デビジングのない複数ソース組込みからのメタエンビジング,の3種類のメタエンベディングにおけるバイアスについて検討する。
実験の結果,メタ埋め込みは入力ソース埋め込みと比較して性別バイアスを増幅することが明らかとなった。(2)マルチソース単一バイアス:複数のソース埋め込みからメタ埋め込みをデバイアス化し,各ソース埋め込みのデバイアス化,学習メタ埋め込みのデバイアス化,およびソース埋め込みとメタ埋め込みの両方のデバイアス化という3つの方法で生成することができる。
その結果、3つのバイアス評価ベンチマークのうち2つのうちデバイアスが最適であることが判明した: (3) 単一ソースマルチデバイアス: 異なる手法でデバイアスを埋め込んだ同じソースからのメタエンベディング。
3つのバイアス評価ベンチマークで1つのメソッドでデバイアスされたソース埋め込みよりも効果的に動作した。
関連論文リスト
- Revisiting the Dataset Bias Problem from a Statistical Perspective [72.94990819287551]
統計的観点から「データセットバイアス」問題を考察する。
問題の主な原因は、クラス属性 u と非クラス属性 b の強い相関関係である。
本稿では,各試料nの目的をフラクタル1p(u_n|b_n)で重み付けするか,その試料をフラクタル1p(u_n|b_n)に比例してサンプリングすることにより,データセットバイアスを軽減することを提案する。
論文 参考訳(メタデータ) (2024-02-05T22:58:06Z) - Introducing MBIB -- the first Media Bias Identification Benchmark Task
and Dataset Collection [24.35462897801079]
我々は,メディアバイアス識別ベンチマーク(MBIB)を導入し,メディアバイアスを共通の枠組みの下でグループ化する。
115のデータセットをレビューした後、9つのタスクを選択し、メディアバイアス検出技術を評価するために、22の関連するデータセットを慎重に提案する。
我々の結果は、ヘイトスピーチ、人種的偏見、性別的偏見は検出しやすいが、モデルが認知や政治的偏見といった特定のバイアスタイプを扱うのに苦労していることを示唆している。
論文 参考訳(メタデータ) (2023-04-25T20:49:55Z) - Exploiting Transformer-based Multitask Learning for the Detection of
Media Bias in News Articles [21.960154864540282]
メディアバイアスを検出するために,マルチタスク学習を用いて学習したトランスフォーマーに基づくディープラーニングアーキテクチャを提案する。
我々の最高のパフォーマンス実装は、マクロ$F_1$の0.776を実現しています。
論文 参考訳(メタデータ) (2022-11-07T12:22:31Z) - The SAME score: Improved cosine based bias score for word embeddings [63.24247894974291]
文献の考えに基づくバイアス定義を提供し、バイアススコアの新たな要件を導出する。
既存のバイアススコアの欠点に対処し,単語埋め込みにおけるバイアスの定量化に好適であることを示す。
論文 参考訳(メタデータ) (2022-03-28T09:28:13Z) - Evaluating Metrics for Bias in Word Embeddings [64.55554083622258]
我々は、過去の研究の考えに基づいてバイアス定義を定式化し、バイアスメトリクスの条件を導出する。
そこで我々は,既存のメトリクスの欠点に対処する新しい計量であるhetを提案し,その振る舞いを数学的に証明する。
論文 参考訳(メタデータ) (2021-11-15T16:07:15Z) - "Thy algorithm shalt not bear false witness": An Evaluation of
Multiclass Debiasing Methods on Word Embeddings [3.0204693431381515]
本稿では,最先端のマルチクラス・デバイアス技術であるハード・デバイアス,ソフトウィート・デバイアス,コンセプタ・デバイアスについて検討する。
単語埋め込みアソシエーションテスト(WEAT)、平均コサイン類似度(MAC)、相対負性感覚バイアス(RNSB)によるバイアス除去を定量化することにより、共通のバイアス除去時のパフォーマンスを評価する。
論文 参考訳(メタデータ) (2020-10-30T12:49:39Z) - MDR Cluster-Debias: A Nonlinear WordEmbedding Debiasing Pipeline [3.180013942295509]
単語埋め込みの既存の手法は、しばしば表面的には、特定の性別とステレオタイプに結びついている単語は、デバイアスされた空間で一緒にクラスタ化される。
本稿では、この残差クラスタリングがなぜ存在するのか、どのように対処されるのかを考察する。
残留バイアスが存在する2つの潜在的な理由を特定し、このバイアスを軽減するために新しいパイプラインであるMDR Cluster-Debiasを開発する。
論文 参考訳(メタデータ) (2020-06-20T20:03:07Z) - Towards Robustifying NLI Models Against Lexical Dataset Biases [94.79704960296108]
本稿では、語彙的データセットバイアスに対するモデル強化のための、データレベルとモデルレベルのデバイアス法の両方について検討する。
まず、データ拡張と拡張によってデータセットをデバイアスするが、この方法でモデルバイアスを完全に除去することはできないことを示す。
第2のアプローチでは、バーオブワードのサブモデルを使用して、バイアスを悪用する可能性のある機能をキャプチャし、元のモデルがこれらのバイアス付き機能を学ぶのを防ぐ。
論文 参考訳(メタデータ) (2020-05-10T17:56:10Z) - Double-Hard Debias: Tailoring Word Embeddings for Gender Bias Mitigation [94.98656228690233]
本稿では,性別サブスペースの推測と削除に先立って,コーパス正規性に対する単語埋め込みを浄化する手法を提案する。
本手法は,事前学習した単語埋め込みの分布的意味を保ちつつ,性別バイアスを従来の手法よりもはるかに大きい程度に低減する。
論文 参考訳(メタデータ) (2020-05-03T02:33:20Z) - Joint Multiclass Debiasing of Word Embeddings [5.1135133995376085]
本稿では,複数のバイアス次元を同時に脱バイアスできる多クラス脱バイアス手法を提案する。
単語埋め込みにおけるベクトル間の有意義な関係を維持しながら、私たちの概念がバイアスを減らすか、あるいは完全に排除できることを示す。
論文 参考訳(メタデータ) (2020-03-09T22:06:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。