論文の概要: ValNorm Quantifies Semantics to Reveal Consistent Valence Biases Across
Languages and Over Centuries
- arxiv url: http://arxiv.org/abs/2006.03950v5
- Date: Mon, 8 Nov 2021 03:47:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 20:58:24.819360
- Title: ValNorm Quantifies Semantics to Reveal Consistent Valence Biases Across
Languages and Over Centuries
- Title(参考訳): ValNormがセマンティックスを定量化し、言語とセンチュリーをまたいだ一貫性のあるバレンスバイアスを発見
- Authors: Autumn Toney-Wails and Aylin Caliskan
- Abstract要約: 単語埋め込みは、単語共起統計によって得られた言語規則性から暗黙のバイアスを学ぶ。
単語埋め込みにおける人間のようなバイアスを定量化する手法を拡張することにより、本質的な評価課題であるValNormを導入する。
我々はValNormを7言語からの静的な単語埋め込みと200年に及ぶ歴史英語のテキストに適用する。
- 参考スコア(独自算出の注目度): 3.0349733976070015
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Word embeddings learn implicit biases from linguistic regularities captured
by word co-occurrence statistics. By extending methods that quantify human-like
biases in word embeddings, we introduceValNorm, a novel intrinsic evaluation
task and method to quantify the valence dimension of affect in human-rated word
sets from social psychology. We apply ValNorm on static word embeddings from
seven languages (Chinese, English, German, Polish, Portuguese, Spanish, and
Turkish) and from historical English text spanning 200 years. ValNorm achieves
consistently high accuracy in quantifying the valence of non-discriminatory,
non-social group word sets. Specifically, ValNorm achieves a Pearson
correlation of r=0.88 for human judgment scores of valence for 399 words
collected to establish pleasantness norms in English. In contrast, we measure
gender stereotypes using the same set of word embeddings and find that social
biases vary across languages. Our results indicate that valence associations of
non-discriminatory, non-social group words represent widely-shared
associations, in seven languages and over 200 years.
- Abstract(参考訳): 単語埋め込みは、単語共起統計によって得られた言語規則性から暗黙のバイアスを学ぶ。
単語埋め込みにおける人間のようなバイアスを定量化する手法を拡張することにより、社会心理学から人間格単語集合における感情の価次元を定量化する新しい本質的な評価課題であるValNormを導入する。
ヴァルノルムは7つの言語(中国語、英語、ドイツ語、ポーランド語、ポルトガル語、スペイン語、トルコ語)の静的な単語埋め込みと200年にわたる歴史的英語テキストに適用する。
ValNormは、非差別的で非社会的グループワードセットの価値の定量化において、一貫して高い精度を達成する。
具体的には、valnormは、英語で快適さの規範を確立するために収集された399単語の価の人間の判断スコアr=0.88のピアソン相関を達成する。
対照的に、同じ単語埋め込みを用いてジェンダーステレオタイプを測定し、社会的バイアスが言語によって異なることを発見した。
以上の結果から,非差別的,非社会的集団語の有価関係は,7言語,200年以上にわたって広く共有されている。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Evaluating Biased Attitude Associations of Language Models in an
Intersectional Context [2.891314299138311]
言語モデルは、心理学で文書化された暗黙のバイアスを埋め込んだ大規模コーパスで訓練される。
我々は、年齢、教育、性別、身長、知性、識字性、人種、宗教、性、性的指向、社会階級、体重に関するバイアスを研究する。
言語モデルは、性同一性、社会的階級、性的指向のシグナルに対して最も偏りのある態度を示す。
論文 参考訳(メタデータ) (2023-07-07T03:01:56Z) - Comparing Biases and the Impact of Multilingual Training across Multiple
Languages [70.84047257764405]
ダウンストリーム感情分析タスクにおいて,イタリア語,中国語,英語,ヘブライ語,スペイン語のバイアス分析を行う。
我々は、既存の感情バイアスのテンプレートを、人種、宗教、国籍、性別の4つの属性で、イタリア語、中国語、ヘブライ語、スペイン語に適応させる。
以上の結果から,各言語の文化に支配的な集団の嗜好など,バイアス表現の類似性を明らかにした。
論文 参考訳(メタデータ) (2023-05-18T18:15:07Z) - An Analysis of Social Biases Present in BERT Variants Across Multiple
Languages [0.0]
多様な言語からなる単言語BERTモデルにおけるバイアスについて検討する。
文の擬似類似度に基づいて,任意のバイアスを測定するテンプレートベースの手法を提案する。
偏見探索の現在の手法は言語に依存していると結論付けている。
論文 参考訳(メタデータ) (2022-11-25T23:38:08Z) - Crosslinguistic word order variation reflects evolutionary pressures of
dependency and information locality [4.869029215261254]
世界の言語の約40%は主目的語順であり、約40%は主目的語順である。
単語順の変動は、依存関係の局所性と情報局所性の競合する圧力のバランスの異なる方法を反映していることを示す。
本研究は,言語間の統語構造と使用法が,限られた認知資源下での効率的なコミュニケーションを支援するのに相応しいことを示唆している。
論文 参考訳(メタデータ) (2022-06-09T02:56:53Z) - Gender Bias in Word Embeddings: A Comprehensive Analysis of Frequency,
Syntax, and Semantics [3.4048739113355215]
インターネットコーパスで学習した英語の静的単語埋め込みにおいて,グループベースのバイアスを包括的に分析する。
単一カテゴリー単語埋め込みアソシエーションテストを用いて,性別バイアスの広範性を示す。
語彙の中で最も頻繁な単語1,000のうち、77%が女性よりも男性に関連があることがわかりました。
論文 参考訳(メタデータ) (2022-06-07T15:35:10Z) - Regional Negative Bias in Word Embeddings Predicts Racial Animus--but
only via Name Frequency [2.247786323899963]
地理的にタグ付けされたソーシャルメディアデータからの反黒人WEAT推定は、人種的アニマスのいくつかの指標と強く相関していることを示す。
また,これらの相関関係は,ブラックネームとホワイトネームの相関関係において,ブラックネームの頻度によって説明されることを示した。
論文 参考訳(メタデータ) (2022-01-20T20:52:12Z) - Quantifying Gender Bias Towards Politicians in Cross-Lingual Language
Models [104.41668491794974]
代名詞として政治家の名前を取り巻く言語モデルによって生成される形容詞と動詞の用法を定量化する。
死者や指定された言葉が男女の政治家と関連しているのに対し、美人や離婚といった特定の言葉が主に女性政治家に関係していることが判明した。
論文 参考訳(メタデータ) (2021-04-15T15:03:26Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Gender Bias in Multilingual Embeddings and Cross-Lingual Transfer [101.58431011820755]
多言語埋め込みにおけるジェンダーバイアスとNLPアプリケーションの伝達学習への影響について検討する。
我々は、バイアス分析のための多言語データセットを作成し、多言語表現におけるバイアスの定量化方法をいくつか提案する。
論文 参考訳(メタデータ) (2020-05-02T04:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。