論文の概要: An exploration of the encoding of grammatical gender in word embeddings
- arxiv url: http://arxiv.org/abs/2008.01946v2
- Date: Tue, 3 Nov 2020 13:11:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 18:12:40.154543
- Title: An exploration of the encoding of grammatical gender in word embeddings
- Title(参考訳): 単語埋め込みにおける文法的ジェンダーの符号化の検討
- Authors: Hartger Veeman and Ali Basirat
- Abstract要約: 単語埋め込みに基づく文法性の研究は、文法性がどのように決定されるかについての議論の洞察を与えることができる。
スウェーデン語、デンマーク語、オランダ語の埋め込みにおいて、文法的な性別がどのように符号化されているかには重複があることが判明した。
- 参考スコア(独自算出の注目度): 0.6461556265872973
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The vector representation of words, known as word embeddings, has opened a
new research approach in linguistic studies. These representations can capture
different types of information about words. The grammatical gender of nouns is
a typical classification of nouns based on their formal and semantic
properties. The study of grammatical gender based on word embeddings can give
insight into discussions on how grammatical genders are determined. In this
study, we compare different sets of word embeddings according to the accuracy
of a neural classifier determining the grammatical gender of nouns. It is found
that there is an overlap in how grammatical gender is encoded in Swedish,
Danish, and Dutch embeddings. Our experimental results on the contextualized
embeddings pointed out that adding more contextual information to embeddings is
detrimental to the classifier's performance. We also observed that removing
morpho-syntactic features such as articles from the training corpora of
embeddings decreases the classification performance dramatically, indicating a
large portion of the information is encoded in the relationship between nouns
and articles.
- Abstract(参考訳): 単語埋め込みとして知られる単語のベクトル表現は、言語学における新しい研究アプローチを生み出した。
これらの表現は、単語に関する様々な種類の情報を取り込むことができる。
名詞の文法的性別は、その形式的・意味的性質に基づく名詞の典型的な分類である。
単語埋め込みに基づく文法的ジェンダーの研究は、文法的ジェンダーがどのように決定されるかについての議論に洞察を与えることができる。
本研究では,名詞の文法的性別を決定するニューラル分類器の精度に応じて,単語埋め込みの異なるセットを比較する。
スウェーデン語、デンマーク語、オランダ語の埋め込みでは、文法的性別の符号化方法に重複があることが判明した。
組込み実験の結果, 組込みに文脈情報を加えることは, 分類器の性能に有害であることがわかった。
また,組込みの訓練コーパスから形態素合成的特徴を取り除くことで分類性能が劇的に低下し,情報の大部分は名詞と記事の関係にエンコードされていることが示された。
関連論文リスト
- Grammatical Gender's Influence on Distributional Semantics: A Causal
Perspective [100.47362690469669]
言語間のジェンダーの割り当てにどの程度の意味が影響するかは、現代言語学と認知科学における活発な研究分野である。
我々は、名詞の文法的性別、意味、形容詞選択の間の相互作用を共同で表現する、新しい因果的グラフィカルモデルを提供する。
文法的ジェンダーが形容詞選択にほぼゼロ効果があることに気付き、ネオ・ヴォルフの仮説を疑問視する。
論文 参考訳(メタデータ) (2023-11-30T13:58:13Z) - VisoGender: A dataset for benchmarking gender bias in image-text pronoun
resolution [80.57383975987676]
VisoGenderは、視覚言語モデルで性別バイアスをベンチマークするための新しいデータセットである。
We focus to occupation-related biases in a hegemonic system of binary gender, inspired by Winograd and Winogender schemas。
我々は、最先端の視覚言語モデルをいくつかベンチマークし、それらが複雑な場面における二項性解消のバイアスを示すことを発見した。
論文 参考訳(メタデータ) (2023-06-21T17:59:51Z) - Measuring Gender Bias in Word Embeddings of Gendered Languages Requires
Disentangling Grammatical Gender Signals [3.0349733976070015]
単語埋め込みは、文法性のある言語における名詞とその文法性との関係を学習することを示した。
単語埋め込みから文法的ジェンダー信号を引き離すことは、セマンティック機械学習タスクの改善につながる可能性があることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:11:00Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Gender Bias Hidden Behind Chinese Word Embeddings: The Case of Chinese
Adjectives [0.0]
本論文は,中国語形容詞の独特な視点から,静的単語埋め込みにおける性別バイアスについて検討する。
生成した結果と人間によって表されたデータセットを比較することで,単語埋め込みに符号化された性別バイアスが人々の態度とどのように異なるかを示す。
論文 参考訳(メタデータ) (2021-06-01T02:12:45Z) - Word Frequency Does Not Predict Grammatical Knowledge in Language Models [2.1984302611206537]
言語モデルの精度には,系統的な変化源が存在するかを検討する。
特定の名詞は他の名詞よりも体系的によく理解されており、文法的タスクや異なる言語モデルに対して頑健である。
名詞の文法的特性は,様々な訓練データからほとんど学習されないことが判明した。
論文 参考訳(メタデータ) (2020-10-26T19:51:36Z) - Grammatical gender associations outweigh topical gender bias in
crosslinguistic word embeddings [0.0]
言語横断的な単語の埋め込みは、局所的な性バイアスが文法的な性関係の影響によって相互作用し、大きく上回っていることを示している。
この発見は、機械翻訳のような下流アプリケーションに影響を及ぼす。
論文 参考訳(メタデータ) (2020-05-18T16:39:16Z) - On the Relationships Between the Grammatical Genders of Inanimate Nouns
and Their Co-Occurring Adjectives and Verbs [57.015586483981885]
我々は6つの異なるジェンダー言語で大規模コーパスを使用する。
名詞の文法的性別とそれらの名詞を直接対象、間接対象、主語とする動詞との間に統計的に有意な関連性を見出した。
論文 参考訳(メタデータ) (2020-05-03T22:49:44Z) - Predicting Declension Class from Form and Meaning [70.65971611552871]
クラスメンバーシップは決定論的には程遠いが、名詞と/またはその意味の音韻学的形式は、しばしば不完全な手がかりを与える。
我々は、どの程度の情報、ビットで、名詞の形式や意味を知ることの難しさを測ることによって、これを運用する。
2つのインド・ヨーロッパ語(チェコ語とドイツ語)がそれぞれ、大量の情報をクラスと共有していることがわかった。
論文 参考訳(メタデータ) (2020-05-01T21:48:48Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。