論文の概要: An exploration of the encoding of grammatical gender in word embeddings
- arxiv url: http://arxiv.org/abs/2008.01946v2
- Date: Tue, 3 Nov 2020 13:11:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 18:12:40.154543
- Title: An exploration of the encoding of grammatical gender in word embeddings
- Title(参考訳): 単語埋め込みにおける文法的ジェンダーの符号化の検討
- Authors: Hartger Veeman and Ali Basirat
- Abstract要約: 単語埋め込みに基づく文法性の研究は、文法性がどのように決定されるかについての議論の洞察を与えることができる。
スウェーデン語、デンマーク語、オランダ語の埋め込みにおいて、文法的な性別がどのように符号化されているかには重複があることが判明した。
- 参考スコア(独自算出の注目度): 0.6461556265872973
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The vector representation of words, known as word embeddings, has opened a
new research approach in linguistic studies. These representations can capture
different types of information about words. The grammatical gender of nouns is
a typical classification of nouns based on their formal and semantic
properties. The study of grammatical gender based on word embeddings can give
insight into discussions on how grammatical genders are determined. In this
study, we compare different sets of word embeddings according to the accuracy
of a neural classifier determining the grammatical gender of nouns. It is found
that there is an overlap in how grammatical gender is encoded in Swedish,
Danish, and Dutch embeddings. Our experimental results on the contextualized
embeddings pointed out that adding more contextual information to embeddings is
detrimental to the classifier's performance. We also observed that removing
morpho-syntactic features such as articles from the training corpora of
embeddings decreases the classification performance dramatically, indicating a
large portion of the information is encoded in the relationship between nouns
and articles.
- Abstract(参考訳): 単語埋め込みとして知られる単語のベクトル表現は、言語学における新しい研究アプローチを生み出した。
これらの表現は、単語に関する様々な種類の情報を取り込むことができる。
名詞の文法的性別は、その形式的・意味的性質に基づく名詞の典型的な分類である。
単語埋め込みに基づく文法的ジェンダーの研究は、文法的ジェンダーがどのように決定されるかについての議論に洞察を与えることができる。
本研究では,名詞の文法的性別を決定するニューラル分類器の精度に応じて,単語埋め込みの異なるセットを比較する。
スウェーデン語、デンマーク語、オランダ語の埋め込みでは、文法的性別の符号化方法に重複があることが判明した。
組込み実験の結果, 組込みに文脈情報を加えることは, 分類器の性能に有害であることがわかった。
また,組込みの訓練コーパスから形態素合成的特徴を取り除くことで分類性能が劇的に低下し,情報の大部分は名詞と記事の関係にエンコードされていることが示された。
関連論文リスト
- What an Elegant Bridge: Multilingual LLMs are Biased Similarly in Different Languages [51.0349882045866]
本稿では,Large Language Models (LLMs) の文法的ジェンダーのレンズによるバイアスについて検討する。
様々な言語における形容詞を持つ名詞を記述するためのモデルを提案し,特に文法性のある言語に焦点を当てた。
単純な分類器は、偶然以上の名詞の性別を予測できるだけでなく、言語間の移動可能性も示せる。
論文 参考訳(メタデータ) (2024-07-12T22:10:16Z) - Investigating grammatical abstraction in language models using few-shot learning of novel noun gender [0.0]
我々は,LSTMとデコーダのみのトランスフォーマーが,フランス語の文法的ジェンダーを人間のように抽象化できるかどうかを評価するために名詞学習実験を行った。
両言語モデルが一対二の学習例から新約名詞のジェンダーを効果的に一般化し,合意文脈にまたがって学習したジェンダーを適用した。
モデルの一般化行動は、それらが人間のように文法的な性別を抽象的なカテゴリーとして表現していることを示しているが、詳細を探求するにはさらなる作業が必要である。
論文 参考訳(メタデータ) (2024-03-15T14:25:59Z) - The Causal Influence of Grammatical Gender on Distributional Semantics [87.8027818528463]
言語間のジェンダー割り当てがどの程度意味を持つかは、言語学と認知科学における研究の活発な領域である。
我々は、名詞の文法的性別、意味、形容詞選択の間の相互作用を共同で表現する、新しい因果的グラフィカルモデルを提供する。
名詞の意味を制御した場合、文法的性別と形容詞的選択の関係は、ほぼゼロであり、無意味である。
論文 参考訳(メタデータ) (2023-11-30T13:58:13Z) - Measuring Gender Bias in Word Embeddings of Gendered Languages Requires
Disentangling Grammatical Gender Signals [3.0349733976070015]
単語埋め込みは、文法性のある言語における名詞とその文法性との関係を学習することを示した。
単語埋め込みから文法的ジェンダー信号を引き離すことは、セマンティック機械学習タスクの改善につながる可能性があることを示す。
論文 参考訳(メタデータ) (2022-06-03T17:11:00Z) - Analyzing Gender Representation in Multilingual Models [59.21915055702203]
実践的なケーススタディとして,ジェンダーの区別の表現に焦点をあてる。
ジェンダーの概念が、異なる言語で共有された部分空間にエンコードされる範囲について検討する。
論文 参考訳(メタデータ) (2022-04-20T00:13:01Z) - Gender Bias Hidden Behind Chinese Word Embeddings: The Case of Chinese
Adjectives [0.0]
本論文は,中国語形容詞の独特な視点から,静的単語埋め込みにおける性別バイアスについて検討する。
生成した結果と人間によって表されたデータセットを比較することで,単語埋め込みに符号化された性別バイアスが人々の態度とどのように異なるかを示す。
論文 参考訳(メタデータ) (2021-06-01T02:12:45Z) - Grammatical gender associations outweigh topical gender bias in
crosslinguistic word embeddings [0.0]
言語横断的な単語の埋め込みは、局所的な性バイアスが文法的な性関係の影響によって相互作用し、大きく上回っていることを示している。
この発見は、機械翻訳のような下流アプリケーションに影響を及ぼす。
論文 参考訳(メタデータ) (2020-05-18T16:39:16Z) - On the Relationships Between the Grammatical Genders of Inanimate Nouns
and Their Co-Occurring Adjectives and Verbs [57.015586483981885]
我々は6つの異なるジェンダー言語で大規模コーパスを使用する。
名詞の文法的性別とそれらの名詞を直接対象、間接対象、主語とする動詞との間に統計的に有意な関連性を見出した。
論文 参考訳(メタデータ) (2020-05-03T22:49:44Z) - Predicting Declension Class from Form and Meaning [70.65971611552871]
クラスメンバーシップは決定論的には程遠いが、名詞と/またはその意味の音韻学的形式は、しばしば不完全な手がかりを与える。
我々は、どの程度の情報、ビットで、名詞の形式や意味を知ることの難しさを測ることによって、これを運用する。
2つのインド・ヨーロッパ語(チェコ語とドイツ語)がそれぞれ、大量の情報をクラスと共有していることがわかった。
論文 参考訳(メタデータ) (2020-05-01T21:48:48Z) - Multi-Dimensional Gender Bias Classification [67.65551687580552]
機械学習モデルは、性別に偏ったテキストでトレーニングする際に、社会的に望ましくないパターンを不注意に学習することができる。
本稿では,テキスト中の性バイアスを複数の実用的・意味的な次元に沿って分解する一般的な枠組みを提案する。
このきめ細かいフレームワークを用いて、8つの大規模データセットにジェンダー情報を自動的にアノテートする。
論文 参考訳(メタデータ) (2020-05-01T21:23:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。