論文の概要: Semantic properties of English nominal pluralization: Insights from word
embeddings
- arxiv url: http://arxiv.org/abs/2203.15424v1
- Date: Tue, 29 Mar 2022 10:42:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-31 00:17:51.856118
- Title: Semantic properties of English nominal pluralization: Insights from word
embeddings
- Title(参考訳): 英名多元化の意味的特性:単語埋め込みからの考察
- Authors: Elnaz Shafaei-Bajestan, Masoumeh Moradipour-Tari, Peter Uhrig, R.
Harald Baayen
- Abstract要約: 英名多重化は意味クラスタを示すことを示す。
CosClassAvgと呼ばれるセマンティックインフォームドメソッドは、分散セマンティクスにおいて多重化メソッドより優れている。
- 参考スコア(独自算出の注目度): 1.605809929862042
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic differentiation of nominal pluralization is grammaticalized in many
languages. For example, plural markers may only be relevant for human nouns.
English does not appear to make such distinctions. Using distributional
semantics, we show that English nominal pluralization exhibits semantic
clusters. For instance, pluralization of fruit words is more similar to one
another and less similar to pluralization of other semantic classes. Therefore,
reduction of the meaning shift in plural formation to the addition of an
abstract plural meaning is too simplistic. A semantically informed method,
called CosClassAvg, is introduced that outperforms pluralization methods in
distributional semantics which assume plural formation amounts to the addition
of a fixed plural vector. In comparison with our approach, a method from
compositional distributional semantics, called FRACSS, predicted plural vectors
that were more similar to the corpus-extracted plural vectors in terms of
direction but not vector length. A modeling study reveals that the observed
difference between the two predicted semantic spaces by CosClassAvg and FRACSS
carries over to how well a computational model of the listener can understand
previously unencountered plural forms. Mappings from word forms, represented
with triphone vectors, to predicted semantic vectors are more productive when
CosClassAvg-generated semantic vectors are employed as gold standard vectors
instead of FRACSS-generated vectors.
- Abstract(参考訳): 名目多元化の意味分化は多くの言語で文法化されている。
例えば、複数のマーカーは人間の名詞にのみ関連がある。
英語はそのような区別をしていないようだ。
分布的意味論を用いて,英語の公称多重化が意味クラスタを示すことを示す。
例えば、果実語の多重化は互いに似ており、他の意味クラスの多重化とは似ていない。
したがって、抽象的な複数の意味の追加による複数の形成における意味のシフトの減少は単純すぎる。
CosClassAvgと呼ばれるセマンティックインフォームドメソッドは、複数の生成量を仮定する分布意味論において、固定された複数ベクトルの追加に対して、多重化方法より優れる。
提案手法と比較して,FRACSSと呼ばれる構成分布意味論の手法は,コーパス抽出された複数のベクトルとよりよく似ているがベクトル長ではない複数のベクトルを予測した。
CosClassAvg と FRACSS による2つの予測意味空間の観測結果の違いは、リスナーの計算モデルがこれまで説明されていなかった複数の形式をいかにうまく理解できるかを物語っている。
cosclassavg生成意味ベクトルをfracss生成ベクトルの代わりにゴールド標準ベクトルとして使う場合、三音ベクトルで表される単語形式から予測意味ベクトルへのマッピングはより生産的になる。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Leveraging multilingual transfer for unsupervised semantic acoustic word
embeddings [23.822788597966646]
音響単語埋め込み(AWEs)は、音声の内容を符号化する音声セグメントの固定次元ベクトル表現である。
本稿ではセマンティックAWEモデリングについて考察する。
AWEがダウンストリームのセマンティッククエリ・バイ・サンプル検索に使用できることを初めて示します。
論文 参考訳(メタデータ) (2023-07-05T07:46:54Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Describing Sets of Images with Textual-PCA [89.46499914148993]
画像の集合を意味的に記述し、単一の画像の属性とセット内のバリエーションの両方をキャプチャする。
我々の手順は原理成分分析と類似しており、射影ベクトルの役割を生成されたフレーズに置き換える。
論文 参考訳(メタデータ) (2022-10-21T17:10:49Z) - Making sense of spoken plurals [1.80476943513092]
本研究は、英語における名詞特異点とその複数変種の意味論に焦点をあてる。
1つのモデル(FRACSS)は、特異な意味論から複数の意味論を予測する際に、すべての特異な複数対を考慮に入れるべきである。
他のモデル(CCA)は、複数の概念化は、主に基本語のセマンティッククラスに依存すると主張している。
論文 参考訳(メタデータ) (2022-07-05T10:44:26Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Unsupervised Distillation of Syntactic Information from Contextualized
Word Representations [62.230491683411536]
我々は,ニューラルネットワーク表現における意味論と構造学の非教師なしの絡み合いの課題に取り組む。
この目的のために、構造的に類似しているが意味的に異なる文群を自動的に生成する。
我々は、我々の変換クラスタベクトルが、語彙的意味論ではなく構造的特性によって空間に現れることを実証する。
論文 参考訳(メタデータ) (2020-10-11T15:13:18Z) - Integrating Categorical Semantics into Unsupervised Domain Translation [6.853826783413853]
ソースドメインとターゲットドメインの不変なカテゴリ意味的特徴を教師なしで学習する手法を提案する。
MNIST$leftrightarrow$SVHNで、教師なしのドメイン翻訳方式のスタイルエンコーダを学習カテゴリセマンティクスで条件付けすることで、数字を保存することができることを示す。
論文 参考訳(メタデータ) (2020-10-03T02:40:46Z) - Principal Word Vectors [5.64434321651888]
単語をベクトル空間に埋め込むための主成分分析を一般化する。
主語ベクトルの拡散と識別性は他の単語埋め込み法よりも高いことを示す。
論文 参考訳(メタデータ) (2020-07-09T08:29:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。