論文の概要: Making sense of spoken plurals
- arxiv url: http://arxiv.org/abs/2207.01947v1
- Date: Tue, 5 Jul 2022 10:44:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 23:11:40.572090
- Title: Making sense of spoken plurals
- Title(参考訳): 話し言葉の複数の意味付け
- Authors: Elnaz Shafaei-Bajestan and Peter Uhrig and R. Harald Baayen
- Abstract要約: 本研究は、英語における名詞特異点とその複数変種の意味論に焦点をあてる。
1つのモデル(FRACSS)は、特異な意味論から複数の意味論を予測する際に、すべての特異な複数対を考慮に入れるべきである。
他のモデル(CCA)は、複数の概念化は、主に基本語のセマンティッククラスに依存すると主張している。
- 参考スコア(独自算出の注目度): 1.80476943513092
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Distributional semantics offers new ways to study the semantics of
morphology. This study focuses on the semantics of noun singulars and their
plural inflectional variants in English. Our goal is to compare two models for
the conceptualization of plurality. One model (FRACSS) proposes that all
singular-plural pairs should be taken into account when predicting plural
semantics from singular semantics. The other model (CCA) argues that
conceptualization for plurality depends primarily on the semantic class of the
base word. We compare the two models on the basis of how well the speech signal
of plural tokens in a large corpus of spoken American English aligns with the
semantic vectors predicted by the two models. Two measures are employed: the
performance of a form-to-meaning mapping and the correlations between form
distances and meaning distances. Results converge on a superior alignment for
CCA. Our results suggest that usage-based approaches to pluralization in which
a given word's own semantic neighborhood is given priority outperform theories
according to which pluralization is conceptualized as a process building on
high-level abstraction. We see that what has often been conceived of as a
highly abstract concept, [+plural], is better captured via a family of
mid-level partial generalizations.
- Abstract(参考訳): 分布意味論は形態学のセマンティクスを研究する新しい方法を提供する。
本研究は、英語における名詞特異点とその複数変種の意味論に焦点をあてる。
我々の目標は、複数の概念化のための2つのモデルを比較することである。
1つのモデル(FRACSS)は、特異意味論から複数の意味論を予測する際に、すべての特異複数対を考慮に入れるべきである。
他のモデル (cca) は、複数の概念化は主に基本語の意味クラスに依存すると主張する。
この2つのモデルの比較は,アメリカ英語の大規模コーパスにおける複数のトークンの音声信号が,この2つのモデルによって予測される意味ベクトルとどのように一致しているかを考察する。
形式対意味写像の性能と形態距離と意味距離との相関の2つの尺度が採用されている。
結果はCCAの優れたアライメントに収束する。
この結果から,特定の単語のセマンティック・エリアを優先的に付与する多元化へのアプローチが,高レベルの抽象化に基づくプロセス構築として概念化される理論よりも優れていることが示唆された。
しばしば、非常に抽象的な概念である[+複数形]として考えられたものは、中間レベルの部分一般化の族によってよりよく捉えられる。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Are LLMs Models of Distributional Semantics? A Case Study on Quantifiers [14.797001158310092]
分布意味論モデルは真理条件推論や記号処理に苦しむ。
期待とは対照的に、LSMは正確な量化器とあいまいな量化器の人間の判断とより密接に一致している。
論文 参考訳(メタデータ) (2024-10-17T19:28:35Z) - Fantastic Semantics and Where to Find Them: Investigating Which Layers of Generative LLMs Reflect Lexical Semantics [50.982315553104975]
本稿では,Llama2という人気言語モデルに対する語彙意味論のボトムアップ進化について検討する。
実験の結果,下位層の表現は語彙的意味論を符号化しているが,上位層はより弱い意味帰納的帰納的帰納的帰納的帰納的帰納的帰納的帰属的帰属的帰属的帰属的存在であることがわかった。
これは、高層層がより良い語彙意味論を得るマスク言語モデリングのような差別的な目的を持つモデルとは対照的である。
論文 参考訳(メタデータ) (2024-03-03T13:14:47Z) - A Roadmap to Pluralistic Alignment [49.29107308098236]
本稿では,言語モデルをテストベッドとして用いた多元的アライメントのロードマップを提案する。
我々は,AIシステムにおける多元性を定義・運用する3つの可能な方法を特定し,定式化する。
我々は、現在のアライメント技術は、基本的に多元的AIに限られていると論じる。
論文 参考訳(メタデータ) (2024-02-07T18:21:17Z) - Semantic-aware Contrastive Learning for More Accurate Semantic Parsing [32.74456368167872]
そこで本研究では,意味表現の微粒化を学習できる意味認識型コントラスト学習アルゴリズムを提案する。
2つの標準データセットの実験により、我々の手法はMLEベースラインよりも大幅に改善されていることが示された。
論文 参考訳(メタデータ) (2023-01-19T07:04:32Z) - Semantic properties of English nominal pluralization: Insights from word
embeddings [1.605809929862042]
英名多重化は意味クラスタを示すことを示す。
CosClassAvgと呼ばれるセマンティックインフォームドメソッドは、分散セマンティクスにおいて多重化メソッドより優れている。
論文 参考訳(メタデータ) (2022-03-29T10:42:47Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for
Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。
その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。
本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文 参考訳(メタデータ) (2020-11-07T11:27:18Z) - Investigating Cross-Linguistic Adjective Ordering Tendencies with a
Latent-Variable Model [66.84264870118723]
本稿では,多言語形容詞順序付けを潜在変数モデルとして,初めて純粋コーパス駆動モデルを提案する。
我々は普遍的、言語横断的、階層的形容詞順序付け傾向の存在の強い確固たる証拠を提供する。
論文 参考訳(メタデータ) (2020-10-09T18:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。