論文の概要: The Typology of Polysemy: A Multilingual Distributional Framework
- arxiv url: http://arxiv.org/abs/2006.01966v1
- Date: Tue, 2 Jun 2020 22:31:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 00:29:46.576616
- Title: The Typology of Polysemy: A Multilingual Distributional Framework
- Title(参考訳): ポリセミーの類型:多言語分布の枠組み
- Authors: Ella Rabinovich, Yang Xu, Suzanne Stevenson
- Abstract要約: 本稿では,概念に対する語彙意味論の言語間類似性である意味親和性(semantic affinity)を定量化する新しい枠組みを提案する。
以上の結果から,言語系統学以外の意味領域と言語外要因との複雑な相互作用が明らかとなった。
- 参考スコア(独自算出の注目度): 6.753781783859273
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Lexical semantic typology has identified important cross-linguistic
generalizations about the variation and commonalities in polysemy
patterns---how languages package up meanings into words. Recent computational
research has enabled investigation of lexical semantics at a much larger scale,
but little work has explored lexical typology across semantic domains, nor the
factors that influence cross-linguistic similarities. We present a novel
computational framework that quantifies semantic affinity, the cross-linguistic
similarity of lexical semantics for a concept. Our approach defines a common
multilingual semantic space that enables a direct comparison of the lexical
expression of concepts across languages. We validate our framework against
empirical findings on lexical semantic typology at both the concept and domain
levels. Our results reveal an intricate interaction between semantic domains
and extra-linguistic factors, beyond language phylogeny, that co-shape the
typology of polysemy across languages.
- Abstract(参考訳): 語彙意味論的タイポロジーは、ポリセミーパターンのバリエーションと共通性に関する重要な言語横断的一般化を明らかにした。
近年の計算研究により、語彙意味論はより大規模に研究できるようになったが、意味領域にまたがる語彙的タイプ論や言語横断的類似性に影響を与える要因についての研究はほとんど行われていない。
本稿では,概念に対する語彙意味論の言語間類似性である意味親和性を定量化する新しい計算フレームワークを提案する。
提案手法は,言語間の概念の語彙表現を直接比較できる共通多言語意味空間を定義する。
概念とドメインレベルでの語彙意味型学に関する経験的発見に対して,我々の枠組みを検証した。
以上の結果から,意味領域と言語系統以外の言語外要因との複雑な相互作用が明らかとなり,言語間の多義性の類型化が図られた。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - The Acquisition of Semantic Relationships between words [0.0]
意味関係の研究は、意味関係と言語の形態的特徴との密接な関係を明らかにしている。
意味的関係と言語形態学の関係を掘り下げることで、語の構造が言語の解釈と理解にどのように貢献するかについての深い洞察を得ることができる。
論文 参考訳(メタデータ) (2023-07-12T19:18:55Z) - Agentivit\`a e telicit\`a in GilBERTo: implicazioni cognitive [77.71680953280436]
本研究の目的は,トランスフォーマーに基づくニューラルネットワークモデルが語彙意味論を推論するかどうかを検討することである。
考慮される意味的性質は、テリシティ(定性とも組み合わされる)と作用性である。
論文 参考訳(メタデータ) (2023-07-06T10:52:22Z) - A study of conceptual language similarity: comparison and evaluation [0.3093890460224435]
自然言語処理(NLP)に関する興味深い研究は、言語型学を取り入れ、言語多様性を橋渡しすることを目的としている。
最近の研究は、それらが基本的な概念をどのように表現するかに基づいて、言語類似性を定義する新しいアプローチを導入している。
本研究では,概念的類似性を詳細に研究し,二項分類タスクにおいて広範囲に評価する。
論文 参考訳(メタデータ) (2023-05-22T18:28:02Z) - Quantifying Synthesis and Fusion and their Impact on Machine Translation [79.61874492642691]
自然言語処理(NLP)では、一般に、融合や凝集のような厳密な形態を持つ言語全体をラベル付けする。
本研究では,単語とセグメントレベルで形態型を定量化することにより,そのようなクレームの剛性を低減することを提案する。
本研究では, 英語, ドイツ語, トルコ語の非教師なし・教師付き形態素分割法について検討する一方, 融合ではスペイン語を用いた半自動手法を提案する。
そして、機械翻訳品質と単語(名詞と動詞)における合成・融合の程度との関係を分析する。
論文 参考訳(メタデータ) (2022-05-06T17:04:58Z) - A cognitively driven weighted-entropy model for embedding semantic
categories in hyperbolic geometry [0.0]
双曲幾何学に意味圏を埋め込むための教師なしおよび認知駆動型重み付きエントロピー法を提案する。
以上の結果から,この手法は,英語における基本色と血統語の大部分に対して,人気と類似性のセマンティックな関係をモデル化し,マッピングすることが可能であることが示唆された。
論文 参考訳(メタデータ) (2021-12-13T18:33:45Z) - Patterns of Lexical Ambiguity in Contextualised Language Models [9.747449805791092]
本稿では,単語感覚の類似度と共述度を拡張した,人間による注釈付きデータセットを提案する。
どちらの人間の判断も、多文解釈の類似性は意味の同一性とホモニミーの連続性にあることを示している。
我々のデータセットは、語彙的曖昧性の複雑さの大部分を捉えており、文脈的埋め込みのための現実的なテストベッドを提供することができる。
論文 参考訳(メタデータ) (2021-09-27T13:11:44Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z) - Evaluating Transformer-Based Multilingual Text Classification [55.53547556060537]
我々は,NLPツールが構文的・形態学的に異なる言語で不平等に機能すると主張している。
実験研究を支援するために,単語順と形態的類似度指標を算出した。
論文 参考訳(メタデータ) (2020-04-29T03:34:53Z) - Where New Words Are Born: Distributional Semantic Analysis of Neologisms
and Their Semantic Neighborhoods [51.34667808471513]
分散意味論のパラダイムで定式化されたセマンティック隣人のセマンティック・スパシティと周波数成長率という2つの要因の重要性について検討する。
いずれの因子も単語の出現を予測できるが,後者の仮説はより支持される。
論文 参考訳(メタデータ) (2020-01-21T19:09:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。