論文の概要: The aftermath of compounds: Investigating Compounds and their Semantic Representations
- arxiv url: http://arxiv.org/abs/2510.27477v1
- Date: Fri, 31 Oct 2025 13:58:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-03 17:52:16.117553
- Title: The aftermath of compounds: Investigating Compounds and their Semantic Representations
- Title(参考訳): 化合物の余波:化合物の探索と意味表現
- Authors: Swarang Joshi,
- Abstract要約: 静的な単語ベクトル(GloVe)と文脈的埋め込み(BERT)を,Lexeme(LMD)とセマンティック透明性(ST)の人間の評価と比較した。
以上の結果から,BERTの埋め込みはGloVeよりも構成意味を捕えやすく,予測可能性評価は人間とモデルデータの両方において意味的透明性の強い予測因子であることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study investigates how well computational embeddings align with human semantic judgments in the processing of English compound words. We compare static word vectors (GloVe) and contextualized embeddings (BERT) against human ratings of lexeme meaning dominance (LMD) and semantic transparency (ST) drawn from a psycholinguistic dataset. Using measures of association strength (Edinburgh Associative Thesaurus), frequency (BNC), and predictability (LaDEC), we compute embedding-derived LMD and ST metrics and assess their relationships with human judgments via Spearmans correlation and regression analyses. Our results show that BERT embeddings better capture compositional semantics than GloVe, and that predictability ratings are strong predictors of semantic transparency in both human and model data. These findings advance computational psycholinguistics by clarifying the factors that drive compound word processing and offering insights into embedding-based semantic modeling.
- Abstract(参考訳): 本研究は,英語複合語の処理における人間の意味的判断と,人間の意味的判断がいかにうまく一致しているかを考察する。
静的な単語ベクトル (GloVe) と文脈的埋め込み (BERT) を, 心理言語学的データセットから抽出したLexeme (LMD) と意味的透明性 (ST) の人間の評価と比較した。
相関強度(Edinburgh Associative Thesaurus)、頻度(BNC)、予測可能性(LaDEC)の尺度を用いて,埋め込み型MDとSTのメトリクスを計算し,スピアマン相関と回帰分析を用いて人的判断との関係を評価する。
以上の結果から,BERTの埋め込みはGloVeよりも構成意味を捕えやすく,予測可能性評価は人間とモデルデータの両方において意味的透明性の強い予測因子であることが示唆された。
これらの知見は、複合語処理を駆動する要因を明らかにし、埋め込み型セマンティックモデリングに対する洞察を提供することによって、計算心理言語学を前進させる。
関連論文リスト
- An Exploratory Analysis on the Explanatory Potential of Embedding-Based Measures of Semantic Transparency for Malay Word Recognition [0.0]
セマンティック透明性の埋め込みに基づく尺度について検討する。
本研究は,これらの指標が語彙決定遅延の有意な予測因子であるかどうかを考察する。
いずれの尺度も,単語頻度,単語長,形態的家族サイズを考慮し,決定遅延を予測した。
論文 参考訳(メタデータ) (2025-05-09T11:57:10Z) - Agentivit\`a e telicit\`a in GilBERTo: implicazioni cognitive [77.71680953280436]
本研究の目的は,トランスフォーマーに基づくニューラルネットワークモデルが語彙意味論を推論するかどうかを検討することである。
考慮される意味的性質は、テリシティ(定性とも組み合わされる)と作用性である。
論文 参考訳(メタデータ) (2023-07-06T10:52:22Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - A Psycholinguistic Analysis of BERT's Representations of Compounds [3.034345346208211]
我々は,トランスフォーマーの語レベルでの意味情報を探究し,BERTが人間の意味的直観と一致するかどうかを検証する研究に基づいて構築する。
我々は、複合意味分析の2つの心理言語学的尺度に基づいて、人間の判断を含むデータセットを活用する。
BERTに基づく尺度は、特に文脈表現を用いた場合、人間の直感と適度に一致していることを示す。
論文 参考訳(メタデータ) (2023-02-14T18:23:15Z) - Synonym Detection Using Syntactic Dependency And Neural Embeddings [3.0770051635103974]
ベクトル空間モデルを用いた分布意味論の導出における構文依存の役割について検討する。
本研究は,ニューラルネットワークへの人間のコンパイルした意味知識の注入が分散分布の類似性に及ぼす影響について検討する。
この結果から,構文的条件付きコンテキストは,非条件付きコンテキストよりも語彙的意味論の解釈が優れていることが示唆された。
論文 参考訳(メタデータ) (2022-09-30T03:16:41Z) - Language Models Explain Word Reading Times Better Than Empirical
Predictability [20.38397241720963]
認知読解研究における従来のアプローチは、文章の文脈から単語を予測することは、完結確率によって最もよく捉えられると仮定している。
確率言語モデルは、CCPよりも構文的および意味的効果の深い説明を提供する。
現在の単語のN-gramとRNN確率は、トピックモデルやCCPと比較して、より一貫して読み出し性能を予測できる。
論文 参考訳(メタデータ) (2022-02-02T16:38:43Z) - WMDecompose: A Framework for Leveraging the Interpretable Properties of
Word Mover's Distance in Sociocultural Analysis [0.0]
妥当性と解釈可能性のバランスをとる一般的なモデルは、Word Mover's Distance (WMD)である。
WMDecomposeは、文書レベル距離を構成語レベル距離に分解し、その後、単語をクラスタ化してテーマ要素を誘導するモデルおよびPythonライブラリである。
論文 参考訳(メタデータ) (2021-10-14T13:04:38Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Did the Cat Drink the Coffee? Challenging Transformers with Generalized
Event Knowledge [59.22170796793179]
Transformers Language Models (TLMs) を数学的適合のテクトダイナミックな評価のためのベンチマークで検証した。
以上の結果から, TLM は SDM に匹敵する性能が得られることが示された。
しかし、さらなる分析は、TLMがイベント知識の重要な側面を捉えていないことを一貫して示唆している。
論文 参考訳(メタデータ) (2021-07-22T20:52:26Z) - A comprehensive comparative evaluation and analysis of Distributional
Semantic Models [61.41800660636555]
我々は、静的DSMによって生成されたり、BERTによって生成された文脈化されたベクトルを平均化して得られるような、型分布ベクトルの包括的評価を行う。
その結果、予測ベースモデルの優越性は現実よりも明らかであり、ユビキタスではないことが明らかとなった。
我々は認知神経科学からRepresentational similarity Analysis(RSA)の方法論を借りて、分布モデルによって生成された意味空間を検査する。
論文 参考訳(メタデータ) (2021-05-20T15:18:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。