論文の概要: A graph-based analysis of semantic types and coercion in contextualized word embeddings
- arxiv url: http://arxiv.org/abs/2605.23710v1
- Date: Fri, 22 May 2026 14:55:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.399032
- Title: A graph-based analysis of semantic types and coercion in contextualized word embeddings
- Title(参考訳): 文脈型単語埋め込みにおける意味型と強制のグラフベース解析
- Authors: Long Chen, Deniz Ekin Yavas,
- Abstract要約: 本稿では,単語の埋め込みにおいて,語彙型と文脈型がどのように反映されるかを調べるためのグラフベースの手法を提案する。
10の意味型から名詞を選択し、型マッチングのための注釈付きコーパスインスタンスを選択し、BERTとセンス強化埋め込みを使ってグラフを構築します。
その結果,感覚に富んだ埋め込みで構築したグラフは意味型情報をよりよく反映していることがわかった。
- 参考スコア(独自算出の注目度): 7.260528078468924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic type mismatch between a noun and its context is central to coercion phenomena. This paper introduces a graph-based method to examine how lexical and contextual type information is reflected in word embeddings. We select nouns from ten semantic types, annotate corpus instances for type matching (matching vs. coercion vs. other mismatch vs. unrestricted), and construct graphs using BERT and sense-enhanced embeddings. Two metrics -- Neighbor Type Probability (NTP) and Neighbor Type Entropy (NTE) -- are proposed to analyze neighborhood type distributions. Results show that graphs constructed with sense-enhanced embeddings reflect semantic type information better, and matching and mismatch sentences can be distinguished through the proposed metrics.
- Abstract(参考訳): 名詞とその文脈の間の意味型ミスマッチは強制現象の中心である。
本稿では,単語の埋め込みにおいて,語彙型と文脈型がどのように反映されるかを調べるためのグラフベースの手法を提案する。
10のセマンティック型から名詞を選択し、型マッチングのための注釈付きコーパスインスタンス(マッチング対コヒーシオン対他のミスマッチ対制限なし)を選択し、BERTとセンス強化埋め込みを使ってグラフを構築します。
近隣型確率 (NTP) と近隣型エントロピー (NTE) の2つの指標を提案し, 周辺型分布の解析を行った。
以上の結果から, 意味型情報をよりよく反映し, マッチング文とミスマッチ文は, 提案した指標によって識別可能であることが示唆された。
関連論文リスト
- SMILE: A Composite Lexical-Semantic Metric for Question-Answering Evaluation [55.26111461168754]
本稿では,文レベルの意味理解とキーワードレベルの意味理解と簡単なキーワードマッチングを組み合わせた新しいアプローチであるSemantic Metric Integrating Lexical Exactnessを紹介する。
人間の判断と計算学的に軽量であり、語彙的評価と意味的評価のギャップを埋める。
論文 参考訳(メタデータ) (2025-11-21T17:30:18Z) - Using Synchronic Definitions and Semantic Relations to Classify Semantic Change Types [1.3436368800886478]
本稿では、同期語彙関係と単語の意味定義の両方から情報を活用するモデルを提案する。
具体的には,WordNet の構文定義と階層情報を用いて,Blank (1997) のセマンティックチェンジ型データセットのデジタル化バージョンでそれをテストする。
論文 参考訳(メタデータ) (2024-06-05T16:52:21Z) - An Investigation on Word Embedding Offset Clustering as Relationship
Classification [0.0]
本研究は,一対の単語ベクトル間の関係のベクトル表現を導出する試みである。
我々は6つのプーリング戦略を使ってベクトル関係を表現している。
本研究の目的は,単語の組込みに基づく教師なし手法により,一対の単語で表される関係の性質を識別することである。
論文 参考訳(メタデータ) (2023-05-07T13:03:17Z) - Prototype-based Embedding Network for Scene Graph Generation [105.97836135784794]
現在のシーングラフ生成(SGG)手法は、コンテキスト情報を探索し、エンティティペア間の関係を予測する。
被写体と対象物の組み合わせが多様であるため、各述語カテゴリーには大きなクラス内変異が存在する。
プロトタイプベースのEmbedding Network (PE-Net) は、エンティティ/述語を、プロトタイプに準拠したコンパクトで独特な表現でモデル化する。
PLは、PE-Netがそのようなエンティティ述語マッチングを効率的に学習するのを助けるために導入され、不明瞭なエンティティ述語マッチングを緩和するためにプロトタイプ正規化(PR)が考案されている。
論文 参考訳(メタデータ) (2023-03-13T13:30:59Z) - Graph Adaptive Semantic Transfer for Cross-domain Sentiment
Classification [68.06496970320595]
クロスドメイン感情分類(CDSC)は、ソースドメインから学んだ伝達可能なセマンティクスを使用して、ラベルなしのターゲットドメインにおけるレビューの感情を予測することを目的としている。
本稿では、単語列と構文グラフの両方からドメイン不変セマンティクスを学習できる適応型構文グラフ埋め込み法であるグラフ適応意味伝達(GAST)モデルを提案する。
論文 参考訳(メタデータ) (2022-05-18T07:47:01Z) - Hierarchical Heterogeneous Graph Representation Learning for Short Text
Classification [60.233529926965836]
短文分類のためのグラフニューラルネットワーク(GNN)に基づく ShiNE と呼ばれる新しい手法を提案する。
まず,短文データセットを単語レベル成分グラフからなる階層的不均一グラフとしてモデル化する。
そして、類似した短いテキスト間の効果的なラベル伝搬を容易にするショート文書グラフを動的に学習する。
論文 参考訳(メタデータ) (2021-10-30T05:33:05Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Montague Grammar Induction [4.321645312120979]
このフレームワークは、帰納文法が従うべき仮定について、アナリストにきめ細かい制御を提供する。
本稿では,s(emantic)-selectionとc(ategory)-selectionの関係に着目し,レキシコンスケールの受容可能性判定データセットを入力として利用する。
論文 参考訳(メタデータ) (2020-10-15T23:25:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。