論文の概要: Rethinking Metrics for Lexical Semantic Change Detection
- arxiv url: http://arxiv.org/abs/2602.15716v1
- Date: Tue, 17 Feb 2026 16:47:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:18.129372
- Title: Rethinking Metrics for Lexical Semantic Change Detection
- Title(参考訳): レキシカルセマンティックな変化検出のためのメトリクスの再考
- Authors: Roksana Goworek, Haim Dubossarsky,
- Abstract要約: 平均最小距離(AMD)と平均最小距離(SAMD)を紹介する。
我々はAMDが特に次元の縮小や非特殊化エンコーダにおいて、より堅牢な性能を提供することを示す。
LSCD は APD や PRT 以外のセマンティックな変化指標を考慮し,AMD は文脈的埋め込みに基づく分析に頑健な選択肢を提供する。
- 参考スコア(独自算出の注目度): 3.274367403737527
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Lexical semantic change detection (LSCD) increasingly relies on contextualised language model embeddings, yet most approaches still quantify change using a small set of semantic change metrics, primarily Average Pairwise Distance (APD) and cosine distance over word prototypes (PRT). We introduce Average Minimum Distance (AMD) and Symmetric Average Minimum Distance (SAMD), new measures that quantify semantic change via local correspondence between word usages across time periods. Across multiple languages, encoder models, and representation spaces, we show that AMD often provides more robust performance, particularly under dimensionality reduction and with non-specialised encoders, while SAMD excels with specialised encoders. We suggest that LSCD may benefit from considering alternative semantic change metrics beyond APD and PRT, with AMD offering a robust option for contextualised embedding-based analysis.
- Abstract(参考訳): 語彙的意味変化検出(LSCD)は、文脈的言語モデル埋め込みにますます依存しているが、ほとんどのアプローチは、平均ペアワイズ距離(APD)と単語プロトタイプ(PRT)の余分な距離といった、小さな意味変化指標を用いて変化を定量化している。
本稿では,平均最小距離 (AMD) と平均最小距離 (SAMD) を導入する。
複数の言語、エンコーダモデル、表現空間にまたがって、AMDは特に次元の縮小や非特殊エンコーダにおいて、より堅牢な性能を提供するのに対し、SAMDは特殊エンコーダよりも優れていることを示す。
LSCD は APD や PRT 以外のセマンティックな変化指標を考慮し,AMD は文脈的埋め込みに基づく分析に頑健な選択肢を提供する。
関連論文リスト
- ReFRAME or Remain: Unsupervised Lexical Semantic Change Detection with Frame Semantics [1.1340133299604382]
本研究では,フレームのセマンティクスに基づく意味変化検出手法を開発した。
本手法は意味変化の検出に有効であり,多くの分布意味モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2026-02-04T13:00:49Z) - Investigating the Contextualised Word Embedding Dimensions Specified for Contextual and Temporal Semantic Changes [30.563130208194977]
文脈型単語埋め込み(CWE)空間内の単語の意味的変化を符号化する意味認識型単語埋め込み(SCWE)。
どのようにして変化が埋め込み空間にエンコードされるのかは、まだ不明である。
文脈的および時間的意味変化ベンチマークにおいて、事前学習したCWEとそれらの微調整されたバージョンを比較した。
論文 参考訳(メタデータ) (2024-07-03T05:42:20Z) - Tracking Semantic Change in Slovene: A Novel Dataset and Optimal Transport-Based Distance [4.330529287808277]
我々は、200万人の話者を持つあまりリソースの乏しいスラヴ語であるSloveneにおける意味的変化の検出に焦点をあてる。
セマンティックチェンジ検出システムを評価するための最初のSloveneデータセットを提案する。
本稿では, セマンティックな変化を定量化するための, より堅牢なフレームワークを提供する, 正規化された最適輸送に基づく新しい計量法を提案する。
論文 参考訳(メタデータ) (2024-02-26T14:27:06Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - A Correspondence Variational Autoencoder for Unsupervised Acoustic Word
Embeddings [50.524054820564395]
そこで本稿では,変数分割音声セグメントを固定次元表現にマッピングするための教師なしモデルを提案する。
結果として得られる音響単語の埋め込みは、低リソース言語とゼロリソース言語のための検索、発見、インデックスシステムの基礎を形成することができる。
論文 参考訳(メタデータ) (2020-12-03T19:24:42Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - A Comparative Study of Lexical Substitution Approaches based on Neural
Language Models [117.96628873753123]
本稿では,一般的なニューラル言語とマスキング言語モデルの大規模比較研究について述べる。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによって達成された既に競合する結果をさらに改善できることを示す。
論文 参考訳(メタデータ) (2020-05-29T18:43:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。