論文の概要: Can Word Sense Distribution Detect Semantic Changes of Words?
- arxiv url: http://arxiv.org/abs/2310.10400v1
- Date: Mon, 16 Oct 2023 13:41:27 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 14:19:13.887928
- Title: Can Word Sense Distribution Detect Semantic Changes of Words?
- Title(参考訳): 単語センス分布は単語の意味的変化を検出できるか?
- Authors: Xiaohang Tang, Yi Zhou, Taichi Aida, Procheta Sen, Danushka Bollegala
- Abstract要約: 単語感覚分布は、英語、ドイツ語、スウェーデン語、ラテン語の単語の意味変化を正確に予測するために使用できることを示す。
SemEval 2020 Task 1のデータセットを用いた実験結果から,単語の意味的変化を正確に予測できることがわかった。
- 参考スコア(独自算出の注目度): 35.17635565325166
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semantic Change Detection (SCD) of words is an important task for various NLP
applications that must make time-sensitive predictions. Some words are used
over time in novel ways to express new meanings, and these new meanings
establish themselves as novel senses of existing words. On the other hand, Word
Sense Disambiguation (WSD) methods associate ambiguous words with sense ids,
depending on the context in which they occur. Given this relationship between
WSD and SCD, we explore the possibility of predicting whether a target word has
its meaning changed between two corpora collected at different time steps, by
comparing the distributions of senses of that word in each corpora. For this
purpose, we use pretrained static sense embeddings to automatically annotate
each occurrence of the target word in a corpus with a sense id. Next, we
compute the distribution of sense ids of a target word in a given corpus.
Finally, we use different divergence or distance measures to quantify the
semantic change of the target word across the two given corpora. Our
experimental results on SemEval 2020 Task 1 dataset show that word sense
distributions can be accurately used to predict semantic changes of words in
English, German, Swedish and Latin.
- Abstract(参考訳): 単語の意味的変化検出(SCD)は、時間に敏感な予測をしなければならない様々なNLPアプリケーションにとって重要なタスクである。
新しい意味を表現する新しい方法で、時間とともに使われる言葉もあり、これらの新しい意味は既存の単語の新しい感覚として確立される。
一方、単語センス曖昧化(WSD)手法は、その発生状況に応じて、曖昧な単語とセンスIDを関連付ける。
wsd と scd の関係を考えると,各コーパス中の単語の感覚分布を比較することにより,目的語が意味を持つか否かを,異なる時間ステップで収集した2つのコーパス間で予測する可能性について検討する。
この目的のために、事前学習された静的センス埋め込みを使用して、センスidでコーパス内のターゲットワードの発生を自動注釈する。
次に、与えられたコーパス内の対象単語のセンスidの分布を計算する。
最後に,目的語の意味的変化を2つのコーパス間で定量化するために,異なる発散量や距離尺度を用いる。
SemEval 2020 Task 1のデータセットを用いた実験結果から,英語,ドイツ語,スウェーデン語,ラテン語の単語の意味変化を正確に予測できることがわかった。
関連論文リスト
- Word sense extension [8.939269057094661]
本稿では,新しい文脈に向けて,単語が新たな感覚を創出することを可能にする,単語知覚拡張(WSE)のパラダイムを提案する。
本研究では,多文語型を異なる感覚を示す2つの擬似トークンに分割することで,単語拡張をシミュレートするフレームワークを開発する。
本フレームワークは,様々な種類の単語知覚拡張をサポートするために,言語モデル埋め込み空間を変換する学習手法と,連鎖の認知モデルを組み合わせる。
論文 参考訳(メタデータ) (2023-06-09T00:54:21Z) - Unsupervised Semantic Variation Prediction using the Distribution of
Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。
意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。
対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文 参考訳(メタデータ) (2023-05-15T13:58:21Z) - Connect-the-Dots: Bridging Semantics between Words and Definitions via
Aligning Word Sense Inventories [47.03271152494389]
Word Sense Disambiguationは、そのコンテキストに応じて、ある単語の正確な意味を自動的に識別することを目的としている。
既存の教師付きモデルは、限られた訓練データのために稀な単語感覚の正確な予測に苦慮している。
我々は,定義文を異なる意味の在庫から同じ意味に整合させ,豊富な語彙知識を収集する光沢アライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-27T00:04:33Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - UoB at SemEval-2020 Task 1: Automatic Identification of Novel Word
Senses [0.6980076213134383]
本稿では,新しい単語認識に適したベイズ単語認識に基づく語彙意味変化検出手法を提案する。
同じアプローチが15年間のTwitterデータから得られたコーパスにも適用され、結果がスラングのインスタンスである可能性のある単語の識別に使用される。
論文 参考訳(メタデータ) (2020-10-18T19:27:06Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z) - Moving Down the Long Tail of Word Sense Disambiguation with
Gloss-Informed Biencoders [79.38278330678965]
Word Sense Disambiguation (WSD)の主な障害は、単語感覚が均一に分散されないことである。
本稿では,(1)対象語とその周囲の文脈を独立に埋め込んだバイエンコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-05-06T04:21:45Z) - Humpty Dumpty: Controlling Word Meanings via Corpus Poisoning [29.181547214915238]
埋め込み空間における単語の位置を変更することで、攻撃者が新しい単語や既存の単語の「意味」を制御できることが示される。
埋め込みに対する攻撃は、さまざまな下流タスクに影響を与える可能性がある。
論文 参考訳(メタデータ) (2020-01-14T17:48:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。