論文の概要: UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and
Orthogonal Transformation
- arxiv url: http://arxiv.org/abs/2011.14678v1
- Date: Mon, 30 Nov 2020 10:41:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-07 03:42:47.567050
- Title: UWB @ DIACR-Ita: Lexical Semantic Change Detection with CCA and
Orthogonal Transformation
- Title(参考訳): UWB @ DIACR-Ita: CCAと直交変換を用いた語彙意味変化検出
- Authors: Ond\v{r}ej Pra\v{z}\'ak, Pavel P\v{r}ib\'a\v{n}, and Stephen Taylor
- Abstract要約: 本稿では,DIACR-Ita共有タスクの語彙的意味変化(単語感覚変化)を検出する手法について述べる。
異なる期間から選択された2つのイタリア語コーパスにおける特定の単語間の意味的差異について検討した。
- 参考スコア(独自算出の注目度): 1.3764085113103222
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we describe our method for detection of lexical semantic
change (i.e., word sense changes over time) for the DIACR-Ita shared task,
where we ranked $1^{st}$. We examine semantic differences between specific
words in two Italian corpora, chosen from different time periods. Our method is
fully unsupervised and language independent. It consists of preparing a
semantic vector space for each corpus, earlier and later. Then we compute a
linear transformation between earlier and later spaces, using CCA and
Orthogonal Transformation. Finally, we measure the cosines between the
transformed vectors.
- Abstract(参考訳): 本稿では,diacr-ita共有タスクにおける語彙意味変化(つまり,時間経過に伴う単語意味変化)の検出手法について述べる。
異なる時期から選択した2つのイタリア語コーパスにおける単語間の意味的差異について検討した。
本手法は完全に教師なしであり,言語に依存しない。
各コーパスに対する意味ベクトル空間(semantic vector space)を、前後で準備する。
次に、CCAと直交変換を用いて、初期空間と後期空間の間の線形変換を計算する。
最後に、変換ベクトル間のコサインを測定する。
関連論文リスト
- Investigating the Contextualised Word Embedding Dimensions Responsible for Contextual and Temporal Semantic Changes [30.563130208194977]
どのようにして変化が埋め込み空間にエンコードされるのかは、まだ不明である。
セマンティックチェンジベンチマークにおいて、事前訓練されたCWEとそれらの微調整されたバージョンを比較した。
以上の結果から, (a) 事前学習したCWE空間における単語の意味変化の原因となる軸は少ないが, 微調整された場合, 全次元に分散することがわかった。
論文 参考訳(メタデータ) (2024-07-03T05:42:20Z) - A Semantic Distance Metric Learning approach for Lexical Semantic Change Detection [30.563130208194977]
Lexical Semantic Change Detection (SCD) タスクでは、与えられたターゲット語である$w$が2つの異なるテキストコーパス間で意味を変えるかどうかを予測する。
既存のWord-in-Context(WiC)データセットを用いた教師付き2段階のSCD手法を提案する。
SCDのための複数のベンチマークデータセットの実験結果から,提案手法が複数の言語で高い性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-03-01T02:09:25Z) - Backpack Language Models [108.65930795825416]
Backpacksは、強力なモデリング性能と、解釈可能性と制御のためのインターフェースを組み合わせた、新しいニューラルアーキテクチャである。
学習のあと、感覚ベクトルが特殊化され、それぞれが単語の異なる側面を符号化することがわかった。
本稿では,感覚ベクトルに介入し,制御可能なテキスト生成とデバイアスを行うシンプルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-26T09:26:23Z) - Simple, Interpretable and Stable Method for Detecting Words with Usage
Change across Corpora [54.757845511368814]
2つの文体を比較し、その用法が異なる単語を探すという問題は、しばしばデジタル人文科学や計算社会科学において生じる。
これは一般に、各コーパスに単語の埋め込みを訓練し、ベクトル空間を整列させ、整列空間における余弦距離が大きい単語を探すことでアプローチされる。
本稿では,ベクトル空間アライメントを使わず,各単語の近傍を考慮した代替手法を提案する。
論文 参考訳(メタデータ) (2021-12-28T23:46:00Z) - A Rule-based/BPSO Approach to Produce Low-dimensional Semantic Basis
Vectors Set [0.0]
明示的な意味ベクトルでは、各次元は単語に対応するので、単語ベクトルは解釈可能である。
本研究では,低次元の明示的意味ベクトルを得るための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-11-24T21:23:43Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - UWB at SemEval-2020 Task 1: Lexical Semantic Change Detection [1.2599533416395767]
本研究は,英語,ドイツ語,ラテン語,スウェーデン語で異なる期間から選択された2つのコーパスにおける特定の単語間の意味的差異について検討する。
本手法はSemEval 2020 Task 1: textitUnsupervised Lexical Semantic Change Detectionのために開発された。
論文 参考訳(メタデータ) (2020-11-30T10:47:45Z) - NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for
Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。
その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。
本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文 参考訳(メタデータ) (2020-11-07T11:27:18Z) - Word Rotator's Distance [50.67809662270474]
テキスト類似性を評価する上での鍵となる原則は、単語のアライメントを考慮した2つのテキスト間の意味的重複度を測定することである。
単語ベクトルのノルムは単語の重要度によいプロキシであり、その角度は単語類似度によいプロキシであることを示す。
本稿では,まず単語ベクトルをノルムと方向に分解し,アライメントに基づく類似性を計算する手法を提案する。
論文 参考訳(メタデータ) (2020-04-30T17:48:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。