論文の概要: GloVeInit at SemEval-2020 Task 1: Using GloVe Vector Initialization for
Unsupervised Lexical Semantic Change Detection
- arxiv url: http://arxiv.org/abs/2007.05618v1
- Date: Fri, 10 Jul 2020 21:35:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 21:07:53.280110
- Title: GloVeInit at SemEval-2020 Task 1: Using GloVe Vector Initialization for
Unsupervised Lexical Semantic Change Detection
- Title(参考訳): GloVeInit at SemEval-2020 Task 1: Using GloVe Vector Initialization for Unsupervised Lexical Semantic Change Detection
- Authors: Vaibhav Jain
- Abstract要約: 本稿では,SemEval 2020 Task 1: Unsupervised Lexical Semantic Change Detectionに対するベクトル初期化手法を提案する。
提案手法はベクトル初期化法を用いてGloVeの埋め込みを整列させる。
私たちのモデルは,2つのサブタスクの33チームの中で,13位と10位です。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper presents a vector initialization approach for the SemEval2020 Task
1: Unsupervised Lexical Semantic Change Detection. Given two corpora belonging
to different time periods and a set of target words, this task requires us to
classify whether a word gained or lost a sense over time (subtask 1) and to
rank them on the basis of the changes in their word senses (subtask 2). The
proposed approach is based on using Vector Initialization method to align GloVe
embeddings. The idea is to consecutively train GloVe embeddings for both
corpora, while using the first model to initialize the second one. This paper
is based on the hypothesis that GloVe embeddings are more suited for the Vector
Initialization method than SGNS embeddings. It presents an intuitive reasoning
behind this hypothesis, and also talks about the impact of various factors and
hyperparameters on the performance of the proposed approach. Our model ranks
13th and 10th among 33 teams in the two subtasks. The implementation has been
shared publicly.
- Abstract(参考訳): 本稿では,SemEval2020 Task 1: Unsupervised Lexical Semantic Change Detectionに対するベクトル初期化手法を提案する。
異なる時間帯に属する2つのコーパスと一組の目標単語が与えられた場合、このタスクでは、単語が時間とともに得られたか失ったかを分類し(サブタスク1)、単語感覚の変化に基づいてそれらをランク付けする必要がある(サブタスク2)。
提案手法はベクトル初期化法を用いてGloVeの埋め込みを整列させる。
最初のモデルを使って2番目のモデルを初期化しながら、両コーパスのグローブ埋め込みを連続してトレーニングする、というアイデアだ。
本稿では,GloVe埋め込みがSGNS埋め込みよりもベクトル初期化法に適しているという仮説に基づく。
この仮説の背後にある直感的な推論を示し、また、様々な要因とハイパーパラメータが提案手法の性能に与える影響についても述べる。
私たちのモデルは2つのサブタスクの33チームの中で13位と10位です。
実装は公開されています。
関連論文リスト
- Deep-change at AXOLOTL-24: Orchestrating WSD and WSI Models for Semantic Change Modeling [0.19116784879310028]
本稿では,AXOLOTL-24共有タスクのセマンティック・チェンジ・モデリングにおける最初のサブタスクの解について述べる。
本稿では,この課題を解く3つの新しい手法を提案し,実験する。
我々は、与えられた単語の使用法が与えられた感覚定義のいずれかによって説明されないかどうかを判断できるモデルを開発する。
論文 参考訳(メタデータ) (2024-08-09T17:15:54Z) - TartuNLP @ AXOLOTL-24: Leveraging Classifier Output for New Sense Detection in Lexical Semantics [0.21485350418225246]
AXOLOTL-24共有タスクに提案する。
このタスクは2つのサブタスクから構成される: 単語が時間とともに得られる新しい感覚を識別し、識別された新しい感覚の定義を生成する。
適応型バイナリ分類モデルをトレーニングし、使用例とグルースを一致させ、モデルの確率出力を利用して新しい感覚を識別した。
論文 参考訳(メタデータ) (2024-07-04T11:46:39Z) - Backpack Language Models [108.65930795825416]
Backpacksは、強力なモデリング性能と、解釈可能性と制御のためのインターフェースを組み合わせた、新しいニューラルアーキテクチャである。
学習のあと、感覚ベクトルが特殊化され、それぞれが単語の異なる側面を符号化することがわかった。
本稿では,感覚ベクトルに介入し,制御可能なテキスト生成とデバイアスを行うシンプルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-26T09:26:23Z) - Speaker Embedding-aware Neural Diarization: a Novel Framework for
Overlapped Speech Diarization in the Meeting Scenario [51.5031673695118]
重なり合う音声のダイアリゼーションを単一ラベル予測問題として再構成する。
話者埋め込み認識型ニューラルダイアリゼーション(SEND)システムを提案する。
論文 参考訳(メタデータ) (2022-03-18T06:40:39Z) - WOVe: Incorporating Word Order in GloVe Word Embeddings [0.0]
単語をベクトルとして定義することで、機械学習アルゴリズムがテキストを理解し、そこから情報を抽出しやすくなります。
ワードベクトル表現は、単語同義語、単語類似、構文解析など、多くのアプリケーションで使われている。
論文 参考訳(メタデータ) (2021-05-18T15:28:20Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - UWB at SemEval-2020 Task 1: Lexical Semantic Change Detection [1.2599533416395767]
本研究は,英語,ドイツ語,ラテン語,スウェーデン語で異なる期間から選択された2つのコーパスにおける特定の単語間の意味的差異について検討する。
本手法はSemEval 2020 Task 1: textitUnsupervised Lexical Semantic Change Detectionのために開発された。
論文 参考訳(メタデータ) (2020-11-30T10:47:45Z) - NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for
Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。
その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。
本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文 参考訳(メタデータ) (2020-11-07T11:27:18Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z) - UiO-UvA at SemEval-2020 Task 1: Contextualised Embeddings for Lexical
Semantic Change Detection [5.099262949886174]
本稿では,時とともに意味的ドリフトの度合いで単語をランク付けするSubtask 2に焦点を当てた。
最も効果的なアルゴリズムは、平均的なトークン埋め込みとトークン埋め込み間のペア距離のコサイン類似性に依存する。
論文 参考訳(メタデータ) (2020-04-30T18:43:57Z) - Pseudo-Convolutional Policy Gradient for Sequence-to-Sequence
Lip-Reading [96.48553941812366]
唇読解は唇運動系列から音声内容を推測することを目的としている。
seq2seqモデルの伝統的な学習プロセスには2つの問題がある。
本稿では,これら2つの問題に対処するために,PCPGに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2020-03-09T09:12:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。