論文の概要: Graph-based Clustering for Detecting Semantic Change Across Time and
Languages
- arxiv url: http://arxiv.org/abs/2402.01025v1
- Date: Thu, 1 Feb 2024 21:27:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-05 17:41:05.237366
- Title: Graph-based Clustering for Detecting Semantic Change Across Time and
Languages
- Title(参考訳): 時間と言語間の意味変化を検出するグラフベースのクラスタリング
- Authors: Xianghe Ma, Michael Strube, Wei Zhao
- Abstract要約: 本稿では,高頻度・低周波両方の単語知覚におけるニュアンス変化を時間的・言語的に捉えたグラフベースのクラスタリング手法を提案する。
提案手法は,4言語にわたるSemEval 2020バイナリ分類タスクにおいて,従来のアプローチを大幅に上回っている。
- 参考スコア(独自算出の注目度): 10.058655884092094
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Despite the predominance of contextualized embeddings in NLP, approaches to
detect semantic change relying on these embeddings and clustering methods
underperform simpler counterparts based on static word embeddings. This stems
from the poor quality of the clustering methods to produce sense clusters --
which struggle to capture word senses, especially those with low frequency.
This issue hinders the next step in examining how changes in word senses in one
language influence another. To address this issue, we propose a graph-based
clustering approach to capture nuanced changes in both high- and low-frequency
word senses across time and languages, including the acquisition and loss of
these senses over time. Our experimental results show that our approach
substantially surpasses previous approaches in the SemEval2020 binary
classification task across four languages. Moreover, we showcase the ability of
our approach as a versatile visualization tool to detect semantic changes in
both intra-language and inter-language setups. We make our code and data
publicly available.
- Abstract(参考訳): NLPにおける文脈的埋め込みの優位性にもかかわらず、これらの埋め込みとクラスタリング手法に依存する意味的変化を検出するアプローチは、静的な単語の埋め込みに基づいて、より単純な組込みを実現する。
これは、特に低頻度の単語知覚を捉えるのに苦労するセンスクラスタを生成するクラスタリング手法の質が低かったことに由来する。
この問題は、ある言語における単語感覚の変化が他の言語に与える影響を調べるための次のステップを妨げます。
この問題に対処するために,高頻度と低頻度の単語感覚を時間と言語にまたがるニュアンス変化を捉えるためのグラフベースのクラスタリング手法を提案する。
実験の結果,本手法は4言語にわたるsemeval2020バイナリ分類タスクにおける従来のアプローチを大幅に上回ることがわかった。
さらに,言語内設定と言語間設定のセマンティックな変化を検出する汎用可視化ツールとして,我々のアプローチを実証する。
コードとデータを公開しています。
関連論文リスト
- Language-Driven Visual Consensus for Zero-Shot Semantic Segmentation [114.72734384299476]
本稿では,言語駆動型ビジュアルコンセンサス(LDVC)アプローチを提案する。
クラス埋め込みを、その離散的で抽象的な性質からアンカーとして活用し、クラス埋め込みに向けて視覚的特徴を操る。
我々の手法は、目に見えないクラスに対するセグメンテーションモデルの能力を大幅に向上させる。
論文 参考訳(メタデータ) (2024-03-13T11:23:55Z) - Semantic change detection for Slovene language: a novel dataset and an
approach based on optimal transport [0.0]
我々は、200万人の話者を持つあまりリソースの乏しいスラヴ語であるSloveneにおける意味的変化の検出に焦点をあてる。
セマンティックチェンジ検出システムを評価するための最初のSloveneデータセットを提案する。
論文 参考訳(メタデータ) (2024-02-26T14:27:06Z) - ConNER: Consistency Training for Cross-lingual Named Entity Recognition [96.84391089120847]
言語間の名前付きエンティティ認識は、対象言語のデータの不足に悩まされる。
言語間NERのための新しい一貫性トレーニングフレームワークとしてConNERを提案する。
論文 参考訳(メタデータ) (2022-11-17T07:57:54Z) - Word Sense Induction with Hierarchical Clustering and Mutual Information
Maximization [14.997937028599255]
単語知覚誘導は自然言語処理において難しい問題である。
階層的クラスタリングと不変情報クラスタリングに基づく新しい教師なし手法を提案する。
我々は、ある場合において、我々のアプローチが先行したWSIの最先端手法よりも優れていることを実証的に実証した。
論文 参考訳(メタデータ) (2022-10-11T13:04:06Z) - Learning Semantic Correspondence with Sparse Annotations [66.37298464505261]
密接な意味的対応を見つけることは、コンピュータビジョンの基本的な問題である。
本研究では,高密度な擬似ラベルを生成するための教師学習パラダイムを提案する。
また、擬似ラベルを識別するための2つの新しい戦略も開発している。
論文 参考訳(メタデータ) (2022-08-15T02:24:18Z) - Transferring Semantic Knowledge Into Language Encoders [6.85316573653194]
意味的意味表現から言語エンコーダへ意味的知識を伝達する手法である意味型ミッドチューニングを導入する。
このアライメントは分類や三重項の損失によって暗黙的に学習できることを示す。
提案手法は, 推論, 理解, テキストの類似性, その他の意味的タスクにおいて, 予測性能の向上を示す言語エンコーダを生成する。
論文 参考訳(メタデータ) (2021-10-14T14:11:12Z) - Neural Variational Learning for Grounded Language Acquisition [14.567067583556714]
本稿では,言語が特定の定義された用語のカテゴリを含まない視覚的知覚に基礎を置いている学習システムを提案する。
この生成手法は,低リソース環境下での視覚的カテゴリを事前に指定することなく,言語接地において有望な結果を示すことを示す。
論文 参考訳(メタデータ) (2021-07-20T20:55:02Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - Beyond the Deep Metric Learning: Enhance the Cross-Modal Matching with
Adversarial Discriminative Domain Regularization [21.904563910555368]
本稿では,画像とテキストのペア内における識別データドメインの集合を構築するための新しい学習フレームワークを提案する。
我々のアプローチは一般的に既存のメトリクス学習フレームワークの学習効率と性能を改善することができる。
論文 参考訳(メタデータ) (2020-10-23T01:48:37Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z) - Robust Cross-lingual Embeddings from Parallel Sentences [65.85468628136927]
本稿では,文整合コーパスを利用して頑健な言語間単語表現を実現するCBOW手法のバイリンガル拡張を提案する。
提案手法は,他のすべての手法と比較して,言語間文検索性能を著しく向上させる。
また、ゼロショットのクロスランガル文書分類タスクにおいて、ディープRNN法と同等性を実現する。
論文 参考訳(メタデータ) (2019-12-28T16:18:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。