論文の概要: Three-part diachronic semantic change dataset for Russian
- arxiv url: http://arxiv.org/abs/2106.08294v1
- Date: Tue, 15 Jun 2021 17:12:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 17:44:59.915406
- Title: Three-part diachronic semantic change dataset for Russian
- Title(参考訳): ロシア語のための三部的意味変化データセット
- Authors: Andrey Kutuzov, Lidia Pivovarova
- Abstract要約: 我々は、ロシア語のRuShiftEvalに対して、手動で注釈付き語彙意味変化データセットを提示する。
その斬新さは、3つの期間にわたるダイアクロニックなセマンティックシフトにアノテートされた1組の標的単語によって保証される。
- 参考スコア(独自算出の注目度): 4.7566046630595755
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a manually annotated lexical semantic change dataset for Russian:
RuShiftEval. Its novelty is ensured by a single set of target words annotated
for their diachronic semantic shifts across three time periods, while the
previous work either used only two time periods, or different sets of target
words. The paper describes the composition and annotation procedure for the
dataset. In addition, it is shown how the ternary nature of RuShiftEval allows
to trace specific diachronic trajectories: `changed at a particular time period
and stable afterwards' or `was changing throughout all time periods'. Based on
the analysis of the submissions to the recent shared task on semantic change
detection for Russian, we argue that correctly identifying such trajectories
can be an interesting sub-task itself.
- Abstract(参考訳): 本稿では,ロシア語の字句的意味変化データセット rushifteval を提案する。
その斬新さは、3つの時間的意味変化に注釈を付けた1組のターゲット語によって保証されるが、以前の研究では2つの時間的あるいは異なるターゲット語のセットしか使用されなかった。
本稿では,データセットの構成とアノテーション手順について述べる。
また, ルシチエヴァルの3次性質が, 「特定の期間に変化し, その後に安定している」, 「すべての期間にわたって変化した」という, 特定のダイアクロニカル軌跡を追跡できることを示す。
ロシアの意味的変化検出に関する最近の共有タスクに対する提案の分析に基づいて、そのような軌跡を正しく同定することは、興味深いサブタスクである可能性があると論じる。
関連論文リスト
- Evaluating Semantic Variation in Text-to-Image Synthesis: A Causal Perspective [50.261681681643076]
本稿では,SemVarEffectとSemVarBenchというベンチマークを用いて,テキスト・画像合成における入力のセマンティックな変化と出力の因果性を評価する。
本研究は,T2I合成コミュニティによるヒューマンインストラクション理解の探索を促進する効果的な評価枠組みを確立する。
論文 参考訳(メタデータ) (2024-10-14T08:45:35Z) - Semantic Change Detection for the Romanian Language [0.5202524136984541]
実世界のデータセット上に静的および文脈的単語埋め込みモデルを作成するための様々な戦略を分析する。
まず,英語データセット (SEMEVAL-CCOHA) とルーマニア語データセット (SEMEVAL-CCOHA) で単語埋め込みモデルの評価を行った。
実験結果から,コーパスによっては,モデルの選択と,意味的変化を検出するためのスコアを計算するための距離が最も重要な要因であることが示唆された。
論文 参考訳(メタデータ) (2023-08-23T13:37:02Z) - Unsupervised Semantic Variation Prediction using the Distribution of
Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。
意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。
対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文 参考訳(メタデータ) (2023-05-15T13:58:21Z) - Variational Cross-Graph Reasoning and Adaptive Structured Semantics
Learning for Compositional Temporal Grounding [143.5927158318524]
テンポラルグラウンドティング(Temporal grounding)とは、クエリ文に従って、未編集のビデオから特定のセグメントを特定するタスクである。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
ビデオや言語に内在する構造的意味論は、構成的一般化を実現する上で重要な要素である、と我々は主張する。
論文 参考訳(メタデータ) (2023-01-22T08:02:23Z) - Compositional Temporal Grounding with Structured Variational Cross-Graph
Correspondence Learning [92.07643510310766]
ビデオの時間的接地は、あるクエリ文に意味的に対応する1つのターゲットビデオセグメントをローカライズすることを目的としている。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
出現した単語の新たな組み合わせによるクエリの一般化に失敗したことを実証的に見出した。
本稿では,ビデオと言語を複数の階層構造に明示的に分解する多変分グラフ推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-24T12:55:23Z) - NorDiaChange: Diachronic Semantic Change Dataset for Norwegian [63.65426535861836]
NorDiaChangeはノルウェーにおける最初のダイアクロニックなセマンティックチェンジデータセットである。
ノルウェーの約80の名詞が、時間とともに格付けされた意味変化で注釈付けされている。
論文 参考訳(メタデータ) (2022-01-13T18:27:33Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - RuSemShift: a dataset of historical lexical semantic change in Russian [3.261599248682794]
本稿では,ロシア語で意味変化モデリングを行うための大規模手動アノテートテストセットRuSemShiftを提案する。
ターゲット語は複数のクラウドソースワーカーによって注釈付けされた。
本稿では,RuSemShiftにおける分散手法の性能について報告する。
論文 参考訳(メタデータ) (2020-10-13T14:54:05Z) - ELMo and BERT in semantic change detection for Russian [4.389735175149927]
本研究では,ロシア語データに対するダイアクロニック・セマンティック・チェンジ検出の課題に対する文脈的埋め込みの有効性について検討した。
評価試験セットはロシア語の名詞と形容詞からなり、ソ連前、ソ連後、ソビエト連邦の時代に作成されたテキストに注釈が付けられている。
論文 参考訳(メタデータ) (2020-10-07T15:34:00Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。