論文の概要: RuSemShift: a dataset of historical lexical semantic change in Russian
- arxiv url: http://arxiv.org/abs/2010.06436v1
- Date: Tue, 13 Oct 2020 14:54:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 23:38:15.622761
- Title: RuSemShift: a dataset of historical lexical semantic change in Russian
- Title(参考訳): RuSemShift:ロシアにおける歴史的語彙意味変化のデータセット
- Authors: Julia Rodina, Andrey Kutuzov
- Abstract要約: 本稿では,ロシア語で意味変化モデリングを行うための大規模手動アノテートテストセットRuSemShiftを提案する。
ターゲット語は複数のクラウドソースワーカーによって注釈付けされた。
本稿では,RuSemShiftにおける分散手法の性能について報告する。
- 参考スコア(独自算出の注目度): 3.261599248682794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present RuSemShift, a large-scale manually annotated test set for the task
of semantic change modeling in Russian for two long-term time period pairs:
from the pre-Soviet through the Soviet times and from the Soviet through the
post-Soviet times. Target words were annotated by multiple crowd-source
workers. The annotation process was organized following the DURel framework and
was based on sentence contexts extracted from the Russian National Corpus.
Additionally, we report the performance of several distributional approaches on
RuSemShift, achieving promising results, which at the same time leave room for
other researchers to improve.
- Abstract(参考訳): ソ連時代からソ連時代、ソ連時代からソ連時代までの2つの長期にわたって、ロシアにおける意味的変化モデリングのタスクのための、大規模な手動アノテーションによるテストセットであるrusemshiftを提案する。
ターゲット語は複数のクラウドソースワーカーによって注釈付けされた。
アノテーションプロセスはDURELフレームワークに従って編成され、ロシア国立コーパスから抽出された文文脈に基づいていた。
また,RuSemShiftにおけるいくつかの分散手法の性能を報告し,将来性のある結果を得るとともに,他の研究者が改善する余地も確保した。
関連論文リスト
- Syntactic Language Change in English and German: Metrics, Parsers, and Convergences [56.47832275431858]
本論文は,過去160年間の議会討論のコーパスを用いて,英語とドイツ語の統語的言語変化のダイアクロニックな傾向を考察する。
私たちは、広く使われているStanford Coreと、新しい4つの選択肢を含む5つの依存関係をベースとしています。
文長分布の尾部では,構文的尺度の変化が頻繁であることが明らかとなった。
論文 参考訳(メタデータ) (2024-02-18T11:46:16Z) - Semantic Change Detection for the Romanian Language [0.5202524136984541]
実世界のデータセット上に静的および文脈的単語埋め込みモデルを作成するための様々な戦略を分析する。
まず,英語データセット (SEMEVAL-CCOHA) とルーマニア語データセット (SEMEVAL-CCOHA) で単語埋め込みモデルの評価を行った。
実験結果から,コーパスによっては,モデルの選択と,意味的変化を検出するためのスコアを計算するための距離が最も重要な要因であることが示唆された。
論文 参考訳(メタデータ) (2023-08-23T13:37:02Z) - A big data approach towards sarcasm detection in Russian [0.0]
本稿では,ロシア語の屈折と自動テキスト合成のための決定論的アルゴリズムを提案する。
これらのアルゴリズムは、公開のWebサービスwww.passare.ruで実装されている。
論文 参考訳(メタデータ) (2023-06-01T08:34:26Z) - Retrofitting Multilingual Sentence Embeddings with Abstract Meaning
Representation [70.58243648754507]
抽象的意味表現(AMR)を用いた既存の多言語文の埋め込みを改善する新しい手法を提案する。
原文入力と比較すると、AMRは文の中核概念と関係を明確かつ曖昧に表す構造的意味表現である。
実験結果から,多言語文をAMRで埋め込むと,意味的類似性と伝達タスクの両方において,最先端の性能が向上することがわかった。
論文 参考訳(メタデータ) (2022-10-18T11:37:36Z) - Compositional Temporal Grounding with Structured Variational Cross-Graph
Correspondence Learning [92.07643510310766]
ビデオの時間的接地は、あるクエリ文に意味的に対応する1つのターゲットビデオセグメントをローカライズすることを目的としている。
新たに構成時間グラウンドタスクを導入し,2つの新しいデータセット分割を構築した。
出現した単語の新たな組み合わせによるクエリの一般化に失敗したことを実証的に見出した。
本稿では,ビデオと言語を複数の階層構造に明示的に分解する多変分グラフ推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-24T12:55:23Z) - Russian SuperGLUE 1.1: Revising the Lessons not Learned by Russian NLP
models [53.95094814056337]
本稿では,ロシアNLPモデルのGLUEを改良したベンチマークである,ロシアのSuperGLUE 1.1を提案する。
新バージョンには、技術的、ユーザエクスペリエンス、方法論的改善が多数含まれている。
我々は,ロシアのSuperGLUEをオープンソースモデルMOROCCOの産業的評価のためのフレームワークに統合する。
論文 参考訳(メタデータ) (2022-02-15T23:45:30Z) - Three-part diachronic semantic change dataset for Russian [4.7566046630595755]
我々は、ロシア語のRuShiftEvalに対して、手動で注釈付き語彙意味変化データセットを提示する。
その斬新さは、3つの期間にわたるダイアクロニックなセマンティックシフトにアノテートされた1組の標的単語によって保証される。
論文 参考訳(メタデータ) (2021-06-15T17:12:25Z) - Learning Contextualised Cross-lingual Word Embeddings and Alignments for
Extremely Low-Resource Languages Using Parallel Corpora [63.5286019659504]
そこで本稿では,小さな並列コーパスに基づく文脈型言語間単語埋め込み学習手法を提案する。
本手法は,入力文の翻訳と再構成を同時に行うLSTMエンコーダデコーダモデルを用いて単語埋め込みを実現する。
論文 参考訳(メタデータ) (2020-10-27T22:24:01Z) - ELMo and BERT in semantic change detection for Russian [4.389735175149927]
本研究では,ロシア語データに対するダイアクロニック・セマンティック・チェンジ検出の課題に対する文脈的埋め込みの有効性について検討した。
評価試験セットはロシア語の名詞と形容詞からなり、ソ連前、ソ連後、ソビエト連邦の時代に作成されたテキストに注釈が付けられている。
論文 参考訳(メタデータ) (2020-10-07T15:34:00Z) - Dataset for Automatic Summarization of Russian News [0.0]
ロシアのニュースを要約する最初のデータセットであるGazetaを紹介します。
このデータセットがロシア語のテキスト要約手法の有効なタスクであることを実証する。
論文 参考訳(メタデータ) (2020-06-19T10:44:06Z) - RUSSE'2020: Findings of the First Taxonomy Enrichment Task for the
Russian language [70.27072729280528]
本稿では,ロシア語の分類学的豊か化に関する最初の共有課題の結果について述べる。
16チームがこのタスクに参加し、半数以上が提供されたベースラインを上回った。
論文 参考訳(メタデータ) (2020-05-22T13:30:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。