論文の概要: NEREL: A Russian Dataset with Nested Named Entities and Relations
- arxiv url: http://arxiv.org/abs/2108.13112v1
- Date: Mon, 30 Aug 2021 10:40:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-31 19:01:18.227915
- Title: NEREL: A Russian Dataset with Nested Named Entities and Relations
- Title(参考訳): NEREL: ネストされた名前のエンティティと関係を持つロシアのデータセット
- Authors: Natalia Loukachevitch and Ekaterina Artemova and Tatiana Batura and
Pavel Braslavski and Ilia Denisov and Vladimir Ivanov and Suresh Manandhar
and Alexander Pugachev and Elena Tutubalina
- Abstract要約: 我々は、名前付きエンティティ認識と関係抽出のためのロシアのデータセットであるNERELを提案する。
56Kのアノテートされたエンティティと39Kのアノテートされたリレーションを含んでいる。
- 参考スコア(独自算出の注目度): 55.69103749079697
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present NEREL, a Russian dataset for named entity
recognition and relation extraction. NEREL is significantly larger than
existing Russian datasets: to date it contains 56K annotated named entities and
39K annotated relations. Its important difference from previous datasets is
annotation of nested named entities, as well as relations within nested
entities and at the discourse level. NEREL can facilitate development of novel
models that can extract relations between nested named entities, as well as
relations on both sentence and document levels. NEREL also contains the
annotation of events involving named entities and their roles in the events.
The NEREL collection is available via https://github.com/nerel-ds/NEREL.
- Abstract(参考訳): 本稿では,名前付きエンティティ認識と関係抽出のためのロシアのデータセットであるnerelを提案する。
NERELは既存のロシアのデータセットよりもはるかに大きく、これまでは56Kの注釈付き名前付きエンティティと39Kの注釈付きリレーションを含んでいる。
以前のデータセットとの大きな違いは、ネストされた名前付きエンティティのアノテーションと、ネストされたエンティティと談話レベルでの関係である。
NERELは、ネストされた名前付きエンティティ間の関係を抽出し、文と文書の関係を抽出する新しいモデルの開発を容易にする。
NERELには、名前付きエンティティとイベントにおけるそれらの役割を含むイベントのアノテーションも含まれている。
NERELコレクションはhttps://github.com/nerel-ds/NERELから入手できる。
関連論文リスト
- Composited-Nested-Learning with Data Augmentation for Nested Named Entity Recognition [5.188242370198818]
Nested Named Entity Recognition (NNER)は、重複したエンティティ認識に対処することに焦点を当てている。
データ拡張は、アノテートされたコーパスの不足に対処するための効果的なアプローチである。
ネストワードとネストラベルを組み合わせてネストしたエンティティをモデル化する複合-ネスト-ラベル分類法(CNLC)を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:46:18Z) - Joint Entity and Relation Extraction with Span Pruning and Hypergraph
Neural Networks [58.43972540643903]
PLマーカ(最先端マーカーベースピプレリンモデル)上に構築されたEREのためのHyperGraphニューラルネットワーク(hgnn$)を提案する。
エラーの伝播を軽減するため,NERモジュールからのエンティティ識別とラベル付けの負担をモデルのジョイントモジュールに転送するために,ハイリコールプルーナー機構を用いる。
EREタスクに広く使用されている3つのベンチマークの実験は、以前の最先端のPLマーカーよりも大幅に改善されている。
論文 参考訳(メタデータ) (2023-10-26T08:36:39Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - NEREL-BIO: A Dataset of Biomedical Abstracts Annotated with Nested Named
Entities [7.713462279125201]
NEREL-BIOは、ロシア語のPubMed抽象文の注釈スキームとコーパスであり、英語の抽象文は少ない。
NEREL-BIOは、ドメイン固有のエンティティタイプを導入することで、一般的なドメインデータセットであるNERELを拡張している。
NEREL-BIOはネストされた名前のエンティティに対して、NERELで使用されるスキームの拡張としてアノテーションを提供する。
論文 参考訳(メタデータ) (2022-10-21T12:28:43Z) - An Embarrassingly Easy but Strong Baseline for Nested Named Entity
Recognition [55.080101447586635]
スコア行列の空間関係をモデル化するために,コナールニューラルネットワーク(CNN)を提案する。
提案手法は, 事前学習したエンコーダと同一の手法である。
論文 参考訳(メタデータ) (2022-08-09T04:33:46Z) - AsNER -- Annotated Dataset and Baseline for Assamese Named Entity
recognition [7.252817150901275]
提案されたNERデータセットは、ディープニューラルネットワークベースのアサマセ言語処理のための重要なリソースである可能性が高い。
我々は、NERモデルをトレーニングしてデータセットをベンチマークし、教師付きエンティティ認識のための最先端アーキテクチャを用いて評価する。
全てのベースラインの中で最も高いF1スコアは、単語埋め込み法として MuRIL を使用する場合、80.69%の精度を達成する。
論文 参考訳(メタデータ) (2022-07-07T16:45:55Z) - HiNER: A Large Hindi Named Entity Recognition Dataset [29.300418937509317]
本稿では,11個のタグを付加した109,146文と2,220,856トークンを含む標準Hindi NERデータセットをリリースする。
データセット内のタグセットの統計は、特に人、場所、組織といった著名なクラスにおいて、タグ単位の分布が健全であることを示している。
我々のデータセットは、すべてのタグで重み付けされたF1スコア88.78、タグセットが崩壊したときに92.22を達成するのに役立ちます。
論文 参考訳(メタデータ) (2022-04-28T19:14:21Z) - Trigger-GNN: A Trigger-Based Graph Neural Network for Nested Named
Entity Recognition [5.9049664765234295]
ネストしたNERを利用するトリガーベースグラフニューラルネットワーク(Trigger-GNN)を提案する。
エンティティトリガーエンコーディングとセマンティックマッチングを通じて補完的なアノテーション埋め込みを得る。
モデルはより効率的に、費用対効果で学習し、一般化するのに役立ちます。
論文 参考訳(メタデータ) (2022-04-12T04:15:39Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。