論文の概要: RuNNE-2022 Shared Task: Recognizing Nested Named Entities
- arxiv url: http://arxiv.org/abs/2205.11159v1
- Date: Mon, 23 May 2022 09:50:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-25 09:35:29.538246
- Title: RuNNE-2022 Shared Task: Recognizing Nested Named Entities
- Title(参考訳): RuNNE-2022 共有タスク: ネストされた名前付きエンティティを認識する
- Authors: Ekaterina Artemova, Maxim Zmeev, Natalia Loukachevitch, Igor Rozhkov,
Tatiana Batura, Vladimir Ivanov, Elena Tutubalina
- Abstract要約: ロシアのNERELデータセットをRuNNE共有タスクに適用する。
NERELの命名されたエンティティのネストネスは最大6レベルに達する。
本稿では,RuNNE共有タスクの結果について報告する。
- 参考スコア(独自算出の注目度): 7.6462329126769815
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The RuNNE Shared Task approaches the problem of nested named entity
recognition. The annotation schema is designed in such a way, that an entity
may partially overlap or even be nested into another entity. This way, the
named entity "The Yermolova Theatre" of type "organization" houses another
entity "Yermolova" of type "person". We adopt the Russian NEREL dataset for the
RuNNE Shared Task. NEREL comprises news texts written in the Russian language
and collected from the Wikinews portal. The annotation schema includes 29
entity types. The nestedness of named entities in NEREL reaches up to six
levels. The RuNNE Shared Task explores two setups. (i) In the general setup all
entities occur more or less with the same frequency. (ii) In the few-shot setup
the majority of entity types occur often in the training set. However, some of
the entity types are have lower frequency, being thus challenging to recognize.
In the test set the frequency of all entity types is even.
This paper reports on the results of the RuNNE Shared Task. Overall the
shared task has received 156 submissions from nine teams. Half of the
submissions outperform a straightforward BERT-based baseline in both setups.
This paper overviews the shared task setup and discusses the submitted systems,
discovering meaning insights for the problem of nested NER. The links to the
evaluation platform and the data from the shared task are available in our
github repository: https://github.com/dialogue-evaluation/RuNNE.
- Abstract(参考訳): RuNNE Shared Taskはネストされた名前付きエンティティ認識の問題にアプローチする。
アノテーションスキーマは、エンティティが部分的に重複したり、別のエンティティにネストされるような方法で設計されます。
このようにして、タイプ「組織」の「イヤーモロヴァ劇場」はタイプ「人」の別の実体「イヤーモロヴァ」を収容する。
ロシアのNERELデータセットをRuNNE共有タスクに適用する。
NERELはロシア語で書かれたニューステキストをWikinewsポータルから収集する。
アノテーションスキーマは29のエンティティタイプを含む。
NERELの命名されたエンティティのネストネスは最大6レベルに達する。
RuNNE Shared Taskは2つの設定を探索する。
(i)一般的な設定では、すべてのエンティティは同じ頻度で多かれ少なかれ発生する。
(ii) 少数の設定では、エンティティ型の大部分はトレーニングセットで頻繁に発生する。
しかしながら、いくつかのエンティティタイプは周波数が低く、認識するのが困難である。
テストセットでは、すべてのエンティティタイプの頻度は偶数である。
本稿では,RuNNE共有タスクの結果について報告する。
全体として、共有タスクは9チームから156の応募を受けた。
投稿の半数は、BERTベースのベースラインを両方の設定で上回っている。
本稿では,共有タスク設定の概要と提案システムについて論じ,ネストされたNER問題に対する意味的洞察を明らかにする。
評価プラットフォームへのリンクと共有タスクからのデータは、githubリポジトリで利用可能です。
関連論文リスト
- SemEval-2024 Shared Task 6: SHROOM, a Shared-task on Hallucinations and Related Observable Overgeneration Mistakes [48.83290963506378]
本稿では,幻覚検出に焦点をあてた共有タスクであるSHROOMの結果について述べる。
このアプローチをどのように取り組んだかについて、いくつかの重要なトレンドを観察します。
チームの大多数が提案したベースラインシステムより優れていますが、トップスコアシステムのパフォーマンスは依然として、より困難なアイテムのランダムなハンドリングと一致しています。
論文 参考訳(メタデータ) (2024-03-12T15:06:22Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - GPT-NER: Named Entity Recognition via Large Language Models [58.609582116612934]
GPT-NERはシーケンスラベリングタスクを言語モデルで容易に適用可能な生成タスクに変換する。
GPT-NERは、トレーニングデータの量が極めて少ない場合、低リソースかつ少数ショットのセットアップにおいて、より優れた能力を示す。
これは、ラベル付きサンプルの数が限られている実世界のNERアプリケーションにおけるGPT-NERの機能を示す。
論文 参考訳(メタデータ) (2023-04-20T16:17:26Z) - Trigger-GNN: A Trigger-Based Graph Neural Network for Nested Named
Entity Recognition [5.9049664765234295]
ネストしたNERを利用するトリガーベースグラフニューラルネットワーク(Trigger-GNN)を提案する。
エンティティトリガーエンコーディングとセマンティックマッチングを通じて補完的なアノテーション埋め込みを得る。
モデルはより効率的に、費用対効果で学習し、一般化するのに役立ちます。
論文 参考訳(メタデータ) (2022-04-12T04:15:39Z) - InstructionNER: A Multi-Task Instruction-Based Generative Framework for
Few-shot NER [31.32381919473188]
InstructionNERというマルチタスク命令ベースの生成フレームワークを提案する。
具体的には、NERタスクを生成問題として再構成し、タスク固有の命令と回答オプションでソース文を豊かにし、自然言語のエンティティと型を推論する。
実験結果から,本手法は5つのデータセットのベースラインを数ショット設定で一貫的に上回っていることがわかった。
論文 参考訳(メタデータ) (2022-03-08T07:56:36Z) - NEREL: A Russian Dataset with Nested Named Entities and Relations [55.69103749079697]
我々は、名前付きエンティティ認識と関係抽出のためのロシアのデータセットであるNERELを提案する。
56Kのアノテートされたエンティティと39Kのアノテートされたリレーションを含んでいる。
論文 参考訳(メタデータ) (2021-08-30T10:40:20Z) - MobIE: A German Dataset for Named Entity Recognition, Entity Linking and
Relation Extraction in the Mobility Domain [76.21775236904185]
データセットは3,232のソーシャルメディアテキストと91Kトークンによるトラフィックレポートで構成され、20.5Kアノテーション付きエンティティを含んでいる。
データセットのサブセットには,7つのモビリティ関連,n-ary関係型がアノテートされている。
私たちの知る限りでは、NER、EL、REのアノテーションを組み合わせた最初のドイツ語データセットです。
論文 参考訳(メタデータ) (2021-08-16T08:21:50Z) - Few-NERD: A Few-Shot Named Entity Recognition Dataset [35.669024917327825]
提案するFew-NERDは,8大きめの粒度と66大きめの粒度を持つ大規模人手用少数ショットNERデータセットである。
Few-NERDはウィキペディアの188,238文で構成され、4,601,160語が含まれ、それぞれが文脈または2段階のエンティティタイプの一部として注釈付けされている。
論文 参考訳(メタデータ) (2021-05-16T15:53:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。