論文の概要: Mulco: Recognizing Chinese Nested Named Entities Through Multiple Scopes
- arxiv url: http://arxiv.org/abs/2211.10854v1
- Date: Sun, 20 Nov 2022 02:53:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 18:01:25.147455
- Title: Mulco: Recognizing Chinese Nested Named Entities Through Multiple Scopes
- Title(参考訳): Mulco:複数のスコープで中国のネストされた名前のエンティティを認識
- Authors: Jiuding Yang, Jinwen Luo, Weidong Guo, Jerry Chen, Di Niu, Yu Xu
- Abstract要約: ネスト構造における名前付きエンティティを複数のスコープで認識する新しい手法であるMulcoを提案する。
ChiNesEをベースとしたMulcoは,複数のスコープを通してネスト構造における名前付きエンティティを認識可能な新しい手法である。
- 参考スコア(独自算出の注目度): 18.359084133065817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Nested Named Entity Recognition (NNER) has been a long-term challenge to
researchers as an important sub-area of Named Entity Recognition. NNER is where
one entity may be part of a longer entity, and this may happen on multiple
levels, as the term nested suggests. These nested structures make traditional
sequence labeling methods unable to properly recognize all entities. While
recent researches focus on designing better recognition methods for NNER in a
variety of languages, the Chinese NNER (CNNER) still lacks attention, where a
free-for-access, CNNER-specialized benchmark is absent. In this paper, we aim
to solve CNNER problems by providing a Chinese dataset and a learning-based
model to tackle the issue. To facilitate the research on this task, we release
ChiNesE, a CNNER dataset with 20,000 sentences sampled from online passages of
multiple domains, containing 117,284 entities failing in 10 categories, where
43.8 percent of those entities are nested. Based on ChiNesE, we propose Mulco,
a novel method that can recognize named entities in nested structures through
multiple scopes. Each scope use a designed scope-based sequence labeling
method, which predicts an anchor and the length of a named entity to recognize
it. Experiment results show that Mulco has outperformed several baseline
methods with the different recognizing schemes on ChiNesE. We also conduct
extensive experiments on ACE2005 Chinese corpus, where Mulco has achieved the
best performance compared with the baseline methods.
- Abstract(参考訳): Nested Named Entity Recognition (NNER)は、Nested Entity Recognitionの重要なサブ領域として研究者にとって長年の課題である。
NNERは、あるエンティティが長いエンティティの一部になる可能性があり、ネストされた用語が示すように、これは複数のレベルで起こりうる。
これらのネスト構造により、従来のシーケンスラベリングメソッドはすべてのエンティティを適切に認識できない。
近年の研究では、NNERの認識方法の改善に焦点が当てられているが、中国NNER(CNNER)はまだ注目されていない。
本稿では,中国語のデータセットと学習モデルを提供することで,CNNERの問題を解決することを目的とする。
この研究を容易にするために、複数のドメインのオンラインパスから2万文をサンプリングしたcnnerデータセットであるchinaを10のカテゴリで失敗している117,284のエンティティを含む10のカテゴリでリリースし、その43.8%がネストされている。
ChiNesEをベースとしたMulcoは,複数のスコープを通してネスト構造における名前付きエンティティを認識可能な新しい手法である。
各スコープは、アンカーと名前付きエンティティの長さを予測して認識する、スコープベースのシーケンスラベリングメソッドを使用する。
実験の結果、mulcoは中国語の認識方式の異なるいくつかのベースラインメソッドよりも優れていた。
また,mulcoがベースライン法と比較して最高の性能を達成しているace2005中国コーパスについても広範な実験を行った。
関連論文リスト
- LLM-DER:A Named Entity Recognition Method Based on Large Language Models for Chinese Coal Chemical Domain [4.639851504108679]
中国語におけるドメイン固有エンティティ認識問題に対して,Large Language Models (LLMs) ベースのエンティティ認識フレームワーク LLM-DER を提案する。
LLMs-DERは、LCMを通してエンティティタイプを含む関係のリストを生成し、誤認識されたエンティティを削除するための妥当性と一貫性の評価方法を設計する。
本稿では,Resumeデータセットと自己構築石炭化学データセットCoalを用いた実験結果から,LLM-DERがドメイン固有エンティティ認識において優れた性能を示した。
論文 参考訳(メタデータ) (2024-09-16T08:28:05Z) - Composited-Nested-Learning with Data Augmentation for Nested Named Entity Recognition [5.188242370198818]
Nested Named Entity Recognition (NNER)は、重複したエンティティ認識に対処することに焦点を当てている。
データ拡張は、アノテートされたコーパスの不足に対処するための効果的なアプローチである。
ネストワードとネストラベルを組み合わせてネストしたエンティティをモデル化する複合-ネスト-ラベル分類法(CNLC)を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:46:18Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - PromptNER: A Prompting Method for Few-shot Named Entity Recognition via
k Nearest Neighbor Search [56.81939214465558]
本稿では,近距離探索による数発NERの新規プロンプト法であるPromptNERを提案する。
我々は、エンティティカテゴリ情報を含むプロンプトを使用してラベルのプロトタイプを構築する。
Few-NERDデータセットとCrossNERデータセットの広範な実験により,本モデルが最先端手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2023-05-20T15:47:59Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - CROP: Zero-shot Cross-lingual Named Entity Recognition with Multilingual
Labeled Sequence Translation [113.99145386490639]
言語間NERは、整列した言語間表現や機械翻訳結果を通じて、言語間で知識を伝達することができる。
ゼロショット言語間NERを実現するために,クロスランガル・エンティティ・プロジェクション・フレームワーク(CROP)を提案する。
多言語ラベル付きシーケンス翻訳モデルを用いて、タグ付けされたシーケンスをターゲット言語に投影し、ターゲットの原文にラベル付けする。
論文 参考訳(メタデータ) (2022-10-13T13:32:36Z) - An Embarrassingly Easy but Strong Baseline for Nested Named Entity
Recognition [55.080101447586635]
スコア行列の空間関係をモデル化するために,コナールニューラルネットワーク(CNN)を提案する。
提案手法は, 事前学習したエンコーダと同一の手法である。
論文 参考訳(メタデータ) (2022-08-09T04:33:46Z) - Trigger-GNN: A Trigger-Based Graph Neural Network for Nested Named
Entity Recognition [5.9049664765234295]
ネストしたNERを利用するトリガーベースグラフニューラルネットワーク(Trigger-GNN)を提案する。
エンティティトリガーエンコーディングとセマンティックマッチングを通じて補完的なアノテーション埋め込みを得る。
モデルはより効率的に、費用対効果で学習し、一般化するのに役立ちます。
論文 参考訳(メタデータ) (2022-04-12T04:15:39Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition [9.809157050048375]
名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
論文 参考訳(メタデータ) (2021-05-14T12:52:34Z) - Zero-Resource Cross-Domain Named Entity Recognition [68.83177074227598]
既存のドメイン名付きエンティティ認識モデルは、多くのラベルなしコーパスや、ターゲットドメイン内のラベル付きNERトレーニングデータに依存している。
外部リソースを一切使用しないドメイン間NERモデルを提案する。
論文 参考訳(メタデータ) (2020-02-14T09:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。