論文の概要: Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition
- arxiv url: http://arxiv.org/abs/2105.06804v1
- Date: Fri, 14 May 2021 12:52:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-17 12:47:01.971836
- Title: Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition
- Title(参考訳): Locate and Label:Nested Named Entity Recognitionのための2段階同定器
- Authors: Yongliang Shen, Xinyin Ma, Zeqi Tan, Shuai Zhang, Wen Wang and Weiming
Lu
- Abstract要約: 名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
- 参考スコア(独自算出の注目度): 9.809157050048375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) is a well-studied task in natural language
processing. Traditional NER research only deals with flat entities and ignores
nested entities. The span-based methods treat entity recognition as a span
classification task. Although these methods have the innate ability to handle
nested NER, they suffer from high computational cost, ignorance of boundary
information, under-utilization of the spans that partially match with entities,
and difficulties in long entity recognition. To tackle these issues, we propose
a two-stage entity identifier. First we generate span proposals by filtering
and boundary regression on the seed spans to locate the entities, and then
label the boundary-adjusted span proposals with the corresponding categories.
Our method effectively utilizes the boundary information of entities and
partially matched spans during training. Through boundary regression, entities
of any length can be covered theoretically, which improves the ability to
recognize long entities. In addition, many low-quality seed spans are filtered
out in the first stage, which reduces the time complexity of inference.
Experiments on nested NER datasets demonstrate that our proposed method
outperforms previous state-of-the-art models.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は自然言語処理においてよく研究されているタスクである。
従来のNER研究は平らなエンティティのみを扱い、ネストされたエンティティを無視する。
スパンベースの手法は、エンティティ認識をスパン分類タスクとして扱う。
これらの手法はネストしたnerを扱う固有の能力を持っているが、高い計算コスト、境界情報の無知、エンティティと部分的に一致するスパンの過小利用、長いエンティティ認識の困難に苦しんでいる。
これらの問題に対処するため、我々は2段階のエンティティ識別子を提案する。
まず、種スパンのフィルタリングと境界回帰によってスパン提案を生成し、その後、境界調整されたスパン提案に対応するカテゴリをラベル付けします。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
境界回帰により、任意の長さの実体を理論的にカバーできるため、長い実体を認識する能力が向上する。
さらに、多くの低品質の種子が第1段階でろ過され、推論の時間的複雑さが減少する。
ネストnerデータセットを用いた実験により,提案手法が先行する最先端モデルを上回ることを示した。
関連論文リスト
- A Boundary Offset Prediction Network for Named Entity Recognition [9.885278527023532]
名前付きエンティティ認識(NER)は、名前付きエンティティをテキストで識別し分類することを目的とした自然言語処理の基本的なタスクである。
そこで我々は,NERの新たな手法である境界オフセット予測ネットワーク(BOPN)を提案する。
本手法では,エンティティ型を検出対象として使用する代わりに,エンティティ型とスパン表現を統合して,型認識境界オフセットを生成する。
論文 参考訳(メタデータ) (2023-10-23T05:04:07Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - IXA/Cogcomp at SemEval-2023 Task 2: Context-enriched Multilingual Named
Entity Recognition using Knowledge Bases [53.054598423181844]
3つのステップからなる新しいNERカスケードアプローチを提案する。
我々は、細粒度および新興物質を正確に分類する上で、外部知識基盤の重要性を実証的に示す。
本システムは,低リソース言語設定においても,マルチコネラ2共有タスクにおいて頑健な性能を示す。
論文 参考訳(メタデータ) (2023-04-20T20:30:34Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Propose-and-Refine: A Two-Stage Set Prediction Network for Nested Named
Entity Recognition [13.010064498077863]
ネストしたNERのための2段階セット予測ネットワークであるPropose-and-Refine Network(PnRNet)を提案する。
提案段階では,大まかなエンティティ予測をエンティティ提案として生成するために,スパンベースの予測器を用いる。
洗練された段階では、提案は相互に相互作用し、よりリッチな文脈情報を提案表現に組み込む。
PnRNetは4つのネストされたNERデータセットと1つのフラットなNERデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-04-27T06:58:45Z) - Nested Named Entity Recognition as Latent Lexicalized Constituency
Parsing [29.705133932275892]
最近(Fu et al, 2021)は、ネストされたNERに取り組むために、スパンベースの選挙区に適応している。
本研究では, より表現力のある構造, 語彙化された選挙区木を用いて, 成分がキーワードでアノテートされる。
我々はアイズナー・サッタのアルゴリズムを有効活用し,部分的辺縁化と推論を効率的に行う。
論文 参考訳(メタデータ) (2022-03-09T12:02:59Z) - BoningKnife: Joint Entity Mention Detection and Typing for Nested NER
via prior Boundary Knowledge [1.5149438988761574]
ネストされたNER抽出および認識タスクをよりよく扱うために,境界知識(BoningKnife)を介して検出およびタイピングモデルに言及する共同エンティティを提案する。
BoningKnifeはMentionTaggerとTypeClassifierの2つのモジュールで構成されている。
異なるデータセットに対する実験により、我々の手法は従来の手法よりも優れており、ACE2004、ACE2005、NNEの86.41、85.46、94.2のF1スコアが達成されている。
論文 参考訳(メタデータ) (2021-07-20T11:44:36Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。