論文の概要: A Sequence-to-Set Network for Nested Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2105.08901v1
- Date: Wed, 19 May 2021 03:10:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 13:53:52.861501
- Title: A Sequence-to-Set Network for Nested Named Entity Recognition
- Title(参考訳): ネスト付き名前付きエンティティ認識のためのシーケンス・ツー・セットネットワーク
- Authors: Zeqi Tan, Yongliang Shen, Shuai Zhang, Weiming Lu, Yueting Zhuang
- Abstract要約: ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
- 参考スコア(独自算出の注目度): 38.05786148160635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) is a widely studied task in natural language
processing. Recently, a growing number of studies have focused on the nested
NER. The span-based methods, considering the entity recognition as a span
classification task, can deal with nested entities naturally. But they suffer
from the huge search space and the lack of interactions between entities. To
address these issues, we propose a novel sequence-to-set neural network for
nested NER. Instead of specifying candidate spans in advance, we provide a
fixed set of learnable vectors to learn the patterns of the valuable spans. We
utilize a non-autoregressive decoder to predict the final set of entities in
one pass, in which we are able to capture dependencies between entities.
Compared with the sequence-to-sequence method, our model is more suitable for
such unordered recognition task as it is insensitive to the label order. In
addition, we utilize the loss function based on bipartite matching to compute
the overall training loss. Experimental results show that our proposed model
achieves state-of-the-art on three nested NER corpora: ACE 2004, ACE 2005 and
KBP 2017.
- Abstract(参考訳): 名前付き実体認識(NER)は自然言語処理において広く研究されている課題である。
近年、ネストされたNERに焦点をあてる研究が増えている。
スパンベースの手法は、エンティティ認識をスパン分類タスクとして考慮し、ネストされたエンティティを自然に扱うことができる。
しかし、彼らは巨大な検索スペースとエンティティ間の相互作用の欠如に悩まされている。
そこで本研究では,ネストナーのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
候補スパンを事前に指定するのではなく、有用なスパンのパターンを学ぶための学習可能なベクトルの固定セットを提供する。
我々は、非自己回帰デコーダを使用して、エンティティ間の依存関係をキャプチャできる1つのパスにおけるエンティティの最終セットを予測する。
シーケンス・ツー・シーケンス法と比較すると,本モデルはラベル順に敏感な非順序認識タスクに適している。
さらに,両部マッチングに基づく損失関数を用いて,総合的なトレーニング損失を算出する。
実験結果から,NERコーパス3個(ACE 2004,ACE 2005,KBP 2017)について,本モデルの有効性が示唆された。
関連論文リスト
- S2F-NER: Exploring Sequence-to-Forest Generation for Complex Entity
Recognition [47.714230389689064]
本研究では、フォレストデコーダを介して文中のエンティティを直接抽出できる新しいシーケンス・ツー・フォレスト生成パラダイムS2F-NERを提案する。
具体的には,各樹木の最大深度が3である森林において,各樹木の各経路を自己回帰的に生成する。
このパラダイムに基づいて、我々のモデルは露出バイアス問題をエレガントに緩和し、Seq2Seqの単純さを維持することができる。
論文 参考訳(メタデータ) (2023-10-29T09:09:10Z) - A Boundary Offset Prediction Network for Named Entity Recognition [9.885278527023532]
名前付きエンティティ認識(NER)は、名前付きエンティティをテキストで識別し分類することを目的とした自然言語処理の基本的なタスクである。
そこで我々は,NERの新たな手法である境界オフセット予測ネットワーク(BOPN)を提案する。
本手法では,エンティティ型を検出対象として使用する代わりに,エンティティ型とスパン表現を統合して,型認識境界オフセットを生成する。
論文 参考訳(メタデータ) (2023-10-23T05:04:07Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - Dynamic Named Entity Recognition [5.9401550252715865]
動的名前付きエンティティ認識(DNER)という新しいタスクを紹介します。
DNERは、コンテキストを利用してエンティティを抽出するアルゴリズムの能力を評価するためのフレームワークを提供する。
本稿では,本課題に関連する課題と研究軸を反映したベースラインモデルと実験結果について述べる。
論文 参考訳(メタデータ) (2023-02-16T15:50:02Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - An Embarrassingly Easy but Strong Baseline for Nested Named Entity
Recognition [55.080101447586635]
スコア行列の空間関係をモデル化するために,コナールニューラルネットワーク(CNN)を提案する。
提案手法は, 事前学習したエンコーダと同一の手法である。
論文 参考訳(メタデータ) (2022-08-09T04:33:46Z) - Nested Named Entity Recognition as Latent Lexicalized Constituency
Parsing [29.705133932275892]
最近(Fu et al, 2021)は、ネストされたNERに取り組むために、スパンベースの選挙区に適応している。
本研究では, より表現力のある構造, 語彙化された選挙区木を用いて, 成分がキーワードでアノテートされる。
我々はアイズナー・サッタのアルゴリズムを有効活用し,部分的辺縁化と推論を効率的に行う。
論文 参考訳(メタデータ) (2022-03-09T12:02:59Z) - Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition [9.809157050048375]
名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
論文 参考訳(メタデータ) (2021-05-14T12:52:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。