論文の概要: A Unified Generative Framework for Various NER Subtasks
- arxiv url: http://arxiv.org/abs/2106.01223v1
- Date: Wed, 2 Jun 2021 15:19:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-03 14:30:43.799573
- Title: A Unified Generative Framework for Various NER Subtasks
- Title(参考訳): 様々なnerサブタスクのための統一生成フレームワーク
- Authors: Hang Yan, Tao Gui, Junqi Dai, Qipeng Guo, Zheng Zhang and Xipeng Qiu
- Abstract要約: 本研究では,NERサブタスクをエンティティスパンシーケンス生成タスクとして定式化する。
統合されたフレームワークに基づいて、トレーニング済みのSeq2Seqモデルを利用して、3種類のNERサブタスクをすべて解決できる。
提案するフレームワークは実装が容易で,8つの英語NERデータセット上で,最先端(SoTA)あるいはSoTAに近い性能を実現する。
- 参考スコア(独自算出の注目度): 39.78805705711495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named Entity Recognition (NER) is the task of identifying spans that
represent entities in sentences. Whether the entity spans are nested or
discontinuous, the NER task can be categorized into the flat NER, nested NER,
and discontinuous NER subtasks. These subtasks have been mainly solved by the
token-level sequence labelling or span-level classification. However, these
solutions can hardly tackle the three kinds of NER subtasks concurrently. To
that end, we propose to formulate the NER subtasks as an entity span sequence
generation task, which can be solved by a unified sequence-to-sequence
(Seq2Seq) framework. Based on our unified framework, we can leverage the
pre-trained Seq2Seq model to solve all three kinds of NER subtasks without the
special design of the tagging schema or ways to enumerate spans. We exploit
three types of entity representations to linearize entities into a sequence.
Our proposed framework is easy-to-implement and achieves state-of-the-art
(SoTA) or near SoTA performance on eight English NER datasets, including two
flat NER datasets, three nested NER datasets, and three discontinuous NER
datasets.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、文中のエンティティを表すスパンを識別するタスクである。
エンティティがネストしているか不連続であるかにかかわらず、NERタスクはフラットなNER、ネストされたNER、不連続なNERサブタスクに分類される。
これらのサブタスクは主にトークンレベルのシーケンスラベリングまたはスパンレベルの分類によって解決されている。
しかし、これらのソリューションは3種類のNERサブタスクを同時に扱うことはほとんどできない。
そこで我々は,NERサブタスクをエンティティスパンシーケンス生成タスクとして定式化することを提案する。
統一されたフレームワークに基づいて、事前トレーニングされたseq2seqモデルを利用して、タグスキーマやスパンを列挙する方法を特別な設計なしに、3種類のnerサブタスクをすべて解決できます。
3種類のエンティティ表現を利用して、エンティティをシーケンスにリニア化します。
提案するフレームワークは,2つの平らなNERデータセット,3つのネストされたNERデータセット,および3つの不連続なNERデータセットを含む,8つの英語NERデータセットに対して,最新技術(SoTA)あるいはSoTAに近いパフォーマンスを実現する。
関連論文リスト
- In-Context Learning for Few-Shot Nested Named Entity Recognition [53.55310639969833]
数発のネストネストNERの設定に有効で革新的なICLフレームワークを導入する。
我々は、新しい実演選択機構であるEnDe retrieverを考案し、ICLプロンプトを改善する。
EnDe検索では,意味的類似性,境界類似性,ラベル類似性という3種類の表現学習を行うために,コントラスト学習を用いる。
論文 参考訳(メタデータ) (2024-02-02T06:57:53Z) - S2F-NER: Exploring Sequence-to-Forest Generation for Complex Entity
Recognition [47.714230389689064]
本研究では、フォレストデコーダを介して文中のエンティティを直接抽出できる新しいシーケンス・ツー・フォレスト生成パラダイムS2F-NERを提案する。
具体的には,各樹木の最大深度が3である森林において,各樹木の各経路を自己回帰的に生成する。
このパラダイムに基づいて、我々のモデルは露出バイアス問題をエレガントに緩和し、Seq2Seqの単純さを維持することができる。
論文 参考訳(メタデータ) (2023-10-29T09:09:10Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - Propose-and-Refine: A Two-Stage Set Prediction Network for Nested Named
Entity Recognition [13.010064498077863]
ネストしたNERのための2段階セット予測ネットワークであるPropose-and-Refine Network(PnRNet)を提案する。
提案段階では,大まかなエンティティ予測をエンティティ提案として生成するために,スパンベースの予測器を用いる。
洗練された段階では、提案は相互に相互作用し、よりリッチな文脈情報を提案表現に組み込む。
PnRNetは4つのネストされたNERデータセットと1つのフラットなNERデータセットで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-04-27T06:58:45Z) - Unified Named Entity Recognition as Word-Word Relation Classification [25.801945832005504]
我々は、統一NERを単語関係分類、すなわちW2NERとしてモデル化する新しい方法を提案する。
このアーキテクチャは、エンティティワード間の隣り合う関係を効果的にモデル化することにより、統一NERのカーネルボトルネックを解決する。
W2NERスキームに基づいて,統一NERを単語ペアの2次元グリッドとしてモデル化するニューラルネットワークフレームワークを開発する。
論文 参考訳(メタデータ) (2021-12-19T06:11:07Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。