論文の概要: S2F-NER: Exploring Sequence-to-Forest Generation for Complex Entity
Recognition
- arxiv url: http://arxiv.org/abs/2310.18944v1
- Date: Sun, 29 Oct 2023 09:09:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-31 15:13:14.426919
- Title: S2F-NER: Exploring Sequence-to-Forest Generation for Complex Entity
Recognition
- Title(参考訳): S2F-NER:複雑なエンティティ認識のためのシーケンス・ツー・フォレスト生成の探索
- Authors: Yongxiu Xu and Heyan Huang and Yue Hu
- Abstract要約: 本研究では、フォレストデコーダを介して文中のエンティティを直接抽出できる新しいシーケンス・ツー・フォレスト生成パラダイムS2F-NERを提案する。
具体的には,各樹木の最大深度が3である森林において,各樹木の各経路を自己回帰的に生成する。
このパラダイムに基づいて、我々のモデルは露出バイアス問題をエレガントに緩和し、Seq2Seqの単純さを維持することができる。
- 参考スコア(独自算出の注目度): 47.714230389689064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named Entity Recognition (NER) remains challenging due to the complex
entities, like nested, overlapping, and discontinuous entities. Existing
approaches, such as sequence-to-sequence (Seq2Seq) generation and span-based
classification, have shown impressive performance on various NER subtasks, but
they are difficult to scale to datasets with longer input text because of
either exposure bias issue or inefficient computation. In this paper, we
propose a novel Sequence-to-Forest generation paradigm, S2F-NER, which can
directly extract entities in sentence via a Forest decoder that decode multiple
entities in parallel rather than sequentially. Specifically, our model generate
each path of each tree in forest autoregressively, where the maximum depth of
each tree is three (which is the shortest feasible length for complex NER and
is far smaller than the decoding length of Seq2Seq). Based on this novel
paradigm, our model can elegantly mitigates the exposure bias problem and keep
the simplicity of Seq2Seq. Experimental results show that our model
significantly outperforms the baselines on three discontinuous NER datasets and
on two nested NER datasets, especially for discontinuous entity recognition.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、ネスト、重複、不連続といった複雑なエンティティのため、依然として困難である。
seq2seq(sequence-to-sequence)生成やスパンベースの分類といった既存のアプローチは、さまざまなnerサブタスクで印象的なパフォーマンスを示しているが、露出バイアス問題や非効率的な計算のため、入力テキストが長いデータセットにスケールすることは困難である。
本稿では,複数のエンティティを逐次的ではなく並列にデコードするフォレストデコーダを用いて,文中のエンティティを直接抽出できる新しいシーケンス・ツー・フォレスト生成パラダイムであるS2F-NERを提案する。
具体的には,木々の各経路を自己回帰的に生成し,各木々の最大深さは3である(これは複雑なNERにおいて最も短く,Seq2Seqの復号長よりもはるかに小さい)。
この新しいパラダイムに基づき、このモデルは露出バイアス問題をエレガントに軽減し、seq2seqの単純さを保ちます。
実験結果から,本モデルは3つの不連続なNERデータセットと2つのネストしたNERデータセット,特に不連続なエンティティ認識のベースラインを大幅に上回ることがわかった。
関連論文リスト
- Single-Stage Visual Relationship Learning using Conditional Queries [60.90880759475021]
TraCQは、マルチタスク学習問題とエンティティペアの分布を回避する、シーングラフ生成の新しい定式化である。
我々は,DETRをベースとしたエンコーダ-デコーダ条件付きクエリを用いて,エンティティラベル空間を大幅に削減する。
実験結果から、TraCQは既存のシングルステージシーングラフ生成法よりも優れており、Visual Genomeデータセットの最先端の2段階メソッドを多く上回っていることがわかった。
論文 参考訳(メタデータ) (2023-06-09T06:02:01Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - Multi-task Transformer with Relation-attention and Type-attention for
Named Entity Recognition [35.44123819012004]
名前付きエンティティ認識(NER)は自然言語処理において重要な研究課題である。
本稿では,エンティティ境界検出タスクを名前付きエンティティ認識タスクに組み込むマルチタスク変換器を提案する。
論文 参考訳(メタデータ) (2023-03-20T05:11:22Z) - Mutual Exclusivity Training and Primitive Augmentation to Induce
Compositionality [84.94877848357896]
最近のデータセットは、標準的なシーケンス・ツー・シーケンスモデルにおける体系的な一般化能力の欠如を露呈している。
本稿では,セq2seqモデルの振る舞いを分析し,相互排他バイアスの欠如と全例を記憶する傾向の2つの要因を同定する。
広範に使用されている2つの構成性データセット上で、標準的なシーケンス・ツー・シーケンスモデルを用いて、経験的改善を示す。
論文 参考訳(メタデータ) (2022-11-28T17:36:41Z) - An Embarrassingly Easy but Strong Baseline for Nested Named Entity
Recognition [55.080101447586635]
スコア行列の空間関係をモデル化するために,コナールニューラルネットワーク(CNN)を提案する。
提案手法は, 事前学習したエンコーダと同一の手法である。
論文 参考訳(メタデータ) (2022-08-09T04:33:46Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Nested Named Entity Recognition with Partially-Observed TreeCRFs [23.992944831013013]
ネストネストnerを,部分可観測木を用いた構成構文解析と捉え,部分可観測木crfでモデル化した。
提案手法はACE 2004, ACE 2005データセット上でのSOTA(State-of-the-art)F1スコアを達成し, GENIAデータセット上でのSOTAモデルに匹敵する性能を示す。
論文 参考訳(メタデータ) (2020-12-15T18:20:36Z) - Minimize Exposure Bias of Seq2Seq Models in Joint Entity and Relation
Extraction [57.22929457171352]
共同エンティティと関係抽出は、プレーンテキストから直接関係三重項を抽出することを目的としている。
本稿では、露出バイアスの影響を最小限に抑えるために、新しいSequence-to-Unordered-Multi-Tree(Seq2UMTree)モデルを提案する。
論文 参考訳(メタデータ) (2020-09-16T06:53:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。