論文の概要: Recognizing Nested Entities from Flat Supervision: A New NER Subtask,
Feasibility and Challenges
- arxiv url: http://arxiv.org/abs/2211.00301v1
- Date: Tue, 1 Nov 2022 06:41:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 13:08:13.301823
- Title: Recognizing Nested Entities from Flat Supervision: A New NER Subtask,
Feasibility and Challenges
- Title(参考訳): フラットスーパービジョンからネステッドエンティティを認識する:新しいNERサブタスク、実現可能性と課題
- Authors: Enwei Zhu, Yiyang Liu, Ming Jin, Jinpeng Li
- Abstract要約: 本研究では,現実的な応用シナリオに対応する新しいサブタスクであるネスト・オブ・フラットNERを提案する。
ラベル付きエンティティ内でネストされたスパンを意図的に無視し、スパンベースのモデルをトレーニングします。
トレーニングデータからネストされたエンティティを除去すると,ACE 2004,ACE 2005,GENIAの各エンティティ内のスパンのサブセットに対して54.8%,54.2%,41.1%のF1スコアが得られた。
- 参考スコア(独自算出の注目度): 3.614392310669357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many recent named entity recognition (NER) studies criticize flat NER for its
non-overlapping assumption, and switch to investigating nested NER. However,
existing nested NER models heavily rely on training data annotated with nested
entities, while labeling such data is costly. This study proposes a new
subtask, nested-from-flat NER, which corresponds to a realistic application
scenario: given data annotated with flat entities only, one may still desire
the trained model capable of recognizing nested entities. To address this task,
we train span-based models and deliberately ignore the spans nested inside
labeled entities, since these spans are possibly unlabeled entities. With
nested entities removed from the training data, our model achieves 54.8%, 54.2%
and 41.1% F1 scores on the subset of spans within entities on ACE 2004, ACE
2005 and GENIA, respectively. This suggests the effectiveness of our approach
and the feasibility of the task. In addition, the model's performance on flat
entities is entirely unaffected. We further manually annotate the nested
entities in the test set of CoNLL 2003, creating a nested-from-flat NER
benchmark. Analysis results show that the main challenges stem from the data
and annotation inconsistencies between the flat and nested entities.
- Abstract(参考訳): 最近の多くの名前付きエンティティ認識(NER)研究は、平らなNERを重複しない仮定で批判し、ネストされたNERの調査に切り替えている。
しかし、既存のネストされたNERモデルは、ネストされたエンティティをアノテートしたトレーニングデータに大きく依存している。
本研究では,フラットなエンティティのみをアノテートしたデータに対して,ネストされたエンティティを認識可能なトレーニングされたモデルを求める場合,現実的なアプリケーションシナリオに対応する,新しいサブタスクであるネスト・トゥ・フラットなNERを提案する。
この課題に対処するために、スパンベースのモデルをトレーニングし、ラベル付きエンティティ内にネストされたスパンを意図的に無視する。
トレーニングデータからネストされたエンティティを除去すると,ACE 2004,ACE 2005,GENIAの各エンティティ内のスパンのサブセットに対して54.8%,54.2%,41.1%のスコアが得られた。
このことは、我々のアプローチの有効性とタスクの実現可能性を示している。
さらに、フラットエンティティにおけるモデルの性能は、完全に影響を受けない。
我々はさらにCoNLL 2003のテストセットにネストされたエンティティを手動でアノテートし、NERベンチマークを作成する。
分析の結果、主な課題はフラットエンティティとネストエンティティの間のデータとアノテーションの不整合にあることがわかった。
関連論文リスト
- Composited-Nested-Learning with Data Augmentation for Nested Named Entity Recognition [5.188242370198818]
Nested Named Entity Recognition (NNER)は、重複したエンティティ認識に対処することに焦点を当てている。
データ拡張は、アノテートされたコーパスの不足に対処するための効果的なアプローチである。
ネストワードとネストラベルを組み合わせてネストしたエンティティをモデル化する複合-ネスト-ラベル分類法(CNLC)を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:46:18Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - QUEACO: Borrowing Treasures from Weakly-labeled Behavior Data for Query
Attribute Value Extraction [57.56700153507383]
本稿では,QUEACOというEコマース検索におけるクエリ属性値の統一抽出システムを提案する。
NER フェーズでは、QUEACO は教師-学生ネットワークを採用し、強くラベル付けされたデータに基づいてトレーニングされた教師ネットワークが擬似ラベルを生成する。
AVN フェーズでは、弱いラベル付けされたクエリ・ツー・アトリビュート・ビヘイビア・データを利用して、クエリーから表層属性値の正規化を行い、製品から標準形式へと変換する。
論文 参考訳(メタデータ) (2021-08-19T03:24:23Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition [9.809157050048375]
名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
論文 参考訳(メタデータ) (2021-05-14T12:52:34Z) - Empirical Analysis of Unlabeled Entity Problem in Named Entity
Recognition [47.273602658066196]
多くのシナリオにおいて、名前付きエンティティ認識モデルはラベル付きエンティティ問題に苦しむ。
ラベルのないエンティティによってもたらされる誤解をほとんど排除できる一般的なアプローチを提案する。
私たちのモデルは、ラベルのないエンティティ問題に堅牢であり、以前のベースラインを超えます。
論文 参考訳(メタデータ) (2020-12-10T02:53:59Z) - Named Entity Recognition as Dependency Parsing [16.544333689188246]
グラフベースの依存性解析を使用して、バフィンモデルによる入力のグローバルビューをモデルに提供します。
このモデルは,8コーパスの評価とSoTA性能の達成により,最大2.2ポイントの精度向上を達成し,ネスト型NERと平坦型NERの両方で良好に動作することを示す。
論文 参考訳(メタデータ) (2020-05-14T17:11:41Z) - Bipartite Flat-Graph Network for Nested Named Entity Recognition [94.91507634620133]
ネスト型名前付きエンティティ認識(NER)のためのバイパートフラットグラフネットワーク(BiFlaG)
ネストされた名前付きエンティティ認識(NER)のためのバイパーティライトフラットグラフネットワーク(BiFlaG)を提案する。
論文 参考訳(メタデータ) (2020-05-01T15:14:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。