論文の概要: Split-NER: Named Entity Recognition via Two Question-Answering-based
Classifications
- arxiv url: http://arxiv.org/abs/2310.19942v1
- Date: Mon, 30 Oct 2023 18:57:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-01 18:05:27.860312
- Title: Split-NER: Named Entity Recognition via Two Question-Answering-based
Classifications
- Title(参考訳): Split-NER:2つの質問応答型分類によるエンティティ認識
- Authors: Jatin Arora and Youngja Park
- Abstract要約: SplitNERは、NER問題を2つの論理的なサブタスクに分割することで解決するシステムである。
4つのクロスドメインデータセットによる実験では、この2ステップのアプローチが効率的かつ時間的効率の両方を示している。
本システムの有効性は,検出と分類を分離して,BERTモデルを2回微調整することに起因する。
- 参考スコア(独自算出の注目度): 5.922488908114023
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we address the NER problem by splitting it into two logical
sub-tasks: (1) Span Detection which simply extracts entity mention spans
irrespective of entity type; (2) Span Classification which classifies the spans
into their entity types. Further, we formulate both sub-tasks as
question-answering (QA) problems and produce two leaner models which can be
optimized separately for each sub-task. Experiments with four cross-domain
datasets demonstrate that this two-step approach is both effective and time
efficient. Our system, SplitNER outperforms baselines on OntoNotes5.0, WNUT17
and a cybersecurity dataset and gives on-par performance on BioNLP13CG. In all
cases, it achieves a significant reduction in training time compared to its QA
baseline counterpart. The effectiveness of our system stems from fine-tuning
the BERT model twice, separately for span detection and classification. The
source code can be found at https://github.com/c3sr/split-ner.
- Abstract(参考訳): 本研究では, NER の問題を,(1) エンティティタイプによらず,単純にエンティティ参照を抽出する Span Detection,(2) エンティティタイプに分類する Span Classification という2つの論理サブタスクに分割することで解決する。
さらに,両サブタスクをQA問題として定式化し,各サブタスクに対して個別に最適化可能な2つのランダモデルを生成する。
4つのクロスドメインデータセットによる実験では、この2ステップのアプローチが効率的かつ時間的効率の両方を示している。
当社のシステムであるSplitNERは,OntoNotes5.0,WNUT17,サイバーセキュリティデータセットをベースラインとして,BioNLP13CGのオンパーパフォーマンスを実現している。
いずれの場合も、qaベースラインに比べてトレーニング時間が大幅に短縮される。
本システムの有効性は,検出と分類を分離して,BERTモデルを2回微調整することに起因する。
ソースコードはhttps://github.com/c3sr/split-nerにある。
関連論文リスト
- Span-based Named Entity Recognition by Generating and Compressing
Information [23.444967843156086]
我々は,2種類のIBモデルを一つのシステムに統合し,名前付きエンティティ認識を強化することを提案する。
5つの異なるコーパスの実験は、生成モデルと情報圧縮モデルの両方を共同で訓練することで、ベースラインスパンベースのNERシステムの性能を向上させることを示唆している。
論文 参考訳(メタデータ) (2023-02-10T17:40:51Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - SpanProto: A Two-stage Span-based Prototypical Network for Few-shot
Named Entity Recognition [45.012327072558975]
名前付きエンティティ認識(NER)は、アノテーション付きデータが少ない名前付きエンティティを識別することを目的としている。
そこで本研究では,2段階のアプローチを用いて,数発のNERに対処するセミナルスパンベースプロトタイプネットワーク(SpanProto)を提案する。
スパン抽出の段階では、逐次タグを大域境界行列に変換し、モデルが明示的な境界情報に集中できるようにする。
分類に言及するために、原型学習を活用してラベル付きスパンのセマンティック表現をキャプチャし、新しいクラスエンティティへの適応性を向上する。
論文 参考訳(メタデータ) (2022-10-17T12:59:33Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - An Embarrassingly Easy but Strong Baseline for Nested Named Entity
Recognition [55.080101447586635]
スコア行列の空間関係をモデル化するために,コナールニューラルネットワーク(CNN)を提案する。
提案手法は, 事前学習したエンコーダと同一の手法である。
論文 参考訳(メタデータ) (2022-08-09T04:33:46Z) - QUEACO: Borrowing Treasures from Weakly-labeled Behavior Data for Query
Attribute Value Extraction [57.56700153507383]
本稿では,QUEACOというEコマース検索におけるクエリ属性値の統一抽出システムを提案する。
NER フェーズでは、QUEACO は教師-学生ネットワークを採用し、強くラベル付けされたデータに基づいてトレーニングされた教師ネットワークが擬似ラベルを生成する。
AVN フェーズでは、弱いラベル付けされたクエリ・ツー・アトリビュート・ビヘイビア・データを利用して、クエリーから表層属性値の正規化を行い、製品から標準形式へと変換する。
論文 参考訳(メタデータ) (2021-08-19T03:24:23Z) - BoningKnife: Joint Entity Mention Detection and Typing for Nested NER
via prior Boundary Knowledge [1.5149438988761574]
ネストされたNER抽出および認識タスクをよりよく扱うために,境界知識(BoningKnife)を介して検出およびタイピングモデルに言及する共同エンティティを提案する。
BoningKnifeはMentionTaggerとTypeClassifierの2つのモジュールで構成されている。
異なるデータセットに対する実験により、我々の手法は従来の手法よりも優れており、ACE2004、ACE2005、NNEの86.41、85.46、94.2のF1スコアが達成されている。
論文 参考訳(メタデータ) (2021-07-20T11:44:36Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition [9.809157050048375]
名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
論文 参考訳(メタデータ) (2021-05-14T12:52:34Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。