論文の概要: Nested Named Entity Recognition as Holistic Structure Parsing
- arxiv url: http://arxiv.org/abs/2204.08006v1
- Date: Sun, 17 Apr 2022 12:48:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-20 03:07:52.954696
- Title: Nested Named Entity Recognition as Holistic Structure Parsing
- Title(参考訳): 立体構造解析としてのNested Named Entity Recognition
- Authors: Yifei Yang, Zuchao Li, Hai Zhao
- Abstract要約: 本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
- 参考スコア(独自算出の注目度): 92.8397338250383
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As a fundamental natural language processing task and one of core knowledge
extraction techniques, named entity recognition (NER) is widely used to extract
information from texts for downstream tasks. Nested NER is a branch of NER in
which the named entities (NEs) are nested with each other. However, most of the
previous studies on nested NER usually apply linear structure to model the
nested NEs which are actually accommodated in a hierarchical structure. Thus in
order to address this mismatch, this work models the full nested NEs in a
sentence as a holistic structure, then we propose a holistic structure parsing
algorithm to disclose the entire NEs once for all. Besides, there is no
research on applying corpus-level information to NER currently. To make up for
the loss of this information, we introduce Point-wise Mutual Information (PMI)
and other frequency features from corpus-aware statistics for even better
performance by holistic modeling from sentence-level to corpus-level.
Experiments show that our model yields promising results on widely-used
benchmarks which approach or even achieve state-of-the-art. Further empirical
studies show that our proposed corpus-aware features can substantially improve
NER domain adaptation, which demonstrates the surprising advantage of our
proposed corpus-level holistic structure modeling.
- Abstract(参考訳): 基本自然言語処理タスクとコア知識抽出技術の1つとして、エンティティ認識(NER)が下流タスクのためのテキストから情報を抽出するために広く利用されている。
Nested NERは、ネストされたエンティティ(NE)がネストされるNERのブランチである。
しかしながら、ネストされたNERに関する以前の研究の多くは、通常、階層構造で実際に許容されるネストされたNEをモデル化するために線形構造を適用している。
そこで本研究では,このミスマッチに対処するため,文中の全ネストNEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
また、現在、nerにコーパスレベルの情報を適用する研究はない。
文レベルからコーパスレベルまでの包括的モデリングによりさらに優れた性能を実現するため,コーパス認識統計からポイントワイズ相互情報(pmi)やその他の周波数特徴を導入する。
実験により,我々のモデルが,最先端にアプローチしたり,達成したりする,広く使用されているベンチマークに有望な結果をもたらすことが示された。
さらに実験により,提案するコーパス認識機能はner領域適応を著しく改善できることが示され,提案するコーパスレベルの全体構造モデリングの驚くべき利点を示す。
関連論文リスト
- Rethinking Negative Instances for Generative Named Entity Recognition [24.471319308957035]
GNERはジェネレーティブNERシステムであり、見えないエンティティドメイン間でゼロショットのパフォーマンスが改善されている。
本稿では,非構造的予測を構造化エンティティに変換するために最適化したLCSマッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-02-26T14:30:37Z) - In-Context Learning for Few-Shot Nested Named Entity Recognition [53.55310639969833]
数発のネストネストNERの設定に有効で革新的なICLフレームワークを導入する。
我々は、新しい実演選択機構であるEnDe retrieverを考案し、ICLプロンプトを改善する。
EnDe検索では,意味的類似性,境界類似性,ラベル類似性という3種類の表現学習を行うために,コントラスト学習を用いる。
論文 参考訳(メタデータ) (2024-02-02T06:57:53Z) - Dynamic Named Entity Recognition [5.9401550252715865]
動的名前付きエンティティ認識(DNER)という新しいタスクを紹介します。
DNERは、コンテキストを利用してエンティティを抽出するアルゴリズムの能力を評価するためのフレームワークを提供する。
本稿では,本課題に関連する課題と研究軸を反映したベースラインモデルと実験結果について述べる。
論文 参考訳(メタデータ) (2023-02-16T15:50:02Z) - Equivariant Transduction through Invariant Alignment [71.45263447328374]
グループ内ハードアライメント機構を組み込んだ,新しいグループ同変アーキテクチャを提案する。
我々のネットワーク構造は、既存のグループ同変アプローチよりも強い同変特性を発達させることができる。
また、SCANタスクにおいて、従来のグループ同変ネットワークよりも経験的に優れていたことが判明した。
論文 参考訳(メタデータ) (2022-09-22T11:19:45Z) - MINER: Improving Out-of-Vocabulary Named Entity Recognition from an
Information Theoretic Perspective [57.19660234992812]
NERモデルは標準のNERベンチマークで有望な性能を達成した。
近年の研究では、従来のアプローチはエンティティ参照情報に過度に依存し、OoV(out-of-vocabulary)エンティティ認識の性能が劣っていることが示されている。
我々は、情報理論の観点からこの問題を改善するための新しいNER学習フレームワークであるMINERを提案する。
論文 参考訳(メタデータ) (2022-04-09T05:18:20Z) - Convex Polytope Modelling for Unsupervised Derivation of Semantic
Structure for Data-efficient Natural Language Understanding [31.888489552069146]
Convex-Polytopic-Modelベースのフレームワークは、生のダイアログコーパスを利用して意味パターンを自動的に抽出する大きな可能性を示している。
このフレームワークは,コーパスのセマンティックフレーム関連機能を活用し,発話の基盤となるセマンティック構造を明らかにし,最小限の監視で最先端のNLUモデルの性能を向上させることができることを示す。
論文 参考訳(メタデータ) (2022-01-25T19:12:44Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - ASTRAL: Adversarial Trained LSTM-CNN for Named Entity Recognition [16.43239147870092]
本稿では,モデル構造とトレーニングプロセスの両方から,現在のNER法を改善するためのLSTM-CNN(ASTRAL)システムを提案する。
提案システムは,CoNLL-03,OntoNotes 5.0,WNUT-17の3つのベンチマークで評価し,最先端の結果を得た。
論文 参考訳(メタデータ) (2020-09-02T13:15:25Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。