論文の概要: An Embarrassingly Easy but Strong Baseline for Nested Named Entity
Recognition
- arxiv url: http://arxiv.org/abs/2208.04534v1
- Date: Tue, 9 Aug 2022 04:33:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 12:32:43.214801
- Title: An Embarrassingly Easy but Strong Baseline for Nested Named Entity
Recognition
- Title(参考訳): ネストされた名前付きエンティティ認識のための恥ずかしいが強いベースライン
- Authors: Hang Yan, Yu Sun, Xiaonan Li, Xipeng Qiu
- Abstract要約: スコア行列の空間関係をモデル化するために,コナールニューラルネットワーク(CNN)を提案する。
提案手法は, 事前学習したエンコーダと同一の手法である。
- 参考スコア(独自算出の注目度): 55.080101447586635
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) is the task to detect and classify the entity
spans in the text. When entity spans overlap between each other, this problem
is named as nested NER. Span-based methods have been widely used to tackle the
nested NER. Most of these methods will get a score $n \times n$ matrix, where
$n$ means the length of sentence, and each entry corresponds to a span.
However, previous work ignores spatial relations in the score matrix. In this
paper, we propose using Convolutional Neural Network (CNN) to model these
spatial relations in the score matrix. Despite being simple, experiments in
three commonly used nested NER datasets show that our model surpasses several
recently proposed methods with the same pre-trained encoders. Further analysis
shows that using CNN can help the model find nested entities more accurately.
Besides, we found that different papers used different sentence tokenizations
for the three nested NER datasets, which will influence the comparison. Thus,
we release a pre-processing script to facilitate future comparison.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、テキスト中のエンティティを検出し分類するタスクである。
エンティティが相互に重複する場合、この問題はネストされたNERと呼ばれる。
Spanベースの手法はネストしたNERに取り組むために広く使われている。
これらのメソッドのほとんどはスコア $n \times n$ matrix を得るが、ここでは$n$ は文の長さを意味し、各エントリはスパンに対応する。
しかし、以前の研究はスコア行列の空間関係を無視している。
本稿では,これらの空間関係をスコア行列でモデル化するために,畳み込みニューラルネットワーク(CNN)を提案する。
単純ではあるが、3つのネストされたNERデータセットの実験により、我々のモデルは、同じトレーニング済みエンコーダを持つ、最近提案されたいくつかのメソッドを超えることが示されている。
さらに分析すると、CNNを使うことでネストしたエンティティをより正確に見つけることができる。
さらに,3つのネストしたNERデータセットに対して異なる文トークン化を用いて比較を行った。
そこで我々は,今後の比較を容易にするための前処理スクリプトをリリースする。
関連論文リスト
- S2F-NER: Exploring Sequence-to-Forest Generation for Complex Entity
Recognition [47.714230389689064]
本研究では、フォレストデコーダを介して文中のエンティティを直接抽出できる新しいシーケンス・ツー・フォレスト生成パラダイムS2F-NERを提案する。
具体的には,各樹木の最大深度が3である森林において,各樹木の各経路を自己回帰的に生成する。
このパラダイムに基づいて、我々のモデルは露出バイアス問題をエレガントに緩和し、Seq2Seqの単純さを維持することができる。
論文 参考訳(メタデータ) (2023-10-29T09:09:10Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Gaussian Prior Reinforcement Learning for Nested Named Entity
Recognition [52.46740830977898]
GPRLと呼ばれる新しいSeq2seqモデルを提案し、ネストしたNERタスクをエンティティ三重項列生成プロセスとして定式化する。
3つのネストされたNERデータセットの実験では、GPRLが以前のネストされたNERモデルより優れていることが示されている。
論文 参考訳(メタデータ) (2023-05-12T05:55:34Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Trigger-GNN: A Trigger-Based Graph Neural Network for Nested Named
Entity Recognition [5.9049664765234295]
ネストしたNERを利用するトリガーベースグラフニューラルネットワーク(Trigger-GNN)を提案する。
エンティティトリガーエンコーディングとセマンティックマッチングを通じて補完的なアノテーション埋め込みを得る。
モデルはより効率的に、費用対効果で学習し、一般化するのに役立ちます。
論文 参考訳(メタデータ) (2022-04-12T04:15:39Z) - Unified Named Entity Recognition as Word-Word Relation Classification [25.801945832005504]
我々は、統一NERを単語関係分類、すなわちW2NERとしてモデル化する新しい方法を提案する。
このアーキテクチャは、エンティティワード間の隣り合う関係を効果的にモデル化することにより、統一NERのカーネルボトルネックを解決する。
W2NERスキームに基づいて,統一NERを単語ペアの2次元グリッドとしてモデル化するニューラルネットワークフレームワークを開発する。
論文 参考訳(メタデータ) (2021-12-19T06:11:07Z) - Bottom-Up Constituency Parsing and Nested Named Entity Recognition with
Pointer Networks [24.337440797369702]
NER(Constituency parsing and nested named entity recognition)は、典型的なテクスチャ付き構造化予測タスクである。
本稿では,解析に線形ステップを必要とする,ポインタネットワークを用いたボトムアップ解析のための新しいグローバルポインティング機構を提案する。
提案手法は,全 BERT モデル (96.01 F1 スコア) における PTB の最先端性能と,選挙区解析における CTB7 の競合性能を得る。
論文 参考訳(メタデータ) (2021-10-11T17:01:43Z) - Adaptive Nearest Neighbor Machine Translation [60.97183408140499]
kNN-MTは、事前訓練されたニューラルネットワーク翻訳とトークンレベルのk-nearest-neighbor検索を組み合わせる。
従来のkNNアルゴリズムは、ターゲットトークンごとに同じ数の近傍を検索する。
ターゲットトークン毎のk個数を動的に決定する適応的kNN-MTを提案する。
論文 参考訳(メタデータ) (2021-05-27T09:27:42Z) - A Sequence-to-Set Network for Nested Named Entity Recognition [38.05786148160635]
ネストNERのための新しいシーケンス・ツー・セットニューラルネットワークを提案する。
我々は、非自己回帰デコーダを使用して、1回のパスで最終的なエンティティセットを予測する。
実験により, ネストした3つのNERコーパスに対して, 提案モデルが最先端となることを示す。
論文 参考訳(メタデータ) (2021-05-19T03:10:04Z) - Exploring and Evaluating Attributes, Values, and Structures for Entity
Alignment [100.19568734815732]
エンティティアライメント(EA)は、さまざまなKGから等価なエンティティをリンクすることで、リッチコンテンツの統合知識グラフ(KG)を構築することを目的としている。
属性・トリプルは重要なアライメント信号も提供できますが、まだ十分に調査されていません。
本稿では,属性値エンコーダを用いてKGをサブグラフに分割し,属性の様々なタイプを効率的にモデル化することを提案する。
論文 参考訳(メタデータ) (2020-10-07T08:03:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。