論文の概要: Nested Named Entity Recognition with Partially-Observed TreeCRFs
- arxiv url: http://arxiv.org/abs/2012.08478v1
- Date: Tue, 15 Dec 2020 18:20:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 09:54:06.474460
- Title: Nested Named Entity Recognition with Partially-Observed TreeCRFs
- Title(参考訳): 部分観測木CRFを用いたNested Named Entity Recognition
- Authors: Yao Fu, Chuanqi Tan, Mosha Chen, Songfang Huang, Fei Huang
- Abstract要約: ネストネストnerを,部分可観測木を用いた構成構文解析と捉え,部分可観測木crfでモデル化した。
提案手法はACE 2004, ACE 2005データセット上でのSOTA(State-of-the-art)F1スコアを達成し, GENIAデータセット上でのSOTAモデルに匹敵する性能を示す。
- 参考スコア(独自算出の注目度): 23.992944831013013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity recognition (NER) is a well-studied task in natural language
processing. However, the widely-used sequence labeling framework is difficult
to detect entities with nested structures. In this work, we view nested NER as
constituency parsing with partially-observed trees and model it with
partially-observed TreeCRFs. Specifically, we view all labeled entity spans as
observed nodes in a constituency tree, and other spans as latent nodes. With
the TreeCRF we achieve a uniform way to jointly model the observed and the
latent nodes. To compute the probability of partial trees with partial
marginalization, we propose a variant of the Inside algorithm, the
\textsc{Masked Inside} algorithm, that supports different inference operations
for different nodes (evaluation for the observed, marginalization for the
latent, and rejection for nodes incompatible with the observed) with efficient
parallelized implementation, thus significantly speeding up training and
inference. Experiments show that our approach achieves the state-of-the-art
(SOTA) F1 scores on the ACE2004, ACE2005 dataset, and shows comparable
performance to SOTA models on the GENIA dataset. Our approach is implemented
at: \url{https://github.com/FranxYao/Partially-Observed-TreeCRFs}.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は自然言語処理においてよく研究されているタスクである。
しかし、広く使われているシーケンスラベリングフレームワークは、ネスト構造を持つエンティティを検出するのが難しい。
本研究では,nested nerを,部分観測木を用いた構成構文解析として捉え,部分観測木crfを用いてモデル化する。
具体的には、全てのラベル付きエンティティスパンを指数木内の観測ノードとして、その他のスパンを潜在ノードとして見る。
TreeCRFを使用することで、観測されたノードと潜伏ノードを共同でモデル化する均一な方法を実現する。
部分木の部分的辺縁化の確率を計算するために,異なるノードに対する異なる推論操作(観測値の評価,潜伏値の辺縁化,観測値と互換性のないノードの拒絶)を効率よく並列化することで,トレーニングと推論を著しく高速化する,Insideアルゴリズムの変種である‘textsc{Masked Inside} アルゴリズムを提案する。
実験の結果,本手法はace2004,ace2005データセットの最先端(sota)f1スコアを達成し,geniaデータセットのsomaモデルと同等の性能を示す。
当社のアプローチは、次のような形で実装されています。
関連論文リスト
- Reliable Node Similarity Matrix Guided Contrastive Graph Clustering [51.23437296378319]
我々は、新しいフレームワーク、Reliable Node similarity Matrix Guided Contrastive Graph Clustering (NS4GC)を紹介した。
本手法は,ノード近傍のアライメントとセマンティック・アウェア・スパリフィケーションを導入し,ノード類似度行列が正確かつ効率的にスパースであることを保証する。
論文 参考訳(メタデータ) (2024-08-07T13:36:03Z) - Rapid and Precise Topological Comparison with Merge Tree Neural Networks [7.443474354626664]
本稿では,Merge Tree Neural Network (MTNN)について紹介する。
まず,グラフの効率的なエンコーダとして出現したグラフニューラルネットワークをトレーニングして,ベクトル空間にマージツリーを埋め込む方法を示す。
次に、木とノードの埋め込みと新しいトポロジカルアテンション機構を統合することにより、類似性の比較をさらに改善する新しいMTNNモデルを定式化する。
論文 参考訳(メタデータ) (2024-04-08T21:26:04Z) - Node Classification in Random Trees [4.800441150586326]
ランダムな木として構造化されたオブジェクトの分類法を提案する。
我々の目的は、ツリーデータ構造がノード属性に関連付けられている設定において、ノードラベル割り当ての分布をモデル化することである。
本研究では,Stanford Sentiment Treebank データセットのノード分類タスクについて評価を行った。
論文 参考訳(メタデータ) (2023-11-20T20:33:35Z) - A Topological Perspective on Demystifying GNN-Based Link Prediction
Performance [72.06314265776683]
トポロジカル濃度 (TC) は、各ノードの局所部分グラフと隣人の部分グラフの交点に基づいている。
また,TCLは,次数や部分グラフ密度などの他のノードレベルのトポロジ指標よりもLP性能と高い相関性を示した。
我々は, 近似トポロジカル濃度 (ATC) を提案し, 理論的・経験的にTC近似の有効性を正当化し, 複雑さを低減させる。
論文 参考訳(メタデータ) (2023-10-06T22:07:49Z) - Type-supervised sequence labeling based on the heterogeneous star graph
for named entity recognition [6.25916397918329]
本稿では,テキストノードとタイプノードを含む異種星グラフの表現学習について述べる。
モデルは、グラフ内のノードを更新した後、タイプ管理シーケンスラベリングを実行する。
NERデータセットの公開実験により、フラットなエンティティとネストされたエンティティの両方を抽出する際のモデルの有効性が明らかとなった。
論文 参考訳(メタデータ) (2022-10-19T01:40:06Z) - Nested Named Entity Recognition as Latent Lexicalized Constituency
Parsing [29.705133932275892]
最近(Fu et al, 2021)は、ネストされたNERに取り組むために、スパンベースの選挙区に適応している。
本研究では, より表現力のある構造, 語彙化された選挙区木を用いて, 成分がキーワードでアノテートされる。
我々はアイズナー・サッタのアルゴリズムを有効活用し,部分的辺縁化と推論を効率的に行う。
論文 参考訳(メタデータ) (2022-03-09T12:02:59Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - Node Similarity Preserving Graph Convolutional Networks [51.520749924844054]
グラフニューラルネットワーク(GNN)は、ノード近傍の情報を集約し変換することで、グラフ構造とノードの特徴を探索する。
グラフ構造を利用してノード類似性を効果的かつ効率的に保存できるSimP-GCNを提案する。
本研究は,SimP-GCNが3つの分類グラフと4つの非補助グラフを含む7つのベンチマークデータセットに対して有効であることを示す。
論文 参考訳(メタデータ) (2020-11-19T04:18:01Z) - Graph Neural Networks with Composite Kernels [60.81504431653264]
カーネル重み付けの観点からノード集約を再解釈する。
本稿では,アグリゲーション方式における特徴類似性を考慮したフレームワークを提案する。
特徴空間における特徴類似性をエンコードするために,元の隣り合うカーネルと学習可能なカーネルの合成として特徴集約を提案する。
論文 参考訳(メタデータ) (2020-05-16T04:44:29Z) - Neighborhood Matching Network for Entity Alignment [71.24217694278616]
Neighborhood Matching Network (NMN)は、新しいエンティティアライメントフレームワークである。
NMNは、トポロジカル構造と近傍差の両方を捉えるために、エンティティ間の類似性を推定する。
まず、新しいグラフサンプリング法を用いて、各エンティティの識別的近傍を蒸留する。
その後、クロスグラフの近傍マッチングモジュールを採用し、与えられたエンティティペアの近傍差を共同で符号化する。
論文 参考訳(メタデータ) (2020-05-12T08:26:15Z) - Graph Inference Learning for Semi-supervised Classification [50.55765399527556]
半教師付きノード分類の性能を高めるためのグラフ推論学習フレームワークを提案する。
推論過程の学習には,トレーニングノードから検証ノードへの構造関係のメタ最適化を導入する。
4つのベンチマークデータセットの総合的な評価は、最先端の手法と比較して提案したGILの優位性を示している。
論文 参考訳(メタデータ) (2020-01-17T02:52:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。