論文の概要: Nested Named Entity Recognition with Partially-Observed TreeCRFs
- arxiv url: http://arxiv.org/abs/2012.08478v1
- Date: Tue, 15 Dec 2020 18:20:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 09:54:06.474460
- Title: Nested Named Entity Recognition with Partially-Observed TreeCRFs
- Title(参考訳): 部分観測木CRFを用いたNested Named Entity Recognition
- Authors: Yao Fu, Chuanqi Tan, Mosha Chen, Songfang Huang, Fei Huang
- Abstract要約: ネストネストnerを,部分可観測木を用いた構成構文解析と捉え,部分可観測木crfでモデル化した。
提案手法はACE 2004, ACE 2005データセット上でのSOTA(State-of-the-art)F1スコアを達成し, GENIAデータセット上でのSOTAモデルに匹敵する性能を示す。
- 参考スコア(独自算出の注目度): 23.992944831013013
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity recognition (NER) is a well-studied task in natural language
processing. However, the widely-used sequence labeling framework is difficult
to detect entities with nested structures. In this work, we view nested NER as
constituency parsing with partially-observed trees and model it with
partially-observed TreeCRFs. Specifically, we view all labeled entity spans as
observed nodes in a constituency tree, and other spans as latent nodes. With
the TreeCRF we achieve a uniform way to jointly model the observed and the
latent nodes. To compute the probability of partial trees with partial
marginalization, we propose a variant of the Inside algorithm, the
\textsc{Masked Inside} algorithm, that supports different inference operations
for different nodes (evaluation for the observed, marginalization for the
latent, and rejection for nodes incompatible with the observed) with efficient
parallelized implementation, thus significantly speeding up training and
inference. Experiments show that our approach achieves the state-of-the-art
(SOTA) F1 scores on the ACE2004, ACE2005 dataset, and shows comparable
performance to SOTA models on the GENIA dataset. Our approach is implemented
at: \url{https://github.com/FranxYao/Partially-Observed-TreeCRFs}.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は自然言語処理においてよく研究されているタスクである。
しかし、広く使われているシーケンスラベリングフレームワークは、ネスト構造を持つエンティティを検出するのが難しい。
本研究では,nested nerを,部分観測木を用いた構成構文解析として捉え,部分観測木crfを用いてモデル化する。
具体的には、全てのラベル付きエンティティスパンを指数木内の観測ノードとして、その他のスパンを潜在ノードとして見る。
TreeCRFを使用することで、観測されたノードと潜伏ノードを共同でモデル化する均一な方法を実現する。
部分木の部分的辺縁化の確率を計算するために,異なるノードに対する異なる推論操作(観測値の評価,潜伏値の辺縁化,観測値と互換性のないノードの拒絶)を効率よく並列化することで,トレーニングと推論を著しく高速化する,Insideアルゴリズムの変種である‘textsc{Masked Inside} アルゴリズムを提案する。
実験の結果,本手法はace2004,ace2005データセットの最先端(sota)f1スコアを達成し,geniaデータセットのsomaモデルと同等の性能を示す。
当社のアプローチは、次のような形で実装されています。
関連論文リスト
- Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Exploiting Neighbor Effect: Conv-Agnostic GNNs Framework for Graphs with
Heterophily [40.045308716159205]
グラフニューラルネットワーク(GNN)のヘテロフィリ問題を再検討し、クラス間隣人の特徴集約について検討する。
異種データセット上でのGNNの性能向上を図るために,Conv-Agnostic GNNs framework (CAGNNs)を提案する。
論文 参考訳(メタデータ) (2022-03-19T14:26:43Z) - Nested Named Entity Recognition as Latent Lexicalized Constituency
Parsing [29.705133932275892]
最近(Fu et al, 2021)は、ネストされたNERに取り組むために、スパンベースの選挙区に適応している。
本研究では, より表現力のある構造, 語彙化された選挙区木を用いて, 成分がキーワードでアノテートされる。
我々はアイズナー・サッタのアルゴリズムを有効活用し,部分的辺縁化と推論を効率的に行う。
論文 参考訳(メタデータ) (2022-03-09T12:02:59Z) - A Variational Edge Partition Model for Supervised Graph Representation
Learning [51.30365677476971]
本稿では,重なり合うノード群間の相互作用を集約することで,観測されたエッジがどのように生成されるかをモデル化するグラフ生成プロセスを提案する。
それぞれのエッジを複数のコミュニティ固有の重み付きエッジの和に分割し、コミュニティ固有のGNNを定義する。
エッジを異なるコミュニティに分割するGNNベースの推論ネットワーク,これらのコミュニティ固有のGNN,およびコミュニティ固有のGNNを最終分類タスクに組み合わせたGNNベースの予測器を共同で学習するために,変分推論フレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-07T14:37:50Z) - Explicit Pairwise Factorized Graph Neural Network for Semi-Supervised
Node Classification [59.06717774425588]
本稿では,グラフ全体を部分的に観測されたマルコフ確率場としてモデル化するEPFGNN(Explicit Pairwise Factorized Graph Neural Network)を提案する。
出力-出力関係をモデル化するための明示的なペアワイズ要素を含み、入力-出力関係をモデル化するためにGNNバックボーンを使用する。
本研究では,グラフ上での半教師付きノード分類の性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2021-07-27T19:47:53Z) - CoANE: Modeling Context Co-occurrence for Attributed Network Embedding [10.609715843964263]
分散ネットワーク埋め込み(ANE)とは、ネットワーク構造だけでなく、ノード属性も保存できるように、低次元ベクトルを学習することである。
我々は新しいANEモデルであるContext Co-occurrence-aware Attributed Network Embedding (CoANE)を提案する。
コンテキスト共起の学習は、各ノードの潜伏する社会円を捉えることができる。
論文 参考訳(メタデータ) (2021-06-17T04:31:02Z) - Robustifying Algorithms of Learning Latent Trees with Vector Variables [92.18777020401484]
Recursive Grouping (RG) と Chow-Liu Recursive Grouping (CLRG) のサンプル複雑性について述べる。
RG,CLRG,Neighbor Joining (NJ) およびSpectral NJ (SNJ) をトラッピングした内積を用いて強化する。
我々は、潜在木の構造学習において、最初の既知のインスタンス依存の不合理性の結果を導出する。
論文 参考訳(メタデータ) (2021-06-02T01:37:52Z) - Non-Recursive Graph Convolutional Networks [33.459371861932574]
非再帰グラフ畳み込みネットワーク(NRGCN)と呼ばれる新しいアーキテクチャを提案し、GCNのトレーニング効率と学習パフォーマンスの両方を改善します。
NRGCNは、内部層凝集と層非依存サンプリングに基づいて、各ノードの隣人のホップを表す。
このようにして、各ノードは、隣人の各ホップから独立して抽出された情報を連結することで直接表現することができる。
論文 参考訳(メタデータ) (2021-05-09T08:12:18Z) - Spectral Top-Down Recovery of Latent Tree Models [13.681975313065477]
スペクトルトップダウン・リカバリ (STDR) は、大きな潜在木モデルを推定するための分割・コンカレントアプローチである。
STDRの分割ステップは非ランダムです。
代わりに、観測されたノードに関連する適切なラプラシア行列のFiedlerベクトルに基づいている。
私達はSTDRが統計的に一貫性があることを証明し、高い確率で木を正確に回復するために必要なサンプルの数を縛ります。
論文 参考訳(メタデータ) (2021-02-26T02:47:42Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - Rethinking Learnable Tree Filter for Generic Feature Transform [71.77463476808585]
Learnable Tree Filterはセマンティックセグメンテーションのためのモデル構造保存関係に対する顕著なアプローチを示す。
幾何学的制約を緩和するために,マルコフ確率場として再構成して解析を行い,学習可能な不定項を導入する。
セマンティックセグメンテーションでは、ベルとホイッスルなしでCityscapesベンチマークでトップパフォーマンス(82.1% mIoU)を達成しています。
論文 参考訳(メタデータ) (2020-12-07T07:16:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。