論文の概要: Type-supervised sequence labeling based on the heterogeneous star graph
for named entity recognition
- arxiv url: http://arxiv.org/abs/2210.10240v1
- Date: Wed, 19 Oct 2022 01:40:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 14:01:28.015421
- Title: Type-supervised sequence labeling based on the heterogeneous star graph
for named entity recognition
- Title(参考訳): 名前付きエンティティ認識のための異種星グラフに基づく型教師付きシーケンスラベリング
- Authors: Xueru Wen, Changjiang Zhou, Haotian Tang, Luguang Liang, Yu Jiang,
Hong Qi
- Abstract要約: 本稿では,テキストノードとタイプノードを含む異種星グラフの表現学習について述べる。
モデルは、グラフ内のノードを更新した後、タイプ管理シーケンスラベリングを実行する。
NERデータセットの公開実験により、フラットなエンティティとネストされたエンティティの両方を抽出する際のモデルの有効性が明らかとなった。
- 参考スコア(独自算出の注目度): 6.25916397918329
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition is a fundamental task in natural language
processing, identifying the span and category of entities in unstructured
texts. The traditional sequence labeling methodology ignores the nested
entities, i.e. entities included in other entity mentions. Many approaches
attempt to address this scenario, most of which rely on complex structures or
have high computation complexity. The representation learning of the
heterogeneous star graph containing text nodes and type nodes is investigated
in this paper. In addition, we revise the graph attention mechanism into a
hybrid form to address its unreasonableness in specific topologies. The model
performs the type-supervised sequence labeling after updating nodes in the
graph. The annotation scheme is an extension of the single-layer sequence
labeling and is able to cope with the vast majority of nested entities.
Extensive experiments on public NER datasets reveal the effectiveness of our
model in extracting both flat and nested entities. The method achieved
state-of-the-art performance on both flat and nested datasets. The significant
improvement in accuracy reflects the superiority of the multi-layer labeling
strategy.
- Abstract(参考訳): 名前付きエンティティ認識は、自然言語処理における基本的なタスクであり、非構造化テキストにおけるエンティティのスパンとカテゴリを識別する。
伝統的なシーケンスラベリング手法はネストされたエンティティ、すなわち他のエンティティの言及に含まれるエンティティを無視している。
多くのアプローチがこのシナリオに対処しようとするが、その多くは複雑な構造に依存しているか、計算の複雑さが高い。
本稿では,テキストノードと型ノードを含む異種星グラフの表現学習について検討する。
さらに,グラフアテンション機構をハイブリッド形式に改訂し,特定の位相におけるその不合理性に対処した。
モデルは、グラフ内のノードを更新した後、タイプ管理シーケンスラベリングを実行する。
アノテーションスキームは単一層シーケンスラベリングの拡張であり、ネストされたエンティティの大部分に対処することができる。
NERデータセットの大規模な実験により、フラットおよびネストされたエンティティを抽出する際のモデルの有効性が明らかとなった。
この手法はフラットデータセットとネストデータセットの両方で最先端のパフォーマンスを達成した。
精度の大幅な向上は、多層ラベリング戦略の優位性を反映している。
関連論文リスト
- Scribbles for All: Benchmarking Scribble Supervised Segmentation Across Datasets [51.74296438621836]
Scribbles for Allは、スクリブルラベルに基づいて訓練されたセマンティックセグメンテーションのためのラベルおよびトレーニングデータ生成アルゴリズムである。
弱い監督の源泉としてのスクリブルの主な制限は、スクリブルセグメンテーションのための挑戦的なデータセットの欠如である。
Scribbles for Allは、いくつかの人気のあるセグメンテーションデータセットのスクリブルラベルを提供し、密集したアノテーションを持つデータセットのスクリブルラベルを自動的に生成するアルゴリズムを提供する。
論文 参考訳(メタデータ) (2024-08-22T15:29:08Z) - Hypergraph based Understanding for Document Semantic Entity Recognition [65.84258776834524]
我々は,ハイパグラフアテンションを利用したハイパグラフアテンション文書セマンティックエンティティ認識フレームワークHGAを構築し,エンティティ境界とエンティティカテゴリを同時に重視する。
FUNSD, CORD, XFUNDIE で得られた結果は,本手法が意味的エンティティ認識タスクの性能を効果的に向上できることを示す。
論文 参考訳(メタデータ) (2024-07-09T14:35:49Z) - Multi-label Node Classification On Graph-Structured Data [7.892731722253387]
グラフニューラルネットワーク(GNN)では、グラフ上のノード分類タスクの最先端の改善が示されている。
それぞれのノードが複数のラベルを持つことができる、より一般的で現実的なシナリオは、これまでほとんど注目されなかった。
実世界の3つの生物データセットを収集・リリースし、マルチラベルグラフ生成器を開発する。
論文 参考訳(メタデータ) (2023-04-20T15:34:20Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - SpanProto: A Two-stage Span-based Prototypical Network for Few-shot
Named Entity Recognition [45.012327072558975]
名前付きエンティティ認識(NER)は、アノテーション付きデータが少ない名前付きエンティティを識別することを目的としている。
そこで本研究では,2段階のアプローチを用いて,数発のNERに対処するセミナルスパンベースプロトタイプネットワーク(SpanProto)を提案する。
スパン抽出の段階では、逐次タグを大域境界行列に変換し、モデルが明示的な境界情報に集中できるようにする。
分類に言及するために、原型学習を活用してラベル付きスパンのセマンティック表現をキャプチャし、新しいクラスエンティティへの適応性を向上する。
論文 参考訳(メタデータ) (2022-10-17T12:59:33Z) - Trigger-GNN: A Trigger-Based Graph Neural Network for Nested Named
Entity Recognition [5.9049664765234295]
ネストしたNERを利用するトリガーベースグラフニューラルネットワーク(Trigger-GNN)を提案する。
エンティティトリガーエンコーディングとセマンティックマッチングを通じて補完的なアノテーション埋め込みを得る。
モデルはより効率的に、費用対効果で学習し、一般化するのに役立ちます。
論文 参考訳(メタデータ) (2022-04-12T04:15:39Z) - Multi-task Self-distillation for Graph-based Semi-Supervised Learning [6.277952154365413]
本稿では,グラフ畳み込みネットワークに自己教師付き学習と自己蒸留を注入するマルチタスク自己蒸留フレームワークを提案する。
まず、プレテキストタスクに基づいて自己超越パイプラインを定式化し、グラフの異なるレベルの類似性をキャプチャする。
第二に、自己蒸留はモデル自体のソフトラベルを追加の監督として使用する。
論文 参考訳(メタデータ) (2021-12-02T12:43:41Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - Fine-Grained Named Entity Typing over Distantly Supervised Data Based on
Refined Representations [16.30478830298353]
Fine-Grained Named Entity Typing (FG-NET) は自然言語処理(NLP)の鍵となるコンポーネントである
本稿では,コーパスレベルの文脈的手がかりをエンド分類に先立ち,ノイズの多い参照表現を洗練させるエッジ重み付き注意グラフ畳み込みネットワークを提案する。
実験により,提案モデルではマクロf1とマイクロf1の相対スコアが10.2%,マクロf1が8.3%であった。
論文 参考訳(メタデータ) (2020-04-07T17:26:36Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - Graph Inference Learning for Semi-supervised Classification [50.55765399527556]
半教師付きノード分類の性能を高めるためのグラフ推論学習フレームワークを提案する。
推論過程の学習には,トレーニングノードから検証ノードへの構造関係のメタ最適化を導入する。
4つのベンチマークデータセットの総合的な評価は、最先端の手法と比較して提案したGILの優位性を示している。
論文 参考訳(メタデータ) (2020-01-17T02:52:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。