論文の概要: Named entity recognition architecture combining contextual and global
features
- arxiv url: http://arxiv.org/abs/2112.08033v1
- Date: Wed, 15 Dec 2021 10:54:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-16 14:48:05.617261
- Title: Named entity recognition architecture combining contextual and global
features
- Title(参考訳): コンテキスト特徴とグローバル特徴を組み合わせた名前付きエンティティ認識アーキテクチャ
- Authors: Tran Thi Hong Hanh, Antoine Doucet, Nicolas Sidere, Jose G. Moreno,
and Senja Pollak
- Abstract要約: 名前付きエンティティ認識(NER)は、名前付きエンティティの特定と分類を目的とした情報抽出技術である。
我々は,XLNet のコンテキスト特徴と Graph Convolution Network (GCN) のグローバル特徴を組み合わせた NER の性能向上を提案する。
- 参考スコア(独自算出の注目度): 5.92351086183376
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Named entity recognition (NER) is an information extraction technique that
aims to locate and classify named entities (e.g., organizations, locations,...)
within a document into predefined categories. Correctly identifying these
phrases plays a significant role in simplifying information access. However, it
remains a difficult task because named entities (NEs) have multiple forms and
they are context-dependent. While the context can be represented by contextual
features, global relations are often misrepresented by those models. In this
paper, we propose the combination of contextual features from XLNet and global
features from Graph Convolution Network (GCN) to enhance NER performance.
Experiments over a widely-used dataset, CoNLL 2003, show the benefits of our
strategy, with results competitive with the state of the art (SOTA).
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、文書内の名前付きエンティティ(組織、場所、...)を事前に定義されたカテゴリに分類することを目的とした、情報抽出技術である。
これらのフレーズを正しく識別することは、情報アクセスを単純化する上で重要な役割を果たす。
しかし、名前付きエンティティ(nes)は複数のフォームを持ち、コンテキスト依存であるため、依然として難しい作業である。
文脈は文脈の特徴によって表されるが、グローバルな関係はしばしばそれらのモデルによって誤解される。
本稿では,XLNet のコンテキスト特徴と Graph Convolution Network (GCN) のグローバル特徴を組み合わせた NER の性能向上を提案する。
広く使われているデータセットであるCoNLL 2003の実験は、私たちの戦略の利点を示し、その結果は最先端技術(SOTA)と競合する。
関連論文リスト
- Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - DocTr: Document Transformer for Structured Information Extraction in
Documents [36.1145541816468]
本稿では、視覚的にリッチな文書から構造化情報を取り出すための新しい定式化について述べる。
既存のIOBタグやグラフベースの定式化の制限に対処することを目的としている。
我々は、エンティティをアンカーワードとバウンディングボックスとして表現し、エンティティリンクをアンカーワードの関連付けとして表現する。
論文 参考訳(メタデータ) (2023-07-16T02:59:30Z) - The Role of Global and Local Context in Named Entity Recognition [3.1638713158723686]
本稿では,グローバルな文書コンテキストの影響と,その地域コンテキストとの関係について考察する。
グローバルな文書コンテキストを正しく取得することは、ローカルなコンテキストのみを活用することよりも、パフォーマンスに大きな影響を与える。
論文 参考訳(メタデータ) (2023-05-04T20:22:18Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Dynamic Named Entity Recognition [5.9401550252715865]
動的名前付きエンティティ認識(DNER)という新しいタスクを紹介します。
DNERは、コンテキストを利用してエンティティを抽出するアルゴリズムの能力を評価するためのフレームワークを提供する。
本稿では,本課題に関連する課題と研究軸を反映したベースラインモデルと実験結果について述べる。
論文 参考訳(メタデータ) (2023-02-16T15:50:02Z) - The Fellowship of the Authors: Disambiguating Names from Social Network
Context [2.3605348648054454]
各エンティティに関する広範なテキスト記述を持つオーソリティリストは、欠落しており、曖昧な名前のエンティティである。
BERTをベースとした参照表現と,さまざまなグラフ誘導戦略を組み合わせて,教師付きクラスタ推論手法と教師なしクラスタ推論手法を実験する。
ドメイン内言語モデルの事前学習は,特により大きなコーパスに対して,参照表現を大幅に改善できることがわかった。
論文 参考訳(メタデータ) (2022-08-31T21:51:55Z) - TeKo: Text-Rich Graph Neural Networks with External Knowledge [75.91477450060808]
外部知識を用いた新しいテキストリッチグラフニューラルネットワーク(TeKo)を提案する。
まず、高品質なエンティティを組み込んだフレキシブルな異種セマンティックネットワークを提案する。
次に、構造化三重項と非構造化実体記述という2種類の外部知識を導入する。
論文 参考訳(メタデータ) (2022-06-15T02:33:10Z) - Global Attention for Name Tagging [56.62059996864408]
ローカル、文書レベル、コーパスレベルのコンテキスト情報を活用することで、名前タグを改善するための新しいフレームワークを提案する。
本研究では,グローバルな注意を介し,文書レベルのコンテキスト情報とコーパスレベルのコンテキスト情報と,局所的なコンテキスト情報とを組み込むことを学習するモデルを提案する。
ベンチマークデータセットの実験は、我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-10-19T07:27:15Z) - Global-to-Local Neural Networks for Document-Level Relation Extraction [11.900280120655898]
関係抽出(RE)は、テキスト内の名前付きエンティティ間の意味的関係を特定することを目的としている。
近年、文書のレベルに引き上げられるのを目撃しており、エンティティとの複雑な推論とドキュメント全体への言及が必要である。
本稿では,文書情報を大域的・局所的表現と文脈関係表現の両面から符号化することで,文書レベルのREに新たなモデルを提案する。
論文 参考訳(メタデータ) (2020-09-22T07:30:19Z) - Universal-RCNN: Universal Object Detector via Transferable Graph R-CNN [117.80737222754306]
我々はUniversal-RCNNと呼ばれる新しいユニバーサルオブジェクト検出器を提案する。
まず、すべてのカテゴリの高レベルなセマンティック表現を統合することで、グローバルなセマンティックプールを生成する。
ドメイン内推論モジュールは、空間認識GCNによってガイドされる1つのデータセット内のスパースグラフ表現を学習し、伝播する。
論文 参考訳(メタデータ) (2020-02-18T07:57:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。