論文の概要: Local Hypergraph-based Nested Named Entity Recognition as Query-based
Sequence Labeling
- arxiv url: http://arxiv.org/abs/2204.11467v1
- Date: Mon, 25 Apr 2022 06:56:49 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-26 14:26:09.916158
- Title: Local Hypergraph-based Nested Named Entity Recognition as Query-based
Sequence Labeling
- Title(参考訳): 局所ハイパーグラフに基づくNested Named Entity Recognitionをクエリベースのシーケンスラベルとして用いる
- Authors: Yukun Yan, Sen Song
- Abstract要約: ネストされた名前を持つエンティティを識別するための局所ハイパーグラフに基づく新しい手法を提案する。
提案手法は,スパンサンプリングの計算コストが高く,長いエンティティが失われるリスクを伴わない。
ACE 2004データセット上の新しい最先端F1スコアと、他のネストされたNERデータセットであるACE 2005、GENIA、KBP 2017の以前の最先端F1スコアを達成している。
- 参考スコア(独自算出の注目度): 5.134435281973136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There has been a growing academic interest in the recognition of nested named
entities in many domains. We tackle the task with a novel local
hypergraph-based method: We first propose start token candidates and generate
corresponding queries with their surrounding context, then use a query-based
sequence labeling module to form a local hypergraph for each candidate. An end
token estimator is used to correct the hypergraphs and get the final
predictions. Compared to span-based approaches, our method is free of the high
computation cost of span sampling and the risk of losing long entities.
Sequential prediction makes it easier to leverage information in word order
inside nested structures, and richer representations are built with a local
hypergraph. Experiments show that our proposed method outperforms all the
previous hypergraph-based and sequence labeling approaches with large margins
on all four nested datasets. It achieves a new state-of-the-art F1 score on the
ACE 2004 dataset and competitive F1 scores with previous state-of-the-art
methods on three other nested NER datasets: ACE 2005, GENIA, and KBP 2017.
- Abstract(参考訳): 多くのドメインにおいてネストされた名前のエンティティの認識に対する学術的な関心が高まっている。
まず最初にスタートトークン候補を提案し,その周囲のコンテキストで対応するクエリを生成し,クエリベースのシーケンスラベリングモジュールを使用して各候補のローカルハイパーグラフを作成する。
エンドトークン推定器はハイパーグラフの修正と最終予測に使用される。
提案手法はスパンベース手法と比較して,スパンサンプリングの計算コストが高く,長いエンティティが失われる危険性がない。
逐次予測により、入れ子構造内の単語順の情報の利用が容易になり、よりリッチな表現は局所ハイパーグラフで構築される。
実験により,提案手法は,従来のハイパーグラフベースおよびシーケンスラベリング手法を,ネストした4つのデータセットに対して大きなマージンで上回ることを示した。
ACE 2004データセット上の新しい最先端F1スコアと、他のネストされたNERデータセットであるACE 2005、GENIA、KBP 2017の以前の最先端F1スコアを達成している。
関連論文リスト
- From Hypergraph Energy Functions to Hypergraph Neural Networks [94.88564151540459]
パラメータ化されたハイパーグラフ正規化エネルギー関数の表現型族を示す。
次に、これらのエネルギーの最小化がノード埋め込みとして効果的に機能することを実証する。
提案した双レベルハイパーグラフ最適化と既存のGNNアーキテクチャを共通的に用いている。
論文 参考訳(メタデータ) (2023-06-16T04:40:59Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Autoregressive Search Engines: Generating Substrings as Document
Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。
これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。
本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文 参考訳(メタデータ) (2022-04-22T10:45:01Z) - Progressive End-to-End Object Detection in Crowded Scenes [96.92416613336096]
以前のクエリベースの検出器は2つの欠点に悩まされていた: まず、複数の予測が1つのオブジェクトに対して推論される。
具体的には、まず受理されたクエリを選択して正の予測を生成し、その後、受理された予測に従って残雑音のあるクエリを精査する。
提案手法は,混み合ったシーンにおける問合せ型検出器の性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-03-15T06:12:00Z) - Reinforcement Learning Based Query Vertex Ordering Model for Subgraph
Matching [58.39970828272366]
グラフマッチングアルゴリズムは、クエリグラフの埋め込みをデータグラフGに列挙する。
マッチング順序は、これらのバックトラックに基づくサブグラフマッチングアルゴリズムの時間効率において重要な役割を果たす。
本稿では,Reinforcement Learning (RL) と Graph Neural Networks (GNN) 技術を適用して,グラフマッチングアルゴリズムの高品質なマッチング順序を生成する。
論文 参考訳(メタデータ) (2022-01-25T00:10:03Z) - Bottom-Up Constituency Parsing and Nested Named Entity Recognition with
Pointer Networks [24.337440797369702]
NER(Constituency parsing and nested named entity recognition)は、典型的なテクスチャ付き構造化予測タスクである。
本稿では,解析に線形ステップを必要とする,ポインタネットワークを用いたボトムアップ解析のための新しいグローバルポインティング機構を提案する。
提案手法は,全 BERT モデル (96.01 F1 スコア) における PTB の最先端性能と,選挙区解析における CTB7 の競合性能を得る。
論文 参考訳(メタデータ) (2021-10-11T17:01:43Z) - Exploiting Global Contextual Information for Document-level Named Entity
Recognition [46.99922251839363]
我々は、GCDoc(Global Context enhanced Document-level NER)と呼ばれるモデルを提案する。
単語レベルでは、文書グラフは単語間のより広範な依存関係をモデル化するために構築される。
文レベルでは、単一文を超えてより広い文脈を適切にモデル化するために、横断文モジュールを用いる。
我々のモデルは、CoNLL 2003データセットで92.22(BERTで93.40)、Ontonotes 5.0データセットで88.32(BERTで90.49)のスコアに達した。
論文 参考訳(メタデータ) (2021-06-02T01:52:07Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - Community detection, pattern recognition, and hypergraph-based learning:
approaches using metric geometry and persistent homology [1.3477333339913569]
我々は,通常の距離空間構造に類似した新しいトポロジ構造をハイパーグラフデータに導入する。
ハイパーグラフデータの新しいトポロジ的空間構造を用いて,コミュニティ検出問題を研究するためのいくつかのアプローチを提案する。
次に,提案手法を用いて構築したハイプグラフデータにおける符号予測問題について検討する。
論文 参考訳(メタデータ) (2020-09-29T21:20:12Z) - Hypergraph Random Walks, Laplacians, and Clustering [9.488853155989615]
最近提案されたランダムウォークに基づくハイパーグラフ構造化データのクラスタリングのためのフレキシブルなフレームワークを提案する。
提案手法は,高品質なクラスタを創出し,今後の作業への道のりを強調して結論付ける。
論文 参考訳(メタデータ) (2020-06-29T20:58:15Z) - Minimizing Localized Ratio Cut Objectives in Hypergraphs [32.80813008862995]
局所化率削減目標の最小化に基づく局所的ハイパーグラフクラスタリングのためのフレームワークを提案する。
我々のアルゴリズムは強局所的であり、その実行は入力セットのサイズにのみ依存し、優れたローカルクラスタを見つけるためにハイパーグラフ全体を探索する必要はない。
論文 参考訳(メタデータ) (2020-02-21T17:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。