論文の概要: Discontinuous Named Entity Recognition as Maximal Clique Discovery
- arxiv url: http://arxiv.org/abs/2106.00218v1
- Date: Tue, 1 Jun 2021 04:13:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-03 02:41:11.351443
- Title: Discontinuous Named Entity Recognition as Maximal Clique Discovery
- Title(参考訳): 最大傾き発見としての不連続名前付きエンティティ認識
- Authors: Yucheng Wang, Bowen Yu, Hongsong Zhu, Tingwen Liu, Nan Yu and Limin
Sun
- Abstract要約: 名前付きエンティティ認識(NER)は、エンティティの言及が不連続である場合、依然として困難である。
文ごとにセグメントグラフを構築し、各ノードがセグメントを表し、エッジが同一のエンティティに属する2つのノードをリンクする。
提案手法は,F1よりも最大3.5ポイント向上し,SOTAモデルよりも5倍の高速化を実現した。
- 参考スコア(独自算出の注目度): 13.492040101423145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity recognition (NER) remains challenging when entity mentions can
be discontinuous. Existing methods break the recognition process into several
sequential steps. In training, they predict conditioned on the golden
intermediate results, while at inference relying on the model output of the
previous steps, which introduces exposure bias. To solve this problem, we first
construct a segment graph for each sentence, in which each node denotes a
segment (a continuous entity on its own, or a part of discontinuous entities),
and an edge links two nodes that belong to the same entity. The nodes and edges
can be generated respectively in one stage with a grid tagging scheme and
learned jointly using a novel architecture named Mac. Then discontinuous NER
can be reformulated as a non-parametric process of discovering maximal cliques
in the graph and concatenating the spans in each clique. Experiments on three
benchmarks show that our method outperforms the state-of-the-art (SOTA)
results, with up to 3.5 percentage points improvement on F1, and achieves 5x
speedup over the SOTA model.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、エンティティの言及が不連続である場合、依然として困難である。
既存の方法は、認識プロセスをいくつかの逐次ステップに分割する。
トレーニングにおいて、彼らは、前のステップのモデル出力に依存する推論を行いながら、黄金の中間結果を条件付きで予測する。
この問題を解決するために、まず各文のセグメントグラフを構築し、各ノードがセグメント(自身上の連続エンティティ、または不連続エンティティの一部)を表現し、エッジが同一エンティティに属する2つのノードをリンクする。
ノードとエッジはそれぞれ1つのステージでグリッドタグ方式で生成でき、macという新しいアーキテクチャを使って共同で学習することができる。
すると、不連続な NER はグラフ内の最大傾きを発見し、各傾きのスパンを連結する非パラメトリックな過程として再構成することができる。
3つのベンチマーク実験により,本手法はf1において最大3.5ポイント向上し,somaモデルよりも5倍の高速化を達成した。
関連論文リスト
- Ensemble Quadratic Assignment Network for Graph Matching [52.20001802006391]
グラフマッチングはコンピュータビジョンやパターン認識において一般的に用いられる技法である。
最近のデータ駆動型アプローチは、グラフマッチングの精度を著しく改善した。
データ駆動手法と従来の手法の利点を組み合わせたグラフニューラルネットワーク(GNN)に基づくアプローチを提案する。
論文 参考訳(メタデータ) (2024-03-11T06:34:05Z) - S2F-NER: Exploring Sequence-to-Forest Generation for Complex Entity
Recognition [47.714230389689064]
本研究では、フォレストデコーダを介して文中のエンティティを直接抽出できる新しいシーケンス・ツー・フォレスト生成パラダイムS2F-NERを提案する。
具体的には,各樹木の最大深度が3である森林において,各樹木の各経路を自己回帰的に生成する。
このパラダイムに基づいて、我々のモデルは露出バイアス問題をエレガントに緩和し、Seq2Seqの単純さを維持することができる。
論文 参考訳(メタデータ) (2023-10-29T09:09:10Z) - Unified and Dynamic Graph for Temporal Character Grouping in Long Videos [31.192044026127032]
ビデオ時間的キャラクタグループ化は、ビデオ内の主要なキャラクタの出現モーメントを、そのアイデンティティに応じて特定する。
最近の研究は、教師なしクラスタリングからグラフベースのクラスタリングへと進化してきた。
時間的文字グループ化のための統一動的グラフ(UniDG)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-08-27T13:22:55Z) - SpanProto: A Two-stage Span-based Prototypical Network for Few-shot
Named Entity Recognition [45.012327072558975]
名前付きエンティティ認識(NER)は、アノテーション付きデータが少ない名前付きエンティティを識別することを目的としている。
そこで本研究では,2段階のアプローチを用いて,数発のNERに対処するセミナルスパンベースプロトタイプネットワーク(SpanProto)を提案する。
スパン抽出の段階では、逐次タグを大域境界行列に変換し、モデルが明示的な境界情報に集中できるようにする。
分類に言及するために、原型学習を活用してラベル付きスパンのセマンティック表現をキャプチャし、新しいクラスエンティティへの適応性を向上する。
論文 参考訳(メタデータ) (2022-10-17T12:59:33Z) - PointInst3D: Segmenting 3D Instances by Points [136.7261709896713]
本稿では,ポイント単位の予測方式で機能する,完全畳み込み型3Dポイントクラウドインスタンスセグメンテーション手法を提案する。
その成功の鍵は、各サンプルポイントに適切なターゲットを割り当てることにある。
提案手法はScanNetとS3DISのベンチマークで有望な結果が得られる。
論文 参考訳(メタデータ) (2022-04-25T02:41:46Z) - Pack Together: Entity and Relation Extraction with Levitated Marker [61.232174424421025]
エンコーダにマーカを戦略的にパッケージ化することにより,スパン(ペア)間の依存関係を検討するために,Packed Levitated Markersという新しいスパン表現手法を提案する。
実験の結果,3つの平坦なNERタスクにおいて,有望なマーカーが充填されたモデルの方がシーケンスラベルモデルよりも0.4%-1.9%優れ,トークンコンキャットモデルを6つのNERベンチマークで上回っていることがわかった。
論文 参考訳(メタデータ) (2021-09-13T15:38:13Z) - A Span-Based Model for Joint Overlapped and Discontinuous Named Entity
Recognition [24.673897695262024]
重なり合いと不連続性の両方を共同で認識できる新しいスパンベースモデルを提案する。
複数のベンチマークデータセットの実験結果から,重なり合った不連続なNERに対して,我々のモデルは高い競争力を持つことが示された。
論文 参考訳(メタデータ) (2021-06-28T02:37:20Z) - Deep Affinity Net: Instance Segmentation via Affinity [48.498706304017674]
Deep Affinity Netは、グラフ分割アルゴリズムCascade-GAECを伴って、効果的なアフィニティベースのアプローチである。
すべてのアフィニティベースのモデルの中で、最高のシングルショット結果と最速のランニングタイムを達成する。
また、リージョンベースのMask R-CNNよりも優れています。
論文 参考訳(メタデータ) (2020-03-15T15:22:56Z) - Learning multiview 3D point cloud registration [74.39499501822682]
本稿では,エンドツーエンドで学習可能なマルチビュー3Dポイントクラウド登録アルゴリズムを提案する。
このアプローチは、エンドツーエンドのトレーニングが可能で、計算コストが小さく、最先端のマージンよりも優れています。
論文 参考訳(メタデータ) (2020-01-15T03:42:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。