論文の概要: MProto: Multi-Prototype Network with Denoised Optimal Transport for
Distantly Supervised Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2310.08298v1
- Date: Thu, 12 Oct 2023 13:02:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 11:19:28.237184
- Title: MProto: Multi-Prototype Network with Denoised Optimal Transport for
Distantly Supervised Named Entity Recognition
- Title(参考訳): mproto:遠隔教師付き名前付きエンティティ認識のための分別最適トランスポートを持つマルチプロトタイプネットワーク
- Authors: Shuhui Wu, Yongliang Shen, Zeqi Tan, Wenqi Ren, Jietian Guo, Shiliang
Pu, Weiming Lu
- Abstract要約: 本稿では,DS-NERタスクのためのMProtoというノイズロスのプロトタイプネットワークを提案する。
MProtoは、各エンティティタイプを複数のプロトタイプで表現し、クラス内の分散を特徴付ける。
不完全なラベリングからノイズを緩和するために,新しい復号化最適輸送(DOT)アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 75.87566793111066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Distantly supervised named entity recognition (DS-NER) aims to locate entity
mentions and classify their types with only knowledge bases or gazetteers and
unlabeled corpus. However, distant annotations are noisy and degrade the
performance of NER models. In this paper, we propose a noise-robust prototype
network named MProto for the DS-NER task. Different from previous
prototype-based NER methods, MProto represents each entity type with multiple
prototypes to characterize the intra-class variance among entity
representations. To optimize the classifier, each token should be assigned an
appropriate ground-truth prototype and we consider such token-prototype
assignment as an optimal transport (OT) problem. Furthermore, to mitigate the
noise from incomplete labeling, we propose a novel denoised optimal transport
(DOT) algorithm. Specifically, we utilize the assignment result between Other
class tokens and all prototypes to distinguish unlabeled entity tokens from
true negatives. Experiments on several DS-NER benchmarks demonstrate that our
MProto achieves state-of-the-art performance. The source code is now available
on Github.
- Abstract(参考訳): Distantly superviseded entity recognition (DS-NER) は、知識ベースやガゼテア、ラベルなしコーパスのみを用いて、エンティティの参照を見つけ分類することを目的としている。
しかし、遠方のアノテーションは騒々しく、NERモデルの性能を劣化させる。
本稿では,DS-NERタスクのためのMProtoというノイズローバストプロトタイプネットワークを提案する。
従来のプロトタイプベースNER法とは異なり、MProtoは各エンティティタイプを複数のプロトタイプで表現し、エンティティ表現のクラス内分散を特徴付ける。
分類器を最適化するためには,各トークンに適切な接地木プロトタイプを割り当てるべきであり,これらのトークン-プロトタイプ割り当てを最適輸送(OT)問題とみなす。
さらに,不完全ラベリングのノイズを軽減するため,新しい離散化最適輸送(dot)アルゴリズムを提案する。
具体的には、他のクラストークンと全てのプロトタイプ間の代入結果を利用して、ラベルのないエンティティトークンを真の負と区別する。
いくつかのDS-NERベンチマークの実験により、我々のMProtoが最先端のパフォーマンスを達成することが示された。
ソースコードはGithubで公開されている。
関連論文リスト
- Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - Rethinking Person Re-identification from a Projection-on-Prototypes
Perspective [84.24742313520811]
検索タスクとしてのPerson Re-IDentification(Re-ID)は,過去10年間で大きな発展を遂げてきた。
本稿では,新しいベースライン ProNet を提案する。
4つのベンチマークの実験では、提案したProNetは単純だが有効であり、以前のベースラインを大きく上回っている。
論文 参考訳(メタデータ) (2023-08-21T13:38:10Z) - PromptNER: A Prompting Method for Few-shot Named Entity Recognition via
k Nearest Neighbor Search [56.81939214465558]
本稿では,近距離探索による数発NERの新規プロンプト法であるPromptNERを提案する。
我々は、エンティティカテゴリ情報を含むプロンプトを使用してラベルのプロトタイプを構築する。
Few-NERDデータセットとCrossNERデータセットの広範な実験により,本モデルが最先端手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2023-05-20T15:47:59Z) - A Prototypical Semantic Decoupling Method via Joint Contrastive Learning
for Few-Shot Name Entity Recognition [24.916377682689955]
名前付きエンティティ認識(NER)は、わずかにラベル付きインスタンスに基づいて名前付きエンティティを識別することを目的としている。
連立コントラスト学習(PSDC)を用いた数発NERのためのプロトタイプセマンティックデカップリング手法を提案する。
2つの数ショットのNERベンチマークによる実験結果から、PSDCは全体の性能において従来のSOTA法よりも一貫して優れていたことが示されている。
論文 参考訳(メタデータ) (2023-02-27T09:20:00Z) - SpanProto: A Two-stage Span-based Prototypical Network for Few-shot
Named Entity Recognition [45.012327072558975]
名前付きエンティティ認識(NER)は、アノテーション付きデータが少ない名前付きエンティティを識別することを目的としている。
そこで本研究では,2段階のアプローチを用いて,数発のNERに対処するセミナルスパンベースプロトタイプネットワーク(SpanProto)を提案する。
スパン抽出の段階では、逐次タグを大域境界行列に変換し、モデルが明示的な境界情報に集中できるようにする。
分類に言及するために、原型学習を活用してラベル付きスパンのセマンティック表現をキャプチャし、新しいクラスエンティティへの適応性を向上する。
論文 参考訳(メタデータ) (2022-10-17T12:59:33Z) - Optimizing Bi-Encoder for Named Entity Recognition via Contrastive
Learning [80.36076044023581]
名前付きエンティティ認識(NER)のための効率的なバイエンコーダフレームワークを提案する。
我々はNERを、エンティティ参照のベクトル表現とその型との類似性を最大化する計量学習問題とみなす。
NERのこのバイエンコーダの定式化における大きな課題は、エンティティの言及から非エンゲージスを分離することにある。
論文 参考訳(メタデータ) (2022-08-30T23:19:04Z) - Decomposed Meta-Learning for Few-Shot Named Entity Recognition [32.515795881027074]
NER (Few-shot named entity recognition) システムは、いくつかのラベル付き例に基づいて、新しい名前付きエンティティを認識することを目的としている。
本稿ではメタラーニングを用いた数発のスパン検出と数発のエンティティタイピングに取り組むメタラーニング手法を提案する。
論文 参考訳(メタデータ) (2022-04-12T12:46:23Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。