論文の概要: SEE-Few: Seed, Expand and Entail for Few-shot Named Entity Recognition
- arxiv url: http://arxiv.org/abs/2210.05632v1
- Date: Tue, 11 Oct 2022 17:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 15:54:18.452671
- Title: SEE-Few: Seed, Expand and Entail for Few-shot Named Entity Recognition
- Title(参考訳): SEE-Few: 名前付きエンティティ認識のためのシード、拡張、詳細
- Authors: Zeng Yang and Linhai Zhang and Deyu Zhou
- Abstract要約: 名前付きエンティティ認識(NER)は、わずかにラベル付きインスタンスに基づいて名前付きエンティティを識別することを目的としている。
そこで本研究では,Few-shot NERのためのマルチタスク学習フレームワークであるSEE-Fewを提案する。
4つのベンチマークデータセットによる実験結果から,提案手法は最先端のNER法よりも大きなマージンを有することがわかった。
- 参考スコア(独自算出の注目度): 17.344816459055835
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot named entity recognition (NER) aims at identifying named entities
based on only few labeled instances. Current few-shot NER methods focus on
leveraging existing datasets in the rich-resource domains which might fail in a
training-from-scratch setting where no source-domain data is used. To tackle
training-from-scratch setting, it is crucial to make full use of the annotation
information (the boundaries and entity types). Therefore, in this paper, we
propose a novel multi-task (Seed, Expand and Entail) learning framework,
SEE-Few, for Few-shot NER without using source domain data. The seeding and
expanding modules are responsible for providing as accurate candidate spans as
possible for the entailing module. The entailing module reformulates span
classification as a textual entailment task, leveraging both the contextual
clues and entity type information. All the three modules share the same text
encoder and are jointly learned. Experimental results on four benchmark
datasets under the training-from-scratch setting show that the proposed method
outperformed state-of-the-art few-shot NER methods with a large margin. Our
code is available at \url{https://github.com/unveiled-the-red-hat/SEE-Few}.
- Abstract(参考訳): 名前付きエンティティ認識(NER)は、わずかにラベル付きインスタンスに基づいて名前付きエンティティを識別することを目的としている。
現在の少数のnerメソッドでは、リッチリソースドメインの既存のデータセットを活用することに重点を置いている。
scratch設定からのトレーニングに取り組むためには,アノテーション情報(バウンダリとエンティティタイプ)を最大限に活用することが不可欠である。
そこで、本稿では、ソースドメインデータを用いずに、マイナのための新しいマルチタスク学習フレームワークsee-fewを提案する。
シードおよび拡張モジュールは、entailingモジュールに対して可能な限り正確な候補スパンを提供する責任がある。
entailingモジュールは、コンテキストヒントとエンティティタイプ情報の両方を活用することで、テキストのentailmentタスクとしてスパン分類を再構成する。
3つのモジュールは同じテキストエンコーダを共有し、共同で学習される。
Scratch設定下での4つのベンチマークデータセットの実験結果から,提案手法は最先端数ショットNER法よりも高いマージンを示した。
私たちのコードは \url{https://github.com/unveiled-the-red-hat/SEE-Few} で利用可能です。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - Advancing Grounded Multimodal Named Entity Recognition via LLM-Based Reformulation and Box-Based Segmentation [46.9782192992495]
Grounded Multimodal Named Entity Recognition (GMNER) タスクは、名前付きエンティティ、エンティティタイプ、および対応する視覚領域を識別することを目的としている。
我々は,大規模な言語モデルを活用することで,GMNERをMNER-VE-VGタスクに再構成する統一フレームワークであるRiVEGを提案する。
論文 参考訳(メタデータ) (2024-06-11T13:52:29Z) - Hybrid Multi-stage Decoding for Few-shot NER with Entity-aware Contrastive Learning [32.62763647036567]
名前付きエンティティ認識は、ラベル付けされたいくつかの例に基づいて、新しいタイプの名前付きエンティティを識別できる。
MsFNER(Entity-Aware Contrastive Learning)を用いたFew-shot NERのためのハイブリッド多段復号法を提案する。
MsFNERは一般的なNERを、エンティティスパン検出とエンティティ分類の2つのステージに分割する。
論文 参考訳(メタデータ) (2024-04-10T12:31:09Z) - Named Entity Recognition via Machine Reading Comprehension: A Multi-Task
Learning Approach [50.12455129619845]
Named Entity Recognition (NER) は、テキスト内のエンティティの参照を事前に定義された型に抽出し、分類することを目的としている。
我々は,MRCベースのNERを改善するために,エンティティタイプ間のラベル依存性をマルチタスク学習フレームワークに組み込むことを提案する。
論文 参考訳(メタデータ) (2023-09-20T03:15:05Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - MNER-QG: An End-to-End MRC framework for Multimodal Named Entity
Recognition with Query Grounding [21.49274082010887]
MNER(Multimodal Name entity recognition)は、情報抽出における重要なステップである。
本稿では,MNER-QG という新しいエンドツーエンドフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-27T06:10:03Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Multi-Modal Cross-Domain Alignment Network for Video Moment Retrieval [55.122020263319634]
ビデオモーメント検索(VMR)は、与えられた言語クエリに従って、未編集のビデオからターゲットモーメントをローカライズすることを目的としている。
本稿では、新しいタスクであるクロスドメインVMRに焦点を当て、完全なアノテーション付きデータセットをひとつのドメインで利用できるが、関心のあるドメインは、注釈なしのデータセットのみを含む。
本稿では、アノテーションの知識をソースドメインからターゲットドメインに転送するマルチモーダル・クロスドメインアライメント・ネットワークを提案する。
論文 参考訳(メタデータ) (2022-09-23T12:58:20Z) - Deep Indexed Active Learning for Matching Heterogeneous Entity
Representations [20.15233789156307]
本稿では,ブロッキングのリコールとブロックペアのマッチング精度を最大化するために,組込みを共同で学習するスケーラブルなアクティブラーニング手法であるdiardを提案する。
5つのベンチマークデータセットと多言語レコードマッチングデータセットの実験は、精度、リコール、実行時間の観点から、我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2021-04-08T18:00:19Z) - Zero-Resource Cross-Domain Named Entity Recognition [68.83177074227598]
既存のドメイン名付きエンティティ認識モデルは、多くのラベルなしコーパスや、ターゲットドメイン内のラベル付きNERトレーニングデータに依存している。
外部リソースを一切使用しないドメイン間NERモデルを提案する。
論文 参考訳(メタデータ) (2020-02-14T09:04:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。