論文の概要: Improving Few-shot and Zero-shot Entity Linking with Coarse-to-Fine
Lexicon-based Retriever
- arxiv url: http://arxiv.org/abs/2308.03365v2
- Date: Sun, 13 Aug 2023 07:02:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 18:31:58.904342
- Title: Improving Few-shot and Zero-shot Entity Linking with Coarse-to-Fine
Lexicon-based Retriever
- Title(参考訳): Coarse-to-Fine Lexicon-based RetrieverによるFew-shotおよびZero-shotエンティティリンクの改善
- Authors: Shijue Huang, Bingbing Wang, Libo Qin, Qin Zhao and Ruifeng Xu
- Abstract要約: 少数ショットとゼロショットのエンティティリンクは、テールと新興エンティティに重点を置いている。
本稿では,エンティティ候補を効果的に検索する粗大なレキシコンベースレトリバーを提案する。
NLPCC 2023では,中国のFew-shotとZero-shot Entity Linkingで第1位にランクインしている。
- 参考スコア(独自算出の注目度): 30.096395104683193
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot and zero-shot entity linking focus on the tail and emerging
entities, which are more challenging but closer to real-world scenarios. The
mainstream method is the ''retrieve and rerank'' two-stage framework. In this
paper, we propose a coarse-to-fine lexicon-based retriever to retrieve entity
candidates in an effective manner, which operates in two layers. The first
layer retrieves coarse-grained candidates by leveraging entity names, while the
second layer narrows down the search to fine-grained candidates within the
coarse-grained ones. In addition, this second layer utilizes entity
descriptions to effectively disambiguate tail or new entities that share names
with existing popular entities. Experimental results indicate that our approach
can obtain superior performance without requiring extensive finetuning in the
retrieval stage. Notably, our approach ranks the 1st in NLPCC 2023 Shared Task
6 on Chinese Few-shot and Zero-shot Entity Linking.
- Abstract(参考訳): 短いショットとゼロショットのエンティティリンクは、より難しいが現実のシナリオに近い、テールと新興エンティティに焦点を当てている。
主流の方法は'retrieve and rerank'の二段階フレームワークである。
本稿では,2つの層で機能するエンティティ候補を効果的に検索する,粗大なレキシコンベース検索手法を提案する。
第1の層はエンティティ名を利用して粗粒度候補を検索し、第2の層は粗粒度候補を絞り込む。
さらに、この第2層はエンティティ記述を利用して、既存の人気エンティティと名前を共有するテールまたは新しいエンティティを効果的に曖昧にします。
実験の結果,検索段階において広範囲な微調整を必要とせず,優れた性能を得ることができた。
特に,nlpcc 2023の共有タスク6では,中国のマイナショットとゼロショットのエンティティリンクで第1位にランク付けした。
関連論文リスト
- ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
我々は、エンドツーエンドのクロスモーダル検索のための先駆的なジェネリッククロスモーダル rEtrieval framework (ACE) を提案する。
ACEは、クロスモーダル検索における最先端のパフォーマンスを達成し、Recall@1の強いベースラインを平均15.27%上回る。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - NERetrieve: Dataset for Next Generation Named Entity Recognition and
Retrieval [49.827932299460514]
我々は、大きな言語モデルによって提供される能力は、NER研究の終わりではなく、むしろエキサイティングな始まりであると主張する。
我々は、NERタスクの3つの変種と、それらをサポートするデータセットを示す。
500のエンティティタイプをカバーする400万段落の,大規模で銀の注釈付きコーパスを提供する。
論文 参考訳(メタデータ) (2023-10-22T12:23:00Z) - Revisiting Sparse Retrieval for Few-shot Entity Linking [33.15662306409253]
本稿では,ELECTRAに基づくキーワード抽出手法を提案する。
抽出器のトレーニングには,参照コンテキストとエンティティ記述との間に重複するトークンをベースとしたトレーニングデータを自動的に生成する遠隔監視手法を提案する。
ZESHELデータセットによる実験結果から,提案手法はすべてのテスト領域において,最先端モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-10-19T03:51:10Z) - PSDiff: Diffusion Model for Person Search with Iterative and
Collaborative Refinement [59.6260680005195]
本稿では,拡散モデルであるPSDiffに基づく新しいPerson Searchフレームワークを提案する。
PSDiffは、ノイズの多いボックスとReID埋め込みから地上の真実へのデュアルデノケーションプロセスとして検索する人を定式化する。
新しいパラダイムに従って、我々は、反復的かつ協調的な方法で検出とReIDサブタスクを最適化する新しいコラボレーティブ・デノナイジング・レイヤ(CDL)を設計する。
論文 参考訳(メタデータ) (2023-09-20T08:16:39Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - DAMO-NLP at NLPCC-2022 Task 2: Knowledge Enhanced Robust NER for Speech
Entity Linking [32.915297772110364]
Speech Entity Linkingは、音声言語で名前付きエンティティを認識し、曖昧にすることを目的としている。
従来の方法では、未発の音声スタイルや、ASRシステムによって生成されるノイズの多い書き起こしに悩まされる。
本稿では,認知段階における適切な知識を無痛に取り入れることによる堅牢性向上に焦点を当てた知名強化エンティティ認識(KENER)を提案する。
NLPCC-2022共有タスク2のトラック2におけるトラック1とトラック2の1位を達成した。
論文 参考訳(メタデータ) (2022-09-27T06:43:56Z) - UnifieR: A Unified Retriever for Large-Scale Retrieval [84.61239936314597]
大規模な検索は、クエリを与えられた巨大なコレクションから関連ドキュメントをリコールすることである。
事前学習型言語モデル(PLM)に基づく最近の検索手法は,高密度ベクターあるいはレキシコンに基づくパラダイムに大別することができる。
本論文では,高密度ベクトルとレキシコンに基づく検索を2つの表現能力を持つ1つのモデルで統合する学習フレームワークUnifieRを提案する。
論文 参考訳(メタデータ) (2022-05-23T11:01:59Z) - Nested Named Entity Recognition as Latent Lexicalized Constituency
Parsing [29.705133932275892]
最近(Fu et al, 2021)は、ネストされたNERに取り組むために、スパンベースの選挙区に適応している。
本研究では, より表現力のある構造, 語彙化された選挙区木を用いて, 成分がキーワードでアノテートされる。
我々はアイズナー・サッタのアルゴリズムを有効活用し,部分的辺縁化と推論を効率的に行う。
論文 参考訳(メタデータ) (2022-03-09T12:02:59Z) - Locate and Label: A Two-stage Identifier for Nested Named Entity
Recognition [9.809157050048375]
名前付きエンティティ認識のための2段階エンティティ識別子を提案する。
まず、シードスパンのフィルタリングと境界回帰によってスパン提案を生成し、エンティティの特定を行い、それに対応するカテゴリで境界調整スパン提案をラベル付けする。
本手法は,訓練中のエンティティの境界情報と部分マッチングスパンを効果的に活用する。
論文 参考訳(メタデータ) (2021-05-14T12:52:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。