論文の概要: Improving Zero-Shot Entity Retrieval through Effective Dense
Representations
- arxiv url: http://arxiv.org/abs/2103.04156v1
- Date: Sat, 6 Mar 2021 17:00:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-09 15:53:07.178091
- Title: Improving Zero-Shot Entity Retrieval through Effective Dense
Representations
- Title(参考訳): 効率的なディエンス表現によるゼロショットエンティティ検索の改善
- Authors: Eleni Partalidou, Despina Christou and Grigorios Tsoumakas
- Abstract要約: BERTベースのバイエンコーダにより、言及エンティティペアを密な空間に効率的に埋め込むシンプルなアプローチを提案します。
我々はZeshelデータセットの上位50候補で最新の84.28%の精度を達成し、トップ64の以前の82.06%と比較した。
- 参考スコア(独自算出の注目度): 2.4450328775940324
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Entity Linking (EL) seeks to align entity mentions in text to entries in a
knowledge-base and is usually comprised of two phases: candidate generation and
candidate ranking. While most methods focus on the latter, it is the candidate
generation phase that sets an upper bound to both time and accuracy performance
of the overall EL system. This work's contribution is a significant improvement
in candidate generation which thus raises the performance threshold for EL, by
generating candidates that include the gold entity in the least candidate set
(top-K). We propose a simple approach that efficiently embeds mention-entity
pairs in dense space through a BERT-based bi-encoder. Specifically, we extend
(Wu et al., 2020) by introducing a new pooling function and incorporating
entity type side-information. We achieve a new state-of-the-art 84.28% accuracy
on top-50 candidates on the Zeshel dataset, compared to the previous 82.06% on
the top-64 of (Wu et al., 2020). We report the results from extensive
experimentation using our proposed model on both seen and unseen entity
datasets. Our results suggest that our method could be a useful complement to
existing EL approaches.
- Abstract(参考訳): エンティティリンク(el)は、テキスト中のエンティティの言及を知識ベース内のエントリに関連付けることを目的としており、通常は候補生成と候補ランキングの2つのフェーズで構成される。
ほとんどの手法は後者に重点を置いているが、ELシステム全体の時間と精度の両方に上限を設定するのは候補生成フェーズである。
この作業の貢献は、最低候補セット(top-K)に金実体を含む候補を生成することにより、ELのパフォーマンスのしきい値を高める候補生成の大幅な改善である。
BERTベースのバイエンコーダにより、言及エンティティペアを密な空間に効率的に埋め込むシンプルなアプローチを提案します。
具体的には、新たなプーリング関数を導入し、エンティティタイプサイド情報を取り込むことで(wu等、2020年)拡張する。
我々は、Zeshelデータセットの上位50候補に対して、最新の84.28%の精度を、トップ64(Wu et al., 2020)の以前の82.06%と比較して達成した。
提案したモデルを用いた広範囲な実験結果について報告する。
その結果,本手法は既存のELアプローチの補完として有用であることが示唆された。
関連論文リスト
- Iterative Reasoning Preference Optimization [84.15992372132507]
生成したChain-of-Thought(CoT)候補間の嗜好を最適化するための反復的アプローチを開発する。
このスキームの繰り返し繰り返しにおける推論の改善を示す。
例えば、GSM8Kは55.6%から81.6%に大きく改善され、精度は88.7%となり、32のサンプルのうち多数が投票した。
論文 参考訳(メタデータ) (2024-04-30T17:28:05Z) - Entity Disambiguation via Fusion Entity Decoding [68.77265315142296]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。
GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文 参考訳(メタデータ) (2024-04-02T04:27:54Z) - A Read-and-Select Framework for Zero-shot Entity Linking [33.15662306409253]
本稿では、エンティティの曖昧さの主成分をモデル化し、リード・アンド・セレクト(ReS)フレームワークを提案する。
提案手法は,確立されたゼロショットエンティティリンクデータセットであるZESHELに対して,2.55%のマイクロ平均精度向上を実現している。
論文 参考訳(メタデータ) (2023-10-19T04:08:10Z) - Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting [65.00288634420812]
Pairwise Ranking Prompting (PRP)は、大規模言語モデル(LLM)の負担を大幅に軽減する手法である。
本研究は,中等級のオープンソースLCMを用いた標準ベンチマークにおいて,最先端のランク付け性能を達成した文献としては初めてである。
論文 参考訳(メタデータ) (2023-06-30T11:32:25Z) - Bi-level Alignment for Cross-Domain Crowd Counting [113.78303285148041]
現在の手法は、補助的なタスクを訓練したり、高価な粗大な見積もりを適用したりするための外部データに依存している。
そこで我々は, 簡易かつ効率的に適用可能な, 逆学習に基づく新しい手法を開発した。
実世界の5つのクラウドカウントベンチマークに対するアプローチを評価し、既存のアプローチを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-05-12T02:23:25Z) - Highly Parallel Autoregressive Entity Linking with Discriminative
Correction [51.947280241185]
自己回帰リンクを全ての潜在的な言及に対して並列化する,非常に効率的な手法を提案する。
我々のモデルは以前の生成法より70倍高速で精度が高い。
論文 参考訳(メタデータ) (2021-09-08T17:28:26Z) - Towards Consistent Document-level Entity Linking: Joint Models for
Entity Linking and Coreference Resolution [15.265013409559227]
文書レベルのエンティティリンク(EL)の課題について考察する。
我々は、コア参照解決(coref)とともにELタスクに参加することを提案する。
論文 参考訳(メタデータ) (2021-08-30T21:46:12Z) - Robustness Evaluation of Entity Disambiguation Using Prior Probes:the
Case of Entity Overshadowing [11.513083693564466]
我々はShadowLinkベンチマークにおいて,一般的なエンティティリンクシステムの性能を評価し,報告する。
その結果, 評価対象のELシステムにおいて, 共通エンティティの数と少ないエンティティの精度は, かなり異なることがわかった。
論文 参考訳(メタデータ) (2021-08-24T20:54:56Z) - Heuristic Semi-Supervised Learning for Graph Generation Inspired by
Electoral College [80.67842220664231]
本稿では,新たなノードやエッジを自動的に拡張して,高密度サブグラフ内のラベル類似性を向上する,新しい前処理手法であるElectoral College(ELCO)を提案する。
テストされたすべての設定において、我々の手法はベースモデルの平均スコアを4.7ポイントの広いマージンで引き上げるとともに、常に最先端のモデルよりも優れています。
論文 参考訳(メタデータ) (2020-06-10T14:48:48Z) - Entity Linking via Dual and Cross-Attention Encoders [16.23946458604865]
同一空間における参照やエンティティ表現を学習するデュアルエンコーダエンティティ検索システムを提案する。
次に、ターゲット参照と候補エンティティのそれぞれに対して、クロスアテンションエンコーダを使用してエンティティをリランクする。
TACKBP-2010データセットでは,92.05%の精度で最先端の結果が得られた。
論文 参考訳(メタデータ) (2020-04-07T17:28:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。