論文の概要: Robust Candidate Generation for Entity Linking on Short Social Media
Texts
- arxiv url: http://arxiv.org/abs/2210.07472v1
- Date: Fri, 14 Oct 2022 02:47:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 14:47:53.917016
- Title: Robust Candidate Generation for Entity Linking on Short Social Media
Texts
- Title(参考訳): 短文ソーシャルメディアにおけるエンティティリンクのためのロバスト候補生成
- Authors: Liam Hebert and Raheleh Makki and Shubhanshu Mishra and Hamidreza
Saghir and Anusha Kamath and Yuval Merhav
- Abstract要約: つぶやきの分野では、ユーザーがしばしば非公式な綴りや文脈の制限、特異性の欠如に悩まされることが示される。
我々はウィキペディアの長期的文脈表現を用いたハイブリッドなソリューションを実証し、0.93リコールを達成した。
- 参考スコア(独自算出の注目度): 1.5006258585503875
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Entity Linking (EL) is the gateway into Knowledge Bases. Recent advances in
EL utilize dense retrieval approaches for Candidate Generation, which addresses
some of the shortcomings of the Lookup based approach of matching NER mentions
against pre-computed dictionaries. In this work, we show that in the domain of
Tweets, such methods suffer as users often include informal spelling, limited
context, and lack of specificity, among other issues. We investigate these
challenges on a large and recent Tweets benchmark for EL, empirically evaluate
lookup and dense retrieval approaches, and demonstrate a hybrid solution using
long contextual representation from Wikipedia is necessary to achieve
considerable gains over previous work, achieving 0.93 recall.
- Abstract(参考訳): エンティティリンク(EL)は知識ベースへのゲートウェイである。
ELの最近の進歩は、事前計算辞書に対するNERマッチングのルックアップに基づくアプローチの欠点に対処する、候補生成のための密度の高い検索アプローチを利用している。
本研究では,つぶやきの分野では,ユーザが非公式な綴りや文脈の制限,特異性の欠如といった問題に悩まされることが少なくないことを示す。
ELの大規模かつ最近のつぶやきベンチマークにおけるこれらの課題について検討し、検索手法のルックアップと高密度化を実証的に評価し、ウィキペディアからの長期的文脈表現を用いたハイブリッドソリューションが従来の作業よりも大幅に向上し、0.93リコールを達成したことを示す。
関連論文リスト
- ACE: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
我々は、エンドツーエンドのクロスモーダル検索のための先駆的なジェネリッククロスモーダル rEtrieval framework (ACE) を提案する。
ACEは、クロスモーダル検索における最先端のパフォーマンスを達成し、Recall@1の強いベースラインを平均15.27%上回る。
論文 参考訳(メタデータ) (2024-06-25T12:47:04Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - Lexically-Accelerated Dense Retrieval [29.327878974130055]
LADR (Lexically-Accelerated Dense Retrieval) は, 既存の高密度検索モデルの効率を向上する, 簡便な手法である。
LADRは、標準ベンチマークでの徹底的な検索と同等の精度とリコールの両方を一貫して達成する。
論文 参考訳(メタデータ) (2023-07-31T15:44:26Z) - Integrity and Junkiness Failure Handling for Embedding-based Retrieval:
A Case Study in Social Network Search [26.705196461992845]
埋め込みベースの検索は、eコマースやソーシャルネットワーク検索など、さまざまな検索アプリケーションで使われている。
本稿では,2021年初頭に開始された埋め込み型検索をソーシャルネットワーク検索エンジン上で解析する。
私たちは、それによってもたらされた失敗の2つの主要なカテゴリ、完全性とジャンク性を定義します。
論文 参考訳(メタデータ) (2023-04-18T20:53:47Z) - A Coarse-to-Fine Place Recognition Approach using Attention-guided Descriptors and Overlap Estimation [13.018093610656507]
位置認識のための新しい粗大なアプローチを提案する。
粗い段階では、注意誘導ネットワークを用いて注意誘導記述子を生成する。
次に、素早い親和性に基づく候補選択プロセスを用いて、Top-Kの最も類似した候補を特定する。
細かな段階では、狭められた場所候補同士のペアの重複を推定し、最終一致を決定する。
論文 参考訳(メタデータ) (2023-03-13T05:56:36Z) - Query Expansion Using Contextual Clue Sampling with Language Models [69.51976926838232]
本稿では,実効的なフィルタリング戦略と検索した文書の融合の組み合わせを,各文脈の生成確率に基づいて提案する。
我々の語彙マッチングに基づくアプローチは、よく確立された高密度検索モデルDPRと比較して、同様のトップ5/トップ20検索精度と上位100検索精度を実現する。
エンド・ツー・エンドのQAでは、読者モデルも我々の手法の恩恵を受けており、いくつかの競争基準に対してエクサクト・マッチのスコアが最も高い。
論文 参考訳(メタデータ) (2022-10-13T15:18:04Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - Improving Contextual Recognition of Rare Words with an Alternate
Spelling Prediction Model [0.0]
Earnings21データセットに付随するコンテキストバイアスリストをリリースします。
2つの異なる復号アルゴリズムに適用した浅層融合文脈偏差の計算結果を示す。
稀な単語のリコールを34.7%改善するスペル予測モデルを提案する。
論文 参考訳(メタデータ) (2022-09-02T19:30:16Z) - Improving Candidate Retrieval with Entity Profile Generation for
Wikidata Entity Linking [76.00737707718795]
本稿では,エンティティ・プロファイリングに基づく新しい候補探索パラダイムを提案する。
我々は、このプロファイルを使用してインデックス付き検索エンジンに問い合わせ、候補エンティティを検索する。
本手法は,ウィキペディアのアンカーテキスト辞書を用いた従来の手法を補完するものである。
論文 参考訳(メタデータ) (2022-02-27T17:38:53Z) - Phrase Retrieval Learns Passage Retrieval, Too [77.57208968326422]
文節検索が,文節や文書を含む粗いレベルの検索の基盤となるかを検討する。
句検索システムでは,句検索の精度が向上し,句検索の精度が向上していることを示す。
また,句のフィルタリングやベクトル量子化により,インデックスのサイズを4~10倍に削減できることを示す。
論文 参考訳(メタデータ) (2021-09-16T17:42:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。