論文の概要: ReFinED: An Efficient Zero-shot-capable Approach to End-to-End Entity
Linking
- arxiv url: http://arxiv.org/abs/2207.04108v1
- Date: Fri, 8 Jul 2022 19:20:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-12 14:33:44.714368
- Title: ReFinED: An Efficient Zero-shot-capable Approach to End-to-End Entity
Linking
- Title(参考訳): ReFined: エンドツーエンドエンティティリンクに対する効率的なゼロショット対応アプローチ
- Authors: Tom Ayoola, Shubhi Tyagi, Joseph Fisher, Christos Christodoulopoulos,
Andrea Pierleoni
- Abstract要約: ReFinEDは効率的なエンドツーエンドのエンティティリンクモデルである。
単一のフォワードパスで、ドキュメント内のすべての参照に対して、参照検出、きめ細かいエンティティタイピング、エンティティの曖昧さを実行する。
標準エンティティリンクデータセットの最先端パフォーマンスを平均3.7 F1で上回る。
- 参考スコア(独自算出の注目度): 5.382800665115746
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ReFinED, an efficient end-to-end entity linking model which uses
fine-grained entity types and entity descriptions to perform linking. The model
performs mention detection, fine-grained entity typing, and entity
disambiguation for all mentions within a document in a single forward pass,
making it more than 60 times faster than competitive existing approaches.
ReFinED also surpasses state-of-the-art performance on standard entity linking
datasets by an average of 3.7 F1. The model is capable of generalising to
large-scale knowledge bases such as Wikidata (which has 15 times more entities
than Wikipedia) and of zero-shot entity linking. The combination of speed,
accuracy and scale makes ReFinED an effective and cost-efficient system for
extracting entities from web-scale datasets, for which the model has been
successfully deployed. Our code and pre-trained models are available at
https://github.com/alexa/ReFinED
- Abstract(参考訳): ReFinEDは、細粒度エンティティタイプとエンティティ記述を使用してリンクを行う、効率的なエンドツーエンドエンティティリンクモデルである。
このモデルは、ドキュメント内のすべての参照を単一のフォワードパスで参照検出、きめ細かいエンティティタイピング、エンティティの曖昧さを実行し、競合する既存のアプローチの60倍以上の速度で処理します。
ReFinEDはまた、標準エンティティリンクデータセットの最先端のパフォーマンスを平均3.7 F1で上回る。
このモデルはWikidata(Wikipediaの15倍のエンティティを持つ)やゼロショットエンティティリンクのような大規模知識ベースに一般化することができる。
スピード、精度、スケールの組み合わせにより、ReFinEDはWebスケールデータセットからエンティティを抽出する効果的でコスト効率の良いシステムとなり、モデルがうまくデプロイされた。
私たちのコードと事前トレーニングされたモデルはhttps://github.com/alexa/ReFinEDで利用可能です。
関連論文リスト
- OneNet: A Fine-Tuning Free Framework for Few-Shot Entity Linking via Large Language Model Prompting [49.655711022673046]
OneNetは、大規模言語モデル(LLM)の少数ショット学習機能を利用する革新的なフレームワークで、微調整は不要である。
1)無関係なエンティティを要約してフィルタリングすることで入力を単純化するエンティティリダクションプロセッサ,(2)コンテキスト的キューと事前知識を組み合わせて正確なエンティティリンクを行うデュアルパースペクティブエンティティリンカ,(3)エンティティリンク推論における幻覚を緩和するユニークな一貫性アルゴリズムを利用するエンティティコンセンサス判定器,である。
論文 参考訳(メタデータ) (2024-10-10T02:45:23Z) - Entity Disambiguation via Fusion Entity Decoding [68.77265315142296]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。
GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文 参考訳(メタデータ) (2024-04-02T04:27:54Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - SpEL: Structured Prediction for Entity Linking [5.112679200269861]
我々は,個々の入力トークンをエンティティとして分類するエンティティリンクの構造化予測の利用を再検討し,トークン予測を集約する。
我々のシステムであるSpELは最先端のエンティティリンクシステムであり、いくつかの新しいアイデアを用いてエンティティリンクのタスクに構造化予測を適用する。
実験の結果,WikipediaへのエンティティリンクのためのAIDAベンチマークデータセットでは,最先端のAIDAよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-10-23T08:24:35Z) - Long Document Summarization with Top-down and Bottom-up Inference [113.29319668246407]
本稿では、2つの側面の要約モデルを改善するための原則的推論フレームワークを提案する。
我々のフレームワークは、トップレベルが長距離依存性をキャプチャするドキュメントの階層的な潜在構造を前提としています。
本稿では,様々な要約データセットに対して提案手法の有効性を示す。
論文 参考訳(メタデータ) (2022-03-15T01:24:51Z) - Entity Linking and Discovery via Arborescence-based Supervised
Clustering [35.93568319872986]
本稿では,言及親和性を完全に活用する新しいトレーニングと推論手法を提案する。
我々は,この手法がエンティティ発見に優雅に拡張されていることを示す。
我々はZero-Shot Entity LinkingデータセットとMedMentionsに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-09-02T23:05:58Z) - DESCGEN: A Distantly Supervised Datasetfor Generating Abstractive Entity
Descriptions [41.80938919728834]
複数のドキュメントにまたがる言及を考えると、目的はエンティティの要約記述を生成することである。
DESCGENはWikipediaとFandomの37Kのエンティティ記述で構成されており、それぞれに平均9つの証拠文書が組み合わされている。
結果として得られる要約は、既存のデータセットよりも抽象的で、新しいエンティティや新興エンティティを記述する上での課題に対して、より優れたプロキシを提供する。
論文 参考訳(メタデータ) (2021-06-09T20:10:48Z) - Interpretable and Low-Resource Entity Matching via Decoupling Feature
Learning from Decision Making [22.755892575582788]
Entity Matchingは、同じ現実世界のオブジェクトを表すエンティティレコードを認識することを目的としている。
異種情報融合(HIF)とキー属性ツリー(KAT)誘導からなる新しいEMフレームワークを提案する。
提案手法は効率が高く,ほとんどの場合SOTA EMモデルより優れている。
論文 参考訳(メタデータ) (2021-06-08T08:27:31Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z) - Interpretable Entity Representations through Large-Scale Typing [61.4277527871572]
本稿では,人間の読みやすいエンティティ表現を作成し,箱から高パフォーマンスを実現する手法を提案する。
我々の表現は、微粒な実体型に対する後続確率に対応するベクトルである。
特定のドメインに対して,学習に基づく方法で,型セットのサイズを縮小できることを示す。
論文 参考訳(メタデータ) (2020-04-30T23:58:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。