論文の概要: EDIN: An End-to-end Benchmark and Pipeline for Unknown Entity Discovery
and Indexing
- arxiv url: http://arxiv.org/abs/2205.12570v1
- Date: Wed, 25 May 2022 08:29:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-27 06:21:46.966601
- Title: EDIN: An End-to-end Benchmark and Pipeline for Unknown Entity Discovery
and Indexing
- Title(参考訳): EDIN: 未知のエンティティ発見とインデックスのためのエンドツーエンドベンチマークとパイプライン
- Authors: Nora Kassner, Fabio Petroni, Mikhail Plekhanov, Sebastian Riedel,
Nicola Cancedda
- Abstract要約: エンティティリンクに関する既存の作業は、ほとんどの場合、参照知識ベースが完成していると仮定するので、すべての言及をリンクすることができる。
本稿では,未知のエンティティ,すなわち知識ベースに記述されていないエンティティとラベル付き言及が存在しないエンティティを,既存のエンティティリンクシステムに統合しなくてはならない,未知のエンティティ発見とインデックス化のベンチマークを作成する。
密集検索ベースのエンティティリンクに基づいて構築されたEDINパイプラインは、コンテキスト内の未知のエンティティの参照を検知、クラスタ、インデックスする。
- 参考スコア(独自算出の注目度): 28.62173704769311
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing work on Entity Linking mostly assumes that the reference knowledge
base is complete, and therefore all mentions can be linked. In practice this is
hardly ever the case, as knowledge bases are incomplete and because novel
concepts arise constantly. This paper created the Unknown Entity Discovery and
Indexing (EDIN) benchmark where unknown entities, that is entities without a
description in the knowledge base and labeled mentions, have to be integrated
into an existing entity linking system. By contrasting EDIN with zero-shot
entity linking, we provide insight on the additional challenges it poses.
Building on dense-retrieval based entity linking, we introduce the end-to-end
EDIN pipeline that detects, clusters, and indexes mentions of unknown entities
in context. Experiments show that indexing a single embedding per entity
unifying the information of multiple mentions works better than indexing
mentions independently.
- Abstract(参考訳): Entity Linkingに関する既存の作業は、主に参照知識ベースが完成していると仮定しているため、すべての参照をリンクすることができる。
知識基盤が不完全であり、新しい概念が常に生じているため、実際にはそうではない。
本稿では,未知のエンティティである未知のエンティティを,知識ベースに記述せずにラベル付けしたエンティティを,既存のエンティティリンクシステムに統合する,未知のエンティティ発見インデックス(EDIN)ベンチマークを作成する。
EDINとゼロショットエンティティリンクとは対照的に、我々はそれらがもたらす追加の課題について洞察を提供する。
密集検索ベースのエンティティリンクに基づいて構築されたEDINパイプラインは、コンテキスト内の未知のエンティティの参照を検知、クラスタ、インデックスする。
実験により、複数の参照の情報を統合するエンティティごとの単一の埋め込みのインデックス化は、独立に参照のインデックス化よりも優れていることが示されている。
関連論文リスト
- OneNet: A Fine-Tuning Free Framework for Few-Shot Entity Linking via Large Language Model Prompting [49.655711022673046]
OneNetは、大規模言語モデル(LLM)の少数ショット学習機能を利用する革新的なフレームワークで、微調整は不要である。
1)無関係なエンティティを要約してフィルタリングすることで入力を単純化するエンティティリダクションプロセッサ,(2)コンテキスト的キューと事前知識を組み合わせて正確なエンティティリンクを行うデュアルパースペクティブエンティティリンカ,(3)エンティティリンク推論における幻覚を緩和するユニークな一貫性アルゴリズムを利用するエンティティコンセンサス判定器,である。
論文 参考訳(メタデータ) (2024-10-10T02:45:23Z) - Entity Disambiguation via Fusion Entity Decoding [68.77265315142296]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。
GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文 参考訳(メタデータ) (2024-04-02T04:27:54Z) - SpEL: Structured Prediction for Entity Linking [5.112679200269861]
我々は,個々の入力トークンをエンティティとして分類するエンティティリンクの構造化予測の利用を再検討し,トークン予測を集約する。
我々のシステムであるSpELは最先端のエンティティリンクシステムであり、いくつかの新しいアイデアを用いてエンティティリンクのタスクに構造化予測を適用する。
実験の結果,WikipediaへのエンティティリンクのためのAIDAベンチマークデータセットでは,最先端のAIDAよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-10-23T08:24:35Z) - NASTyLinker: NIL-Aware Scalable Transformer-based Entity Linker [2.3605348648054463]
我々は,NIL-entityを意識したELアプローチを導入し,既知のエンティティのリンク性能を維持しつつ,対応する参照クラスタを生成する。
NIL-entities に対して EL を評価するために明示的に構築されたデータセットである NILK 上で NASTyLinker の有効性と拡張性を示す。
論文 参考訳(メタデータ) (2023-03-08T08:08:57Z) - Focusing on Context is NICE: Improving Overshadowed Entity
Disambiguation [43.82625203429496]
NICEは、コンテキストを活用するためにエンティティタイプ情報を使用し、周波数ベースの事前のオーバーリライスを避ける。
実験の結果,NICEは,頻繁なエンティティに対して競争力を持ちながら,オーバーシャドードエンティティ上で最高のパフォーマンスを達成できることがわかった。
論文 参考訳(メタデータ) (2022-10-12T13:05:37Z) - Entity Cloze By Date: What LMs Know About Unseen Entities [79.34707800653597]
言語モデル(LM)は通常、大規模なコーパスで一度訓練され、更新されずに数年間使用される。
本研究では,LMの事前学習時に存在しなかった新しいエンティティについて,LMがどのような推論ができるのかを解析する枠組みを提案する。
本論文は,その発祥日によって索引付けされたエンティティのデータセットを,英語のウィキペディア記事と組み合わせて作成し,各エンティティに関する文章を検索する。
論文 参考訳(メタデータ) (2022-05-05T17:59:31Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - EntQA: Entity Linking as Question Answering [18.39360849304263]
本稿では、質問回答としてエンティティリンクを表すEntQAを紹介する。
このアプローチは、エンティティリンクの進歩と、オープンドメインの質問応答の進歩を組み合わせたものです。
以前の作品とは異なり、我々は言及候補辞書や大規模な弱監督に依存していない。
論文 参考訳(メタデータ) (2021-10-05T21:39:57Z) - Neural Production Systems [90.75211413357577]
視覚環境は、異なるオブジェクトまたはエンティティから構成される。
イメージをエンティティに分割するために、ディープラーニング研究者は構造的誘導バイアスを提案した。
私たちは認知科学からインスピレーションを得て、一連のルールテンプレートからなる古典的なアプローチを復活させます。
このアーキテクチャは柔軟でダイナミックな制御フローを実現し、エンティティ固有およびルールベースの情報を分解するのに役立つ。
論文 参考訳(メタデータ) (2021-03-02T18:53:20Z) - Autoregressive Entity Retrieval [55.38027440347138]
エンティティは、知識の表現と集約の方法の中心にあります。
クエリが与えられたエンティティを検索できることは、エンティティリンクやオープンドメインの質問応答のような知識集約的なタスクに基本となる。
本稿では,自己回帰方式でトークン・バイ・トークンを左から右に生成し,エンティティを検索する最初のシステムであるGENREを提案する。
論文 参考訳(メタデータ) (2020-10-02T10:13:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。