論文の概要: TempEL: Linking Dynamically Evolving and Newly Emerging Entities
- arxiv url: http://arxiv.org/abs/2302.02500v1
- Date: Sun, 5 Feb 2023 22:34:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-07 17:58:43.323919
- Title: TempEL: Linking Dynamically Evolving and Newly Emerging Entities
- Title(参考訳): Tempel: 動的に進化する新しいエンティティのリンク
- Authors: Klim Zaporojets, Lucie-Aimee Kaffee, Johannes Deleu, Thomas Demeester,
Chris Develder, Isabelle Augenstein
- Abstract要約: 進化を続ける世界では、エンティティは時間とともに変化し、これまで存在していなかった、あるいは未知の、新しいエンティティが現れます。
本研究では,この進化シナリオが,十分に確立されたエンティティリンク(EL)タスクの性能に与える影響について検討する。
我々は,2013年から2022年までの英語ウィキペディアスナップショットからなるエンティティリンクデータセットであるTempELを紹介した。
- 参考スコア(独自算出の注目度): 50.980331847622026
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In our continuously evolving world, entities change over time and new,
previously non-existing or unknown, entities appear. We study how this
evolutionary scenario impacts the performance on a well established entity
linking (EL) task. For that study, we introduce TempEL, an entity linking
dataset that consists of time-stratified English Wikipedia snapshots from 2013
to 2022, from which we collect both anchor mentions of entities, and these
target entities' descriptions. By capturing such temporal aspects, our newly
introduced TempEL resource contrasts with currently existing entity linking
datasets, which are composed of fixed mentions linked to a single static
version of a target Knowledge Base (e.g., Wikipedia 2010 for CoNLL-AIDA).
Indeed, for each of our collected temporal snapshots, TempEL contains links to
entities that are continual, i.e., occur in all of the years, as well as
completely new entities that appear for the first time at some point. Thus, we
enable to quantify the performance of current state-of-the-art EL models for:
(i) entities that are subject to changes over time in their Knowledge Base
descriptions as well as their mentions' contexts, and (ii) newly created
entities that were previously non-existing (e.g., at the time the EL model was
trained). Our experimental results show that in terms of temporal performance
degradation, (i) continual entities suffer a decrease of up to 3.1% EL
accuracy, while (ii) for new entities this accuracy drop is up to 17.9%. This
highlights the challenge of the introduced TempEL dataset and opens new
research prospects in the area of time-evolving entity disambiguation.
- Abstract(参考訳): 私たちの絶え間なく進化する世界では、エンティティは時間とともに変化し、新しい、これまで存在しない、あるいは未知のエンティティが現れます。
本研究では,この進化シナリオが,十分に確立されたエンティティリンク(EL)タスクの性能に与える影響について検討する。
そこで本研究では,2013年から2022年までの経時的に階層化された英語ウィキペディアのスナップショットからなり,エンティティのアンカー参照と対象エンティティの記述の両方を収集するエンティティリンクデータセットであるtemperを紹介する。
このような時間的側面を捉えることで、新しいTempELリソースは、ターゲットの知識ベース(例えば、CoNLL-AIDAのWikipedia 2010)の1つの静的バージョンにリンクされた固定参照で構成された、既存のエンティティリンクデータセットと対比する。
実際、収集したそれぞれの時間的スナップショットに対して、tempelには、すべての年、すなわち、ある時点で初めて現れる完全に新しいエンティティと、連続的なエンティティへのリンクが含まれています。
これにより,現状のelモデルの性能を次のように定量化することができる。
(i)知識ベース記述及び言及の文脈において、経時的に変化の対象となる実体
(II)以前は存在していなかった新しい実体(例えば、ELモデルが訓練された当時)。
実験の結果, 時間的性能低下が確認された。
(i)連続体は最大3.1%el精度の低下に苦しむ一方で、
(ii) 新しいエンティティの場合、この精度は17.9%まで低下する。
これは、導入されたTempELデータセットの課題を強調し、時間進化するエンティティの曖昧さの領域で新しい研究の展望を開く。
関連論文リスト
- TIGER: Temporally Improved Graph Entity Linker [6.111040278075022]
textbfTIGER: textbfTemporally textbfImproved textbfGraph textbfEntity Linketextbfr。
textbfTIGER: textbfTemporally textbfImproved textbfGraph textbfEntity Linketextbfr。
我々は学習した表現を強化し、実体を作る
論文 参考訳(メタデータ) (2024-10-11T09:44:33Z) - CYCLE: Cross-Year Contrastive Learning in Entity-Linking [8.108904258003411]
textbfCYCLE: textbfCross-textbfYear textbfContrastive textbfLearning for textbfEntity-Linking
textbfCYCLE: textbfCross-textbfYear textbfContrastive textbfLearning for textbfEntity-Linkingを紹介する。
論文 参考訳(メタデータ) (2024-10-11T09:41:54Z) - OneNet: A Fine-Tuning Free Framework for Few-Shot Entity Linking via Large Language Model Prompting [49.655711022673046]
OneNetは、大規模言語モデル(LLM)の少数ショット学習機能を利用する革新的なフレームワークで、微調整は不要である。
1)無関係なエンティティを要約してフィルタリングすることで入力を単純化するエンティティリダクションプロセッサ,(2)コンテキスト的キューと事前知識を組み合わせて正確なエンティティリンクを行うデュアルパースペクティブエンティティリンカ,(3)エンティティリンク推論における幻覚を緩和するユニークな一貫性アルゴリズムを利用するエンティティコンセンサス判定器,である。
論文 参考訳(メタデータ) (2024-10-10T02:45:23Z) - Real World Conversational Entity Linking Requires More Than Zeroshots [50.5691094768954]
本研究では,資源制約下でのELモデルの有効性を評価するための評価シナリオを設計する。
本稿では、Fandomと新しいゼロショット対話型エンティティリンクデータセットを用いて、ELモデルの未知KBへの一般化能力を評価する。
その結果,既存のゼロショットELモデルでは,事前トレーニングなしで新しいドメイン固有KBを導入するとフェールすることがわかった。
論文 参考訳(メタデータ) (2024-09-02T10:37:53Z) - Exploiting Contextual Target Attributes for Target Sentiment
Classification [53.30511968323911]
TSCの既存のPTLMベースモデルは、1)PTLMをコンテキストエンコーダとして採用した微調整ベースモデル、2)テキスト/単語生成タスクに分類タスクを転送するプロンプトベースモデル、の2つのグループに分類される。
我々は,PTLM を TSC に活用する新たな視点として,言語モデリングと文脈的ターゲット属性による明示的ターゲットコンテキスト相互作用の利点を同時に活用する。
論文 参考訳(メタデータ) (2023-12-21T11:45:28Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - NASTyLinker: NIL-Aware Scalable Transformer-based Entity Linker [2.3605348648054463]
我々は,NIL-entityを意識したELアプローチを導入し,既知のエンティティのリンク性能を維持しつつ,対応する参照クラスタを生成する。
NIL-entities に対して EL を評価するために明示的に構築されたデータセットである NILK 上で NASTyLinker の有効性と拡張性を示す。
論文 参考訳(メタデータ) (2023-03-08T08:08:57Z) - Entity Cloze By Date: What LMs Know About Unseen Entities [79.34707800653597]
言語モデル(LM)は通常、大規模なコーパスで一度訓練され、更新されずに数年間使用される。
本研究では,LMの事前学習時に存在しなかった新しいエンティティについて,LMがどのような推論ができるのかを解析する枠組みを提案する。
本論文は,その発祥日によって索引付けされたエンティティのデータセットを,英語のウィキペディア記事と組み合わせて作成し,各エンティティに関する文章を検索する。
論文 参考訳(メタデータ) (2022-05-05T17:59:31Z) - DESCGEN: A Distantly Supervised Datasetfor Generating Abstractive Entity
Descriptions [41.80938919728834]
複数のドキュメントにまたがる言及を考えると、目的はエンティティの要約記述を生成することである。
DESCGENはWikipediaとFandomの37Kのエンティティ記述で構成されており、それぞれに平均9つの証拠文書が組み合わされている。
結果として得られる要約は、既存のデータセットよりも抽象的で、新しいエンティティや新興エンティティを記述する上での課題に対して、より優れたプロキシを提供する。
論文 参考訳(メタデータ) (2021-06-09T20:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。