論文の概要: Entity Disambiguation with Entity Definitions
- arxiv url: http://arxiv.org/abs/2210.05648v1
- Date: Tue, 11 Oct 2022 17:46:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 13:35:45.545586
- Title: Entity Disambiguation with Entity Definitions
- Title(参考訳): エンティティ定義によるエンティティの曖昧さ
- Authors: Luigi Procopio, Simone Conia, Edoardo Barba, Roberto Navigli
- Abstract要約: ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
- 参考スコア(独自算出の注目度): 50.01142092276296
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Local models have recently attained astounding performances in Entity
Disambiguation (ED), with generative and extractive formulations being the most
promising research directions. However, previous works limited their studies to
using, as the textual representation of each candidate, only its Wikipedia
title. Although certainly effective, this strategy presents a few critical
issues, especially when titles are not sufficiently informative or
distinguishable from one another. In this paper, we address this limitation and
investigate to what extent more expressive textual representations can mitigate
it. We thoroughly evaluate our approach against standard benchmarks in ED and
find extractive formulations to be particularly well-suited to these
representations: we report a new state of the art on 2 out of 6 benchmarks we
consider and strongly improve the generalization capability over unseen
patterns. We release our code, data and model checkpoints at
https://github.com/SapienzaNLP/extend.
- Abstract(参考訳): ローカルモデルは、最近Entity Disambiguation (ED)において驚くべきパフォーマンスを達成し、生成的および抽出的定式化が最も有望な研究方向である。
しかし、以前の研究は、各候補のテキスト表現として、ウィキペディアのタイトルのみを使用することに限られていた。
この戦略は確かに効果的だが、特にタイトルが互いに十分な情報や区別ができない場合には、いくつかの重要な問題が発生する。
本稿では、この制限に対処し、より表現力のあるテキスト表現がどの程度緩和できるかを検討する。
我々は、EDの標準ベンチマークに対する我々のアプローチを徹底的に評価し、抽出的定式化がこれらの表現に特に適していることを見出した。
私たちはコード、データ、モデルのチェックポイントをhttps://github.com/sapienzanlp/extendでリリースします。
関連論文リスト
- Beyond Coarse-Grained Matching in Video-Text Retrieval [50.799697216533914]
きめ細かい評価のための新しいアプローチを導入する。
テストキャプションを自動的に生成することで,既存のデータセットにアプローチを適用することができる。
きめ細かい評価実験は、このアプローチがきめ細かな違いを理解するモデルの能力を高めることを実証している。
論文 参考訳(メタデータ) (2024-10-16T09:42:29Z) - Coherent Entity Disambiguation via Modeling Topic and Categorical
Dependency [87.16283281290053]
従来のエンティティ曖昧化(ED)メソッドは、参照コンテキストと候補エンティティの一致するスコアに基づいて予測を行う、識別パラダイムを採用している。
本稿では,エンティティ予測のコヒーレンス向上を目的とした新しいデザインを備えたEDシステムであるCoherentedを提案する。
我々は、人気EDベンチマークにおいて、平均1.3F1ポイントの改善により、最先端の新たな結果を得る。
論文 参考訳(メタデータ) (2023-11-06T16:40:13Z) - Revisiting Sparse Retrieval for Few-shot Entity Linking [33.15662306409253]
本稿では,ELECTRAに基づくキーワード抽出手法を提案する。
抽出器のトレーニングには,参照コンテキストとエンティティ記述との間に重複するトークンをベースとしたトレーニングデータを自動的に生成する遠隔監視手法を提案する。
ZESHELデータセットによる実験結果から,提案手法はすべてのテスト領域において,最先端モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2023-10-19T03:51:10Z) - On Context Utilization in Summarization with Large Language Models [83.84459732796302]
大きな言語モデル(LLM)は抽象的な要約タスクに優れ、流動的で関連する要約を提供する。
最近の進歩は、100kトークンを超える長期入力コンテキストを扱う能力を拡張している。
要約における文脈利用と位置バイアスに関する最初の総合的研究を行う。
論文 参考訳(メタデータ) (2023-10-16T16:45:12Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - Robust Candidate Generation for Entity Linking on Short Social Media
Texts [1.5006258585503875]
つぶやきの分野では、ユーザーがしばしば非公式な綴りや文脈の制限、特異性の欠如に悩まされることが示される。
我々はウィキペディアの長期的文脈表現を用いたハイブリッドなソリューションを実証し、0.93リコールを達成した。
論文 参考訳(メタデータ) (2022-10-14T02:47:31Z) - A Closer Look at Debiased Temporal Sentence Grounding in Videos:
Dataset, Metric, and Approach [53.727460222955266]
テンポラル・センテンス・グラウンディング・イン・ビデオ(TSGV)は、未編集のビデオに自然言語文を埋め込むことを目的としている。
最近の研究では、現在のベンチマークデータセットには明らかなモーメントアノテーションバイアスがあることが判明している。
偏りのあるデータセットによる膨らませ評価を緩和するため、基礎的リコールスコアを割引する新しい評価基準「dR@n,IoU@m」を導入する。
論文 参考訳(メタデータ) (2022-03-10T08:58:18Z) - Partially Supervised Named Entity Recognition via the Expected Entity
Ratio Loss [2.9176780332337486]
我々は,エンティティアノテーションが欠落している状況下で,エンティティ認識者という名前の学習を研究する。
我々は、体系的に欠落したタグの存在下でモデルを学ぶために、新しい損失である期待されたエンティティ比を提案する。
提案手法は理論的に健全であり,実証的に有用であることを示す。
論文 参考訳(メタデータ) (2021-08-16T16:53:39Z) - Analysis and Evaluation of Language Models for Word Sense Disambiguation [18.001457030065712]
トランスフォーマーベースの言語モデルは、嵐によってNLPの多くの分野を取り込んでいる。
BERTは、ワードセンス毎に限られた数のサンプルが利用できる場合でも、高いレベルの感覚の区別を正確に捉えることができる。
BERTとその派生種は既存の評価ベンチマークの大部分を支配している。
論文 参考訳(メタデータ) (2020-08-26T15:07:07Z) - Extending Text Informativeness Measures to Passage Interestingness
Evaluation (Language Model vs. Word Embedding) [1.2998637003026272]
本稿では、インフォマティヴネスの概念をインフォマティヴネスの一般化として定義する。
次に、この一般化に対応するために、アートインフォーマティヴネス対策の状態を調査する。
CLEF-INEX Tweet Contextualization 2012 Logarithm similarity measure が最適であることを示す。
論文 参考訳(メタデータ) (2020-04-14T18:22:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。