論文の概要: Strong Heuristics for Named Entity Linking
- arxiv url: http://arxiv.org/abs/2207.02824v1
- Date: Wed, 6 Jul 2022 17:29:30 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-07 13:09:54.944066
- Title: Strong Heuristics for Named Entity Linking
- Title(参考訳): 名前付きエンティティリンクのための強いヒューリスティックス
- Authors: Marko \v{C}uljak, Andreas Spitz, Robert West, Akhil Arora
- Abstract要約: ニュースにおける名前付きエンティティリンク(NEL)は、目に見えないエンティティや新興エンティティの頻度のため、困難な取り組みである。
ウェブスケールコーパスにおけるNELのための直感的で軽量でスケーラブルなEigensの適合性について検討する。
最高のパフォーマンスは、QuotebankとAIDA-CoNLLベンチマークに関する言及の94%と63%を曖昧にしています。
- 参考スコア(独自算出の注目度): 13.903774191185608
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity linking (NEL) in news is a challenging endeavour due to the
frequency of unseen and emerging entities, which necessitates the use of
unsupervised or zero-shot methods. However, such methods tend to come with
caveats, such as no integration of suitable knowledge bases (like Wikidata) for
emerging entities, a lack of scalability, and poor interpretability. Here, we
consider person disambiguation in Quotebank, a massive corpus of
speaker-attributed quotations from the news, and investigate the suitability of
intuitive, lightweight, and scalable heuristics for NEL in web-scale corpora.
Our best performing heuristic disambiguates 94% and 63% of the mentions on
Quotebank and the AIDA-CoNLL benchmark, respectively. Additionally, the
proposed heuristics compare favourably to the state-of-the-art unsupervised and
zero-shot methods, Eigenthemes and mGENRE, respectively, thereby serving as
strong baselines for unsupervised and zero-shot entity linking.
- Abstract(参考訳): ニュースにおける名前付きエンティティリンク(NEL)は、教師なしまたはゼロショットメソッドの使用を必要とする未確認および新興エンティティの頻度のため、困難な取り組みである。
しかし、このような手法には、新興のエンティティに適した知識ベース(Wikidataなど)の統合がないこと、スケーラビリティの欠如、理解しにくいことなど、注意が必要である。
本稿では,このニュースを引用した大規模コーパスであるQuotebankにおける人物の曖昧さを考察し,WebスケールコーパスにおけるNELの直感的かつ軽量でスケーラブルなヒューリスティックスの適合性について考察する。
私たちの最高のヒューリスティックな不明瞭さは、QuotebankとAIDA-CoNLLベンチマークに関する言及の94%と63%です。
さらに,提案するヒューリスティックスは,非教師なしおよびゼロショットの手法である固有テーマとmgenreとをそれぞれ好適に比較し,教師なしおよびゼロショットのエンティティリンクの強力なベースラインとして機能する。
関連論文リスト
- OneNet: A Fine-Tuning Free Framework for Few-Shot Entity Linking via Large Language Model Prompting [49.655711022673046]
OneNetは、大規模言語モデル(LLM)の少数ショット学習機能を利用する革新的なフレームワークで、微調整は不要である。
1)無関係なエンティティを要約してフィルタリングすることで入力を単純化するエンティティリダクションプロセッサ,(2)コンテキスト的キューと事前知識を組み合わせて正確なエンティティリンクを行うデュアルパースペクティブエンティティリンカ,(3)エンティティリンク推論における幻覚を緩和するユニークな一貫性アルゴリズムを利用するエンティティコンセンサス判定器,である。
論文 参考訳(メタデータ) (2024-10-10T02:45:23Z) - Entity Disambiguation via Fusion Entity Decoding [68.77265315142296]
より詳細なエンティティ記述を持つエンティティを曖昧にするためのエンコーダ・デコーダモデルを提案する。
GERBILベンチマークでは、EntQAと比較して、エンド・ツー・エンドのエンティティリンクが+1.5%改善されている。
論文 参考訳(メタデータ) (2024-04-02T04:27:54Z) - GUMsley: Evaluating Entity Salience in Summarization for 12 English
Genres [14.37990666928991]
GUMsleyは、12のジャンルの英語テキストに対して、名前付きおよび名前なしの敬意的エンティティを全てカバーする最初のエンティティ・サリエンス・データセットである。
いくつかのモデルアーキテクチャに対して健全なエンティティを予測または提供することにより、パフォーマンスが向上し、高品質なサマリーの導出に役立つことを示す。
論文 参考訳(メタデータ) (2024-01-31T16:30:50Z) - CoAnnotating: Uncertainty-Guided Work Allocation between Human and Large
Language Models for Data Annotation [94.59630161324013]
本稿では,非構造化テキストの大規模共同アノテーションのための新しいパラダイムであるCoAnnotatingを提案する。
我々の実証研究は、CoAnnotatingが、異なるデータセット上の結果から作業を割り当てる効果的な手段であることを示し、ランダムベースラインよりも最大21%のパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2023-10-24T08:56:49Z) - Joint Speech Translation and Named Entity Recognition [17.305879157385675]
重要なタスクは、上記のエンティティに関する情報で出力を豊かにすることです。
本稿では,名前付きエンティティ認識(NER)とエンティティリンクシステムとを併用したマルチタスクモデルを提案する。
実験の結果,NERタスクのカスケード(0.4-1.0 F1)は翻訳品質の劣化を伴わずに有意に優れていた。
論文 参考訳(メタデータ) (2022-10-21T14:24:46Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - Efficient Entity Candidate Generation for Low-Resource Languages [13.789451365205665]
候補生成はエンティティリンクにおいて重要なモジュールである。
知識ベースを効果的に活用することが証明された複数のNLPタスクにおいて重要な役割を果たす。
本稿では,言語間エンティティリンクの文脈における候補生成問題の詳細な分析を行う。
論文 参考訳(メタデータ) (2022-06-30T09:49:53Z) - Nested Named Entity Recognition as Holistic Structure Parsing [92.8397338250383]
本研究は,文中の全入れ子NEを全体構造としてモデル化し,全体構造解析アルゴリズムを提案する。
実験により、我々のモデルは、最先端にアプローチしたり、あるいは達成したりするような、広く使われているベンチマークで有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2022-04-17T12:48:20Z) - LNN-EL: A Neuro-Symbolic Approach to Short-text Entity Linking [62.634516517844496]
本稿では,解釈可能なルールとニューラルネットワークの性能を併用したニューラルシンボリックアプローチであるLNN-ELを提案する。
ルールの使用に制約があるにもかかわらず、LNN-ELはSotAのブラックボックスニューラルアプローチと競合する。
論文 参考訳(メタデータ) (2021-06-17T20:22:45Z) - Neural Entity Summarization with Joint Encoding and Weak Supervision [29.26714907483851]
知識グラフでは、実体はしばしば多くの三つの事実によって記述される。
既存の実体化ソリューションは、主に教師なしである。
本稿では,新しいニューラルモデルに基づく教師付きアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-01T00:14:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。