論文の概要: Entity Linking and Discovery via Arborescence-based Supervised
Clustering
- arxiv url: http://arxiv.org/abs/2109.01242v1
- Date: Thu, 2 Sep 2021 23:05:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-06 14:06:21.744425
- Title: Entity Linking and Discovery via Arborescence-based Supervised
Clustering
- Title(参考訳): Arborescence-based Supervised Clusteringによるエンティティリンクとディスカバリ
- Authors: Dhruv Agarwal, Rico Angell, Nicholas Monath, Andrew McCallum
- Abstract要約: 本稿では,言及親和性を完全に活用する新しいトレーニングと推論手法を提案する。
我々は,この手法がエンティティ発見に優雅に拡張されていることを示す。
我々はZero-Shot Entity LinkingデータセットとMedMentionsに対するアプローチを評価した。
- 参考スコア(独自算出の注目度): 35.93568319872986
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Previous work has shown promising results in performing entity linking by
measuring not only the affinities between mentions and entities but also those
amongst mentions. In this paper, we present novel training and inference
procedures that fully utilize mention-to-mention affinities by building minimum
arborescences (i.e., directed spanning trees) over mentions and entities across
documents in order to make linking decisions. We also show that this method
gracefully extends to entity discovery, enabling the clustering of mentions
that do not have an associated entity in the knowledge base. We evaluate our
approach on the Zero-Shot Entity Linking dataset and MedMentions, the largest
publicly available biomedical dataset, and show significant improvements in
performance for both entity linking and discovery compared to identically
parameterized models. We further show significant efficiency improvements with
only a small loss in accuracy over previous work, which use more
computationally expensive models.
- Abstract(参考訳): 従来の研究は、言及と実体間の親和性だけでなく、言及間の親和性も測定することで、エンティティリンクを行う上で有望な結果を示している。
本稿では,文書間の言及や実体を最小限のアーボラッセンス(すなわち,木に散らばった指示)を構築することで,参照親和性を完全に活用する新たなトレーニングと推論手法を提案する。
また,本手法はエンティティ発見に優雅に拡張され,知識ベースに関連エンティティを持たない参照のクラスタリングが可能となった。
我々はZero-Shot Entity Linking データセットとMedMentionsのアプローチを評価し、同一パラメータ化モデルと比較して、エンティティリンクと発見の両方のパフォーマンスが大幅に向上したことを示す。
さらに, 計算コストの高いモデルを用いて, 従来よりも精度を低下させることなく, 大幅な効率向上を図った。
関連論文リスト
- Going beyond research datasets: Novel intent discovery in the industry
setting [60.90117614762879]
本稿では,大規模なeコマースプラットフォームに展開する意図発見パイプラインを改善する手法を提案する。
ドメイン内データに基づく事前学習型言語モデルの利点を示す。
また,クラスタリングタスクの微調整中に,実生活データセットの会話構造(質問と回答)を利用するための最善の方法も考案した。
論文 参考訳(メタデータ) (2023-05-09T14:21:29Z) - Modeling Entities as Semantic Points for Visual Information Extraction
in the Wild [55.91783742370978]
文書画像から鍵情報を正確かつ堅牢に抽出する手法を提案する。
我々は、エンティティを意味的ポイントとして明示的にモデル化する。つまり、エンティティの中心点は、異なるエンティティの属性と関係を記述する意味情報によって豊かになる。
提案手法は,従来の最先端モデルと比較して,エンティティラベルとリンクの性能を著しく向上させることができる。
論文 参考訳(メタデータ) (2023-03-23T08:21:16Z) - Effective Few-Shot Named Entity Linking by Meta-Learning [34.70028855572534]
本稿では,非自明な合成エンティティ-メント対を生成するための新しい弱監督戦略を提案する。
また,各合成実体対に異なる重みを割り当てるメタ学習機構を設計する。
実世界のデータセットの実験により、提案手法は最先端の少数ショットエンティティリンクモデルを大幅に改善できることが示された。
論文 参考訳(メタデータ) (2022-07-12T03:23:02Z) - PIE: a Parameter and Inference Efficient Solution for Large Scale
Knowledge Graph Embedding Reasoning [24.29409958504209]
PIE, textbfparameter および textbfinference textbfefficient ソリューションを提案する。
テンソル分解法から着想を得た結果, 要素埋め込み行列を低階行列に分解することで, パラメータの半数以上を削減できることがわかった。
モデル推論を高速化するために,よりきめ細かなエンティティタイピングのように見える自己教師付き補助タスクを提案する。
論文 参考訳(メタデータ) (2022-04-29T09:06:56Z) - Learning to Select the Next Reasonable Mention for Entity Linking [39.112602039647896]
そこで本稿では,DyMenと呼ばれる新しいモデルを提案する。
我々は、強化学習のアクションサンプリングスペースを削減し、参照の意味的コヒーレンスを維持するために、スライディングウィンドウによる参照をサンプリングする。
論文 参考訳(メタデータ) (2021-12-08T04:12:50Z) - SAIS: Supervising and Augmenting Intermediate Steps for Document-Level
Relation Extraction [51.27558374091491]
本稿では,関係抽出のための中間ステップ(SAIS)を監督し,拡張することにより,関連コンテキストやエンティティタイプをキャプチャするモデルを明示的に教えることを提案する。
そこで本提案手法は,より効果的な管理を行うため,より優れた品質の関係を抽出するだけでなく,それに対応する証拠をより正確に抽出する。
論文 参考訳(メタデータ) (2021-09-24T17:37:35Z) - Clustering-based Inference for Biomedical Entity Linking [40.78384867437563]
本稿では,リンク決定を知識ベースエンティティにリンクするだけでなく,クラスタリングを通じて複数の言及をまとめてグループ化し,リンク予測を共同で行うモデルを提案する。
公開可能な最大のバイオメディカルデータセットの実験では、エンティティリンクの最良の独立予測を3.0ポイント精度で改善する。
論文 参考訳(メタデータ) (2020-10-21T19:16:27Z) - Cross-Supervised Joint-Event-Extraction with Heterogeneous Information
Networks [61.950353376870154]
Joint-event- Extractは、トリガとエンティティのタグからなるタグセットを備えたシーケンスからシーケンスまでのラベリングタスクである。
トリガやエンティティの抽出を交互に監督するクロススーパーバイザードメカニズム(CSM)を提案する。
我々の手法は、エンティティとトリガー抽出の両方において最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-10-13T11:51:17Z) - Pairwise Similarity Knowledge Transfer for Weakly Supervised Object
Localization [53.99850033746663]
弱教師付き画像ラベルを持つ対象クラスにおける局所化モデル学習の問題点について検討する。
本研究では,対象関数のみの学習は知識伝達の弱い形態であると主張する。
COCOおよびILSVRC 2013検出データセットの実験では、ペアワイズ類似度関数を含むことにより、ローカライズモデルの性能が大幅に向上することが示された。
論文 参考訳(メタデータ) (2020-03-18T17:53:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。