論文の概要: Clustering-based Inference for Biomedical Entity Linking
- arxiv url: http://arxiv.org/abs/2010.11253v2
- Date: Thu, 8 Apr 2021 19:21:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-05 00:09:51.000147
- Title: Clustering-based Inference for Biomedical Entity Linking
- Title(参考訳): バイオメディカルエンティティリンクのためのクラスタリングに基づく推論
- Authors: Rico Angell, Nicholas Monath, Sunil Mohan, Nishant Yadav and Andrew
McCallum
- Abstract要約: 本稿では,リンク決定を知識ベースエンティティにリンクするだけでなく,クラスタリングを通じて複数の言及をまとめてグループ化し,リンク予測を共同で行うモデルを提案する。
公開可能な最大のバイオメディカルデータセットの実験では、エンティティリンクの最良の独立予測を3.0ポイント精度で改善する。
- 参考スコア(独自算出の注目度): 40.78384867437563
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Due to large number of entities in biomedical knowledge bases, only a small
fraction of entities have corresponding labelled training data. This
necessitates entity linking models which are able to link mentions of unseen
entities using learned representations of entities. Previous approaches link
each mention independently, ignoring the relationships within and across
documents between the entity mentions. These relations can be very useful for
linking mentions in biomedical text where linking decisions are often difficult
due mentions having a generic or a highly specialized form. In this paper, we
introduce a model in which linking decisions can be made not merely by linking
to a knowledge base entity but also by grouping multiple mentions together via
clustering and jointly making linking predictions. In experiments on the
largest publicly available biomedical dataset, we improve the best independent
prediction for entity linking by 3.0 points of accuracy, and our
clustering-based inference model further improves entity linking by 2.3 points.
- Abstract(参考訳): バイオメディカル知識ベースに多数のエンティティが存在するため、ラベル付きトレーニングデータを持つエンティティはごくわずかである。
これにより、エンティティの学習された表現を使用して、見当たらないエンティティの言及をリンクできるエンティティリンクモデルが必要となる。
以前のアプローチでは、各参照を独立してリンクし、エンティティ参照間のドキュメント内とドキュメント間の関係を無視する。
これらの関係は、一般的または高度に専門化された形式を持つ言及のため、リンク決定が難しい生体医学的テキストの言及をリンクするのに非常に有用である。
本稿では,知識ベースエンティティへのリンクだけでなく,複数の参照をクラスタリングによってグループ化し,相互にリンク予測を行うことによって,リンク決定を行うモデルを提案する。
公開されている最大のバイオメディカルデータセットの実験では、エンティティリンクの最良の独立予測を3.0ポイント精度で改善し、クラスタリングベースの推論モデルはさらに2.3ポイントのエンティティリンクを改善する。
関連論文リスト
- OneNet: A Fine-Tuning Free Framework for Few-Shot Entity Linking via Large Language Model Prompting [49.655711022673046]
OneNetは、大規模言語モデル(LLM)の少数ショット学習機能を利用する革新的なフレームワークで、微調整は不要である。
1)無関係なエンティティを要約してフィルタリングすることで入力を単純化するエンティティリダクションプロセッサ,(2)コンテキスト的キューと事前知識を組み合わせて正確なエンティティリンクを行うデュアルパースペクティブエンティティリンカ,(3)エンティティリンク推論における幻覚を緩和するユニークな一貫性アルゴリズムを利用するエンティティコンセンサス判定器,である。
論文 参考訳(メタデータ) (2024-10-10T02:45:23Z) - Biomedical Entity Linking as Multiple Choice Question Answering [48.74212158495695]
本稿では,バイオメディカルエンティティリンクを複数問合せ回答として扱う新モデルであるBioELQAを提案する。
まず、高速検索器を用いて候補エンティティを取得し、生成器に参照と候補エンティティを共同で提示し、選択したエンティティに関連付けられた予測シンボルを出力する。
長い尾を持つエンティティの一般化を改善するため、類似したラベル付きトレーニングインスタンスを手がかりとして検索し、ジェネレータの検索インスタンスで入力する。
論文 参考訳(メタデータ) (2024-02-23T08:40:38Z) - Learning Relation-Specific Representations for Few-shot Knowledge Graph
Completion [24.880078645503417]
本稿では,三重項のグラフコンテキストを利用して関係と実体のセマンティック情報を同時に取得する関係特化文脈学習フレームワークを提案する。
2つの公開データセットの実験結果は、RSCLが最先端のFKGC法より優れていることを示している。
論文 参考訳(メタデータ) (2022-03-22T11:45:48Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Learning to Select the Next Reasonable Mention for Entity Linking [39.112602039647896]
そこで本稿では,DyMenと呼ばれる新しいモデルを提案する。
我々は、強化学習のアクションサンプリングスペースを削減し、参照の意味的コヒーレンスを維持するために、スライディングウィンドウによる参照をサンプリングする。
論文 参考訳(メタデータ) (2021-12-08T04:12:50Z) - Entity Linking and Discovery via Arborescence-based Supervised
Clustering [35.93568319872986]
本稿では,言及親和性を完全に活用する新しいトレーニングと推論手法を提案する。
我々は,この手法がエンティティ発見に優雅に拡張されていることを示す。
我々はZero-Shot Entity LinkingデータセットとMedMentionsに対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-09-02T23:05:58Z) - Fast and Effective Biomedical Entity Linking Using a Dual Encoder [48.86736921025866]
文書中の複数の言及を1ショットで解決するBERTベースのデュアルエンコーダモデルを提案する。
本稿では,提案モデルが既存のBERTモデルよりも複数倍高速であり,バイオメディカルエンティティリンクの精度に競争力があることを示す。
論文 参考訳(メタデータ) (2021-03-08T19:32:28Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Learning Informative Representations of Biomedical Relations with Latent
Variable Models [2.4366811507669115]
本稿では,任意に柔軟な分布を持つ潜在変数モデルを提案する。
我々のモデルは、パラメータが少なく、トレーニングがかなり速く、両方のタスクの強いベースラインと競合する結果が得られることを実証する。
論文 参考訳(メタデータ) (2020-11-20T08:56:31Z) - Improving Broad-Coverage Medical Entity Linking with Semantic Type
Prediction and Large-Scale Datasets [12.131050765159145]
MedTypeは完全にモジュール化されたシステムで、エンティティ参照の予測されたセマンティックタイプに基づいて、無関係な候補概念を抽出する。
我々は、データセットをリンクする大規模医療機関であるWikiMedとPubMedDSを紹介し、これらのデータセット上でMedTypeを事前学習することで、エンティティリンク性能がさらに向上することを示す。
論文 参考訳(メタデータ) (2020-05-01T15:55:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。