論文の概要: BELHD: Improving Biomedical Entity Linking with Homonoym Disambiguation
- arxiv url: http://arxiv.org/abs/2401.05125v1
- Date: Wed, 10 Jan 2024 12:45:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-11 14:42:44.568175
- Title: BELHD: Improving Biomedical Entity Linking with Homonoym Disambiguation
- Title(参考訳): BELHD: Homonoym Disambiguation によるバイオメディカルエンティティリンクの改善
- Authors: Samuele Garda and Ulf Leser
- Abstract要約: バイオメディカル・エンティティ・リンク(英: Biomedical entity Linking、BEL)は、知識ベース(KB)に言及するエンティティを接地するタスクである。
BELHDは、2つの重要な拡張を導入したBioSyn(Sung et al., 2020)モデルに基づいている。
10のコーパスと5つのエンティティタイプによる実験では、BELHDは最先端のアプローチで改善されている。
- 参考スコア(独自算出の注目度): 4.477762005644463
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Biomedical entity linking (BEL) is the task of grounding entity mentions to a
knowledge base (KB). A popular approach to the task are name-based methods,
i.e. those identifying the most appropriate name in the KB for a given mention,
either via dense retrieval or autoregressive modeling. However, as these
methods directly return KB names, they cannot cope with homonyms, i.e.
different KB entities sharing the exact same name. This significantly affects
their performance, especially for KBs where homonyms account for a large amount
of entity mentions (e.g. UMLS and NCBI Gene). We therefore present BELHD
(Biomedical Entity Linking with Homonym Disambiguation), a new name-based
method that copes with this challenge. Specifically, BELHD builds upon the
BioSyn (Sung et al.,2020) model introducing two crucial extensions. First, it
performs a preprocessing of the KB in which it expands homonyms with an
automatically chosen disambiguating string, thus enforcing unique linking
decisions. Second, we introduce candidate sharing, a novel strategy to select
candidates for contrastive learning that enhances the overall training signal.
Experiments with 10 corpora and five entity types show that BELHD improves upon
state-of-the-art approaches, achieving the best results in 6 out 10 corpora
with an average improvement of 4.55pp recall@1. Furthermore, the KB
preprocessing is orthogonal to the core prediction model and thus can also
improve other methods, which we exemplify for GenBioEL (Yuan et al, 2022), a
generative name-based BEL approach. Code is available at: link added upon
publication.
- Abstract(参考訳): バイオメディカル・エンティティ・リンク(英: Biomedical entity Linking、BEL)は、知識ベース(KB)に言及するエンティティの基盤となるタスクである。
タスクに対する一般的なアプローチは、名前に基づくメソッド、すなわち、特定の言及に対してKBの中で最も適切な名前を特定するメソッドである。
しかし、これらのメソッドはKB名を直接返すため、同じ名前を共有する異なるKBエンティティなど、同義語には対応できない。
これはパフォーマンスに大きく影響し、特にKBでは、同義語が大量のエンティティの言及(UMLSやNCBI Geneなど)を反映している。
そこで我々は,この課題に対処する新しい名前ベース手法であるBELHD(Biomedical Entity Linking with Homonym Disambiguation)を提案する。
特に、belhdは2つの重要な拡張を導入したbiosyn (sung et al.,2020)モデルに基づいている。
まず、KBの前処理を行い、自動的に選択された曖昧な文字列で同義語を拡張し、ユニークなリンク決定を強制する。
第2に,コントラスト学習の候補を選択するための新しい戦略である候補共有を導入し,総合的な学習信号を強化する。
10コーパスと5つのエンティティタイプを用いた実験では、BELHDは最先端アプローチで改善され、平均4.55ppリコール@1で6対10コーパスで最高の結果が得られた。
さらに、KB前処理はコア予測モデルに直交しており、生成名に基づくBELアプローチであるGenBioEL(Yuan et al, 2022)を例示する他の手法も改善できる。
コードは以下のとおりである。
関連論文リスト
- Conjugated Semantic Pool Improves OOD Detection with Pre-trained Vision-Language Models [70.82728812001807]
ゼロショット・アウト・オブ・ディストリビューション(OOD)検出のための簡単なパイプラインでは、広範なセマンティックプールから潜在的OODラベルを選択する必要がある。
性能向上にはセマンティックプールの拡張が必要であると理論化します。
我々は,CSPによるOODラベル候補の拡大が要件を満たし,FPR95において既存の作品の7.89%を上回っていることを示す。
論文 参考訳(メタデータ) (2024-10-11T08:24:11Z) - Bi-Encoders based Species Normalization -- Pairwise Sentence Learning to
Rank [0.0]
本稿では、名前付きエンティティ正規化のための新しい深層学習手法を提案し、問題をランク付けするペアワイズ学習として扱う。
本研究は,種の実体型に関する実験を行い,その手法を最先端技術に対して評価する。
論文 参考訳(メタデータ) (2023-10-22T17:30:16Z) - Improving Self-training for Cross-lingual Named Entity Recognition with
Contrastive and Prototype Learning [80.08139343603956]
言語横断的な実体認識において、自己学習は言語的ギャップを埋めるために一般的に用いられる。
本研究では,表現学習と擬似ラベル改善を組み合わせることで,言語間NERの自己学習を改善することを目的とする。
提案手法,すなわちContProtoは主に,(1)コントラスト型自己学習と(2)プロトタイプベース擬似ラベルの2つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-05-23T02:52:16Z) - Exploring Partial Knowledge Base Inference in Biomedical Entity Linking [0.4798394926736971]
我々はこのシナリオを部分的知識ベース推論と呼ぶ。
我々は, ベンチマークを構築し, 劇的な精度低下によるEL性能の破滅的な劣化を目撃する。
計算オーバーヘッドの少ない2つのNIL問題に対して, 単純かつ効果的に対処する手法を提案する。
論文 参考訳(メタデータ) (2023-03-18T04:31:07Z) - Reveal the Unknown: Out-of-Knowledge-Base Mention Discovery with Entity
Linking [23.01938139604297]
NIL エンティティとマッチングすることで、対応するKB エンティティを持たない参照を識別できるBERT ベースの Entity Linking (EL) 手法を提案する。
5つのデータセットの結果は、既存のメソッドよりもBLINKoutの方がKB外参照を識別できるという利点を示している。
論文 参考訳(メタデータ) (2023-02-14T17:00:06Z) - Uni-Parser: Unified Semantic Parser for Question Answering on Knowledge
Base and Database [86.03294330305097]
知識ベース(KB)とデータベース(DB)の両方で質問応答(QA)を統一した意味的要素を提案する。
フレームワークに不可欠な要素としてプリミティブ(KBのリレーションとエンティティ、テーブル名、列名、DBのセル値)を導入します。
生成元を利用して、異なる操作でトップランクプリミティブを変更・構成することで、最終的な論理形式を予測する。
論文 参考訳(メタデータ) (2022-11-09T19:33:27Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Generative Biomedical Entity Linking via Knowledge Base-Guided
Pre-training and Synonyms-Aware Fine-tuning [0.8154691566915505]
バイオメディカル・エンティティ・リンク(EL)のモデル化のための生成的アプローチを提案する。
そこで本研究では,KBの同義語と定義を用いた合成サンプルの構築により,KB指導による事前学習を提案する。
また、学習のための概念名を選択するためのシノニム対応の微調整を提案し、推論のためにデコーダプロンプトとマルチシンノニム制約付きプレフィックスツリーを提案する。
論文 参考訳(メタデータ) (2022-04-11T14:50:51Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Fast and Effective Biomedical Entity Linking Using a Dual Encoder [48.86736921025866]
文書中の複数の言及を1ショットで解決するBERTベースのデュアルエンコーダモデルを提案する。
本稿では,提案モデルが既存のBERTモデルよりも複数倍高速であり,バイオメディカルエンティティリンクの精度に競争力があることを示す。
論文 参考訳(メタデータ) (2021-03-08T19:32:28Z) - A Lightweight Neural Model for Biomedical Entity Linking [1.8047694351309205]
本論文では,生物医学的実体連携のための軽量ニューラル手法を提案する。
本手法では,アライメント層とアライメント機構を用いて参照とエンティティ名の違いをキャプチャする。
私達のモデルは標準的な評価のベンチマークの前の仕事と競争です。
論文 参考訳(メタデータ) (2020-12-16T10:34:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。