論文の概要: Partial Annotation Learning for Biomedical Entity Recognition
- arxiv url: http://arxiv.org/abs/2305.13120v1
- Date: Mon, 22 May 2023 15:18:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-23 15:07:31.823517
- Title: Partial Annotation Learning for Biomedical Entity Recognition
- Title(参考訳): バイオメディカルエンティティ認識のための部分アノテーション学習
- Authors: Liangping Ding, Giovanni Colavizza, Zhixiong Zhang
- Abstract要約: 部分的アノテーション学習法は, 実体アノテーションの欠如により, バイオメディカルコーパスから効果的に学習できることが示唆された。
提案手法は代替品よりも優れており,特にPubMedBERTタグをF1スコアで38%向上させる。
- 参考スコア(独自算出の注目度): 0.19336815376402716
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Motivation: Named Entity Recognition (NER) is a key task to support
biomedical research. In Biomedical Named Entity Recognition (BioNER), obtaining
high-quality expert annotated data is laborious and expensive, leading to the
development of automatic approaches such as distant supervision. However,
manually and automatically generated data often suffer from the unlabeled
entity problem, whereby many entity annotations are missing, degrading the
performance of full annotation NER models. Results: To address this problem, we
systematically study the effectiveness of partial annotation learning methods
for biomedical entity recognition over different simulated scenarios of missing
entity annotations. Furthermore, we propose a TS-PubMedBERT-Partial-CRF partial
annotation learning model. We harmonize 15 biomedical NER corpora encompassing
five entity types to serve as a gold standard and compare against two commonly
used partial annotation learning models, BiLSTM-Partial-CRF and EER-PubMedBERT,
and the state-of-the-art full annotation learning BioNER model PubMedBERT
tagger. Results show that partial annotation learning-based methods can
effectively learn from biomedical corpora with missing entity annotations. Our
proposed model outperforms alternatives and, specifically, the PubMedBERT
tagger by 38% in F1-score under high missing entity rates. The recall of entity
mentions in our model is also competitive with the upper bound on the fully
annotated dataset.
- Abstract(参考訳): モチベーション(Motivation: Named Entity Recognition, NER)は、生物医学研究を支援する重要なタスクである。
バイオメディカルネーム付きエンティティ認識(BioNER)では、高品質なアノテートされたデータを取得することは、手間とコストがかかり、遠隔監視のような自動アプローチが開発される。
しかし、手動で自動生成されるデータは、多くのエンティティアノテーションが欠落している未ラベルのエンティティ問題に悩まされ、完全なアノテーションNERモデルの性能が低下する。
結果: 本課題に対処するために, 生物医学的エンティティ認識における部分的アノテーション学習手法の有効性を, 様々なシミュレーションシナリオにおいて体系的に検討した。
さらに,TS-PubMedBERT-Partial-CRF部分アノテーション学習モデルを提案する。
我々は,5種類の生物医学的NERコーパスをゴールドスタンダードとして使用し,BiLSTM-Partial-CRFとEER-PubMedBERTという2つの一般的な部分的アノテーション学習モデルと,最先端のバイオNERモデルPubMedBERTタグとを比較した。
その結果, 部分的アノテーション学習法は, 実体的アノテーションを欠くバイオメディカルコーパスから効果的に学習できることが示唆された。
提案モデルは代替品,特にf1-scoreのpubmedbert taggerを高い損失率で38%向上させた。
私たちのモデルにおけるエンティティの参照のリコールは、完全に注釈付けされたデータセットの上限とも競合します。
関連論文リスト
- EMBRE: Entity-aware Masking for Biomedical Relation Extraction [12.821610050561256]
本稿では,関係抽出のためのEMBRE (Entity-Aware Masking for Biomedical Relation extract) 法を提案する。
具体的には、バックボーンモデルとエンティティマスキングの目的を事前学習することにより、エンティティ知識をディープニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2024-01-15T18:12:01Z) - From Zero to Hero: Harnessing Transformers for Biomedical Named Entity Recognition in Zero- and Few-shot Contexts [0.0]
本稿では,生物医学領域におけるゼロショットNERと少数ショットNERの手法を提案する。
我々は、ゼロショットNERが35.44%、ワンショットNERが50.10%、10ショットNERが69.94%、100ショットNERが79.51%の平均スコアを達成した。
論文 参考訳(メタデータ) (2023-05-05T12:14:22Z) - AIONER: All-in-one scheme-based biomedical named entity recognition
using deep learning [7.427654811697884]
AIONERは最先端のディープラーニングとAIOスキーマに基づく汎用BioNERツールである。
AIONERは効果的で堅牢で、マルチタスク学習のような最先端のアプローチと好適に比較できる。
論文 参考訳(メタデータ) (2022-11-30T12:35:00Z) - Nested Named Entity Recognition from Medical Texts: An Adaptive Shared
Network Architecture with Attentive CRF [53.55504611255664]
ネスト現象によるジレンマを解決するために,ASACと呼ばれる新しい手法を提案する。
提案手法は,適応共有(AS)部と注意条件付きランダムフィールド(ACRF)モジュールの2つの鍵モジュールを含む。
我々のモデルは、異なるカテゴリのエンティティ間の暗黙の区別と関係をキャプチャすることで、より良いエンティティ表現を学ぶことができる。
論文 参考訳(メタデータ) (2022-11-09T09:23:56Z) - Knowledge-Rich Self-Supervised Entity Linking [58.838404666183656]
Knowledge-RIch Self-Supervision(KRISSBERT$)は400万のUMLSエンティティのためのユニバーサルエンティティリンカーである。
提案手法はゼロショット法と少数ショット法を仮定し,利用可能であればエンティティ記述やゴールドレファレンスラベルを簡単に組み込むことができる。
ラベル付き情報を一切使わずに400万のUMLSエンティティのためのユニバーサルエンティティリンカである$tt KRISSBERT$を生成する。
論文 参考訳(メタデータ) (2021-12-15T05:05:12Z) - Biomedical Interpretable Entity Representations [40.6095537182194]
事前訓練された言語モデルは、エンティティ中心のNLPタスクに強力なパフォーマンスを提供する密度の高いエンティティ表現を誘導する。
これは、バイオメディシンのような重要な領域における取り込みをモデル化するための障壁となる。
我々は、バイオメディカルテキストの大規模なコーパスから、新しいエンティティ型システムとトレーニングセットを作成する。
論文 参考訳(メタデータ) (2021-06-17T13:52:10Z) - Fast and Effective Biomedical Entity Linking Using a Dual Encoder [48.86736921025866]
文書中の複数の言及を1ショットで解決するBERTベースのデュアルエンコーダモデルを提案する。
本稿では,提案モデルが既存のBERTモデルよりも複数倍高速であり,バイオメディカルエンティティリンクの精度に競争力があることを示す。
論文 参考訳(メタデータ) (2021-03-08T19:32:28Z) - A Teacher-Student Framework for Semi-supervised Medical Image
Segmentation From Mixed Supervision [62.4773770041279]
そこで我々は,臓器と病変のセグメンテーションのための教師と学生のスタイルに基づくセミ教師付き学習フレームワークを開発した。
我々は,本モデルがバウンディングボックスの品質に対して堅牢であることを示し,フル教師付き学習手法と比較した性能を実現する。
論文 参考訳(メタデータ) (2020-10-23T07:58:20Z) - Dual-Teacher: Integrating Intra-domain and Inter-domain Teachers for
Annotation-efficient Cardiac Segmentation [65.81546955181781]
本稿では,新しい半教師付きドメイン適応手法,すなわちDual-Teacherを提案する。
学生モデルは、2つの教師モデルによってラベル付けされていない対象データとラベル付けされた情報源データの知識を学習する。
提案手法では, ラベルなしデータとモダリティ間データとを並列に利用でき, 性能が向上することを示した。
論文 参考訳(メタデータ) (2020-07-13T10:00:44Z) - ATSO: Asynchronous Teacher-Student Optimization for Semi-Supervised
Medical Image Segmentation [99.90263375737362]
教師-学生最適化の非同期版であるATSOを提案する。
ATSOはラベルのないデータを2つのサブセットに分割し、モデルの微調整に1つのサブセットを交互に使用し、他のサブセットのラベルを更新する。
医用画像のセグメンテーションデータセットを2つ評価し,様々な半教師付き環境において優れた性能を示す。
論文 参考訳(メタデータ) (2020-06-24T04:05:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。