論文の概要: Cross-Domain Data Integration for Named Entity Disambiguation in
Biomedical Text
- arxiv url: http://arxiv.org/abs/2110.08228v1
- Date: Fri, 15 Oct 2021 17:38:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 12:51:21.032760
- Title: Cross-Domain Data Integration for Named Entity Disambiguation in
Biomedical Text
- Title(参考訳): バイオメディカルテキストにおける名前付きエンティティの曖昧化のためのドメイン間データ統合
- Authors: Maya Varma, Laurel Orr, Sen Wu, Megan Leszczynski, Xiao Ling,
Christopher R\'e
- Abstract要約: 本稿では,一般的なテキスト知識ベースから医療領域へ構造的知識を伝達するクロスドメインデータ統合手法を提案する。
我々は,我々の統合手法を利用して構造資源を増強し,事前学習のための大規模なバイオメディカルNEDデータセットを生成する。
MedMentions と BC5CDR という2つのベンチマーク医学NEDデータセット上で, 最先端のパフォーマンスを実現するために, 構造知識を注入した事前学習モデルを構築した。
- 参考スコア(独自算出の注目度): 5.008513565240167
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity disambiguation (NED), which involves mapping textual mentions to
structured entities, is particularly challenging in the medical domain due to
the presence of rare entities. Existing approaches are limited by the presence
of coarse-grained structural resources in biomedical knowledge bases as well as
the use of training datasets that provide low coverage over uncommon resources.
In this work, we address these issues by proposing a cross-domain data
integration method that transfers structural knowledge from a general text
knowledge base to the medical domain. We utilize our integration scheme to
augment structural resources and generate a large biomedical NED dataset for
pretraining. Our pretrained model with injected structural knowledge achieves
state-of-the-art performance on two benchmark medical NED datasets: MedMentions
and BC5CDR. Furthermore, we improve disambiguation of rare entities by up to 57
accuracy points.
- Abstract(参考訳): テキスト記述を構造化エンティティにマッピングする名前付きエンティティ曖昧化(NED)は、まれなエンティティの存在のため、医療分野において特に困難である。
既存のアプローチは、生体医学的知識ベースに粒度の粗い構造的リソースの存在と、稀なリソースに対して低いカバレッジを提供するトレーニングデータセットの使用によって制限されている。
本稿では,一般的なテキスト知識ベースから医学領域へ構造知識を転送するクロスドメインデータ統合手法を提案する。
我々は,この統合手法を用いて構造的資源を増強し,事前学習のための大規模生体医学的nedデータセットを生成する。
MedMentions と BC5CDR という2つのベンチマーク医学NEDデータセット上で, 最先端のパフォーマンスを実現する。
さらに,レアエンティティの曖昧さを最大57個の精度ポイントで改善する。
関連論文リスト
- EMBRE: Entity-aware Masking for Biomedical Relation Extraction [12.821610050561256]
本稿では,関係抽出のためのEMBRE (Entity-Aware Masking for Biomedical Relation extract) 法を提案する。
具体的には、バックボーンモデルとエンティティマスキングの目的を事前学習することにより、エンティティ知識をディープニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2024-01-15T18:12:01Z) - Source-Free Collaborative Domain Adaptation via Multi-Perspective
Feature Enrichment for Functional MRI Analysis [55.03872260158717]
安静時MRI機能(rs-fMRI)は、神経疾患の分析を助けるために多地点で研究されている。
ソース領域とターゲット領域の間のfMRIの不均一性を低減するための多くの手法が提案されている。
しかし、マルチサイト研究における懸念やデータストレージの負担のため、ソースデータの取得は困難である。
我々は、fMRI解析のためのソースフリー協調ドメイン適応フレームワークを設計し、事前訓練されたソースモデルとラベルなしターゲットデータのみにアクセスできるようにする。
論文 参考訳(メタデータ) (2023-08-24T01:30:18Z) - Source-Free Domain Adaptation for Medical Image Segmentation via
Prototype-Anchored Feature Alignment and Contrastive Learning [57.43322536718131]
医用画像セグメンテーションのための2段階のソースフリードメイン適応(SFDA)フレームワークを提案する。
プロトタイプアンコールされた特徴アライメントの段階では,まず,事前学習した画素ワイド分類器の重みを原プロトタイプとして利用する。
そこで,本研究では,目標となる特徴とクラスプロトタイプとの整合性を期待するコストを最小化し,双方向輸送を導入する。
論文 参考訳(メタデータ) (2023-07-19T06:07:12Z) - SMC-UDA: Structure-Modal Constraint for Unsupervised Cross-Domain Renal
Segmentation [100.86339246424541]
本稿では、識別パラダイムに基づく新しい構造モード制約(SMC) UDA フレームワークを提案し、ドメイン間のブリッジとしてエッジ構造を導入する。
構造に制約のある自己学習とプログレッシブROIでは,エッジの3次元空間構造を見極めることで腎臓を分節する。
実験の結果,提案するSMC-UDAの一般化は良好であり,生成的UDA法よりも優れていた。
論文 参考訳(メタデータ) (2023-06-14T02:57:23Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Biomedical Entity Linking with Contrastive Context Matching [5.2710726359379265]
バイオメディカルエンティティリンクのための対照的な学習フレームワークであるBioCoMを紹介する。
生のPubMed記事から辞書マッチングによるトレーニングインスタンスを構築する。
最寄りのサーチにより,生物医学の正規化を推論時に予測する。
論文 参考訳(メタデータ) (2021-06-14T16:43:33Z) - DARCNN: Domain Adaptive Region-based Convolutional Neural Network for
Unsupervised Instance Segmentation in Biomedical Images [4.3171602814387136]
ベンチマークコンピュータビジョンデータセットのアノテーションを多用し、多様なバイオメディカルデータセットに対して教師なしのインスタンスセグメンテーションを実行することを提案する。
本研究では,COCOからのオブジェクト定義の知識を複数のバイオメディカルデータセットに適用するドメイン適応型領域ベース畳み込みニューラルネットワーク(DARCNN)を提案する。
多数のバイオメディカルデータセット上での教師なしインスタンスセグメンテーションにおけるDARCNNの性能を示す。
論文 参考訳(メタデータ) (2021-04-03T06:54:33Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - MeDAL: Medical Abbreviation Disambiguation Dataset for Natural Language
Understanding Pretraining [5.807159674193696]
略語用大容量医療用テキストデータセットであるMeDALについて述べる。
このデータセット上で共通アーキテクチャのモデルをいくつか事前トレーニングし,その事前トレーニングが下流医療タスクの微調整時のパフォーマンス向上と収束速度の向上につながることを実証的に示した。
論文 参考訳(メタデータ) (2020-12-27T17:17:39Z) - Towards Cross-modality Medical Image Segmentation with Online Mutual
Knowledge Distillation [71.89867233426597]
本稿では,あるモダリティから学習した事前知識を活用し,別のモダリティにおけるセグメンテーション性能を向上させることを目的とする。
モーダル共有知識を徹底的に活用する新しい相互知識蒸留法を提案する。
MMWHS 2017, MMWHS 2017 を用いた多クラス心筋セグメンテーション実験の結果, CT セグメンテーションに大きな改善が得られた。
論文 参考訳(メタデータ) (2020-10-04T10:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。