論文の概要: Cross-Domain Data Integration for Named Entity Disambiguation in
Biomedical Text
- arxiv url: http://arxiv.org/abs/2110.08228v1
- Date: Fri, 15 Oct 2021 17:38:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-18 12:51:21.032760
- Title: Cross-Domain Data Integration for Named Entity Disambiguation in
Biomedical Text
- Title(参考訳): バイオメディカルテキストにおける名前付きエンティティの曖昧化のためのドメイン間データ統合
- Authors: Maya Varma, Laurel Orr, Sen Wu, Megan Leszczynski, Xiao Ling,
Christopher R\'e
- Abstract要約: 本稿では,一般的なテキスト知識ベースから医療領域へ構造的知識を伝達するクロスドメインデータ統合手法を提案する。
我々は,我々の統合手法を利用して構造資源を増強し,事前学習のための大規模なバイオメディカルNEDデータセットを生成する。
MedMentions と BC5CDR という2つのベンチマーク医学NEDデータセット上で, 最先端のパフォーマンスを実現するために, 構造知識を注入した事前学習モデルを構築した。
- 参考スコア(独自算出の注目度): 5.008513565240167
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Named entity disambiguation (NED), which involves mapping textual mentions to
structured entities, is particularly challenging in the medical domain due to
the presence of rare entities. Existing approaches are limited by the presence
of coarse-grained structural resources in biomedical knowledge bases as well as
the use of training datasets that provide low coverage over uncommon resources.
In this work, we address these issues by proposing a cross-domain data
integration method that transfers structural knowledge from a general text
knowledge base to the medical domain. We utilize our integration scheme to
augment structural resources and generate a large biomedical NED dataset for
pretraining. Our pretrained model with injected structural knowledge achieves
state-of-the-art performance on two benchmark medical NED datasets: MedMentions
and BC5CDR. Furthermore, we improve disambiguation of rare entities by up to 57
accuracy points.
- Abstract(参考訳): テキスト記述を構造化エンティティにマッピングする名前付きエンティティ曖昧化(NED)は、まれなエンティティの存在のため、医療分野において特に困難である。
既存のアプローチは、生体医学的知識ベースに粒度の粗い構造的リソースの存在と、稀なリソースに対して低いカバレッジを提供するトレーニングデータセットの使用によって制限されている。
本稿では,一般的なテキスト知識ベースから医学領域へ構造知識を転送するクロスドメインデータ統合手法を提案する。
我々は,この統合手法を用いて構造的資源を増強し,事前学習のための大規模生体医学的nedデータセットを生成する。
MedMentions と BC5CDR という2つのベンチマーク医学NEDデータセット上で, 最先端のパフォーマンスを実現する。
さらに,レアエンティティの曖昧さを最大57個の精度ポイントで改善する。
関連論文リスト
- LoRKD: Low-Rank Knowledge Decomposition for Medical Foundation Models [59.961172635689664]
知識分解」は、特定の医療課題のパフォーマンス向上を目的としている。
我々はLow-Rank Knowledge Decomposition(LoRKD)という新しいフレームワークを提案する。
LoRKDは、低ランクのエキスパートモジュールと効率的な知識分離畳み込みを組み込むことで、グラデーションを異なるタスクから明確に分離する。
論文 参考訳(メタデータ) (2024-09-29T03:56:21Z) - BioMNER: A Dataset for Biomedical Method Entity Recognition [25.403593761614424]
本稿では,生物医学的手法による実体認識のための新しいデータセットを提案する。
我々は、人間のアノテーションを支援するために、自動的なBioMethodエンティティ認識と情報検索システムを採用している。
実験の結果,言語モデルのパラメータ数が大きくなると,実体抽出パターンの有効同化が著しく阻害されることが判明した。
論文 参考訳(メタデータ) (2024-06-28T16:34:24Z) - Efficient Biomedical Entity Linking: Clinical Text Standardization with Low-Resource Techniques [0.0]
複数の用語は、臨床エンティティと呼ばれることができる同じコア概念を参照することができる。
UMLS(Unified Medical Language System)のようなオントロジーは、何百万もの臨床エンティティを格納するために開発・維持されている。
そこで本稿では,エンティティの曖昧さを解消するために,コンテキストベースとコンテキストレスの省力化手法を提案する。
論文 参考訳(メタデータ) (2024-05-24T01:14:33Z) - Medical Vision-Language Pre-Training for Brain Abnormalities [96.1408455065347]
本稿では,PubMedなどの公共リソースから,医用画像・テキスト・アライメントデータを自動的に収集する方法を示す。
特に,まず大きな脳画像テキストデータセットを収集することにより,事前学習プロセスの合理化を図るパイプラインを提案する。
また,医療領域におけるサブフィギュアをサブキャプションにマッピングするというユニークな課題についても検討した。
論文 参考訳(メタデータ) (2024-04-27T05:03:42Z) - SMC-UDA: Structure-Modal Constraint for Unsupervised Cross-Domain Renal
Segmentation [100.86339246424541]
本稿では、識別パラダイムに基づく新しい構造モード制約(SMC) UDA フレームワークを提案し、ドメイン間のブリッジとしてエッジ構造を導入する。
構造に制約のある自己学習とプログレッシブROIでは,エッジの3次元空間構造を見極めることで腎臓を分節する。
実験の結果,提案するSMC-UDAの一般化は良好であり,生成的UDA法よりも優れていた。
論文 参考訳(メタデータ) (2023-06-14T02:57:23Z) - EBOCA: Evidences for BiOmedical Concepts Association Ontology [55.41644538483948]
本論文は,生物医学領域の概念とそれらの関連性を記述するオントロジーであるEBOCAと,それらの関連性を支持するエビデンスを提案する。
DISNETのサブセットから得られるテストデータとテキストからの自動アソシエーション抽出が変換され、実際のシナリオで使用できる知識グラフが作成されるようになった。
論文 参考訳(メタデータ) (2022-08-01T18:47:03Z) - Biomedical Entity Linking with Contrastive Context Matching [5.2710726359379265]
バイオメディカルエンティティリンクのための対照的な学習フレームワークであるBioCoMを紹介する。
生のPubMed記事から辞書マッチングによるトレーニングインスタンスを構築する。
最寄りのサーチにより,生物医学の正規化を推論時に予測する。
論文 参考訳(メタデータ) (2021-06-14T16:43:33Z) - DARCNN: Domain Adaptive Region-based Convolutional Neural Network for
Unsupervised Instance Segmentation in Biomedical Images [4.3171602814387136]
ベンチマークコンピュータビジョンデータセットのアノテーションを多用し、多様なバイオメディカルデータセットに対して教師なしのインスタンスセグメンテーションを実行することを提案する。
本研究では,COCOからのオブジェクト定義の知識を複数のバイオメディカルデータセットに適用するドメイン適応型領域ベース畳み込みニューラルネットワーク(DARCNN)を提案する。
多数のバイオメディカルデータセット上での教師なしインスタンスセグメンテーションにおけるDARCNNの性能を示す。
論文 参考訳(メタデータ) (2021-04-03T06:54:33Z) - A Meta-embedding-based Ensemble Approach for ICD Coding Prediction [64.42386426730695]
国際疾病分類 (icd) は、世界中で臨床コーディングに使われているデファクトコードである。
これらのコードにより、医療提供者は償還を請求し、診断情報の効率的な保管と検索を容易にします。
提案手法は,日常的な医学データと科学論文の外部知識を用いて,効果的に単語ベクトルを訓練することにより,神経モデルの性能を高める。
論文 参考訳(メタデータ) (2021-02-26T17:49:58Z) - Towards Cross-modality Medical Image Segmentation with Online Mutual
Knowledge Distillation [71.89867233426597]
本稿では,あるモダリティから学習した事前知識を活用し,別のモダリティにおけるセグメンテーション性能を向上させることを目的とする。
モーダル共有知識を徹底的に活用する新しい相互知識蒸留法を提案する。
MMWHS 2017, MMWHS 2017 を用いた多クラス心筋セグメンテーション実験の結果, CT セグメンテーションに大きな改善が得られた。
論文 参考訳(メタデータ) (2020-10-04T10:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。