論文の概要: Ontology-Based and Weakly Supervised Rare Disease Phenotyping from
Clinical Notes
- arxiv url: http://arxiv.org/abs/2205.05656v1
- Date: Wed, 11 May 2022 17:38:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 18:50:07.195812
- Title: Ontology-Based and Weakly Supervised Rare Disease Phenotyping from
Clinical Notes
- Title(参考訳): 臨床ノートからのオントロジに基づく希少疾患の表現型化
- Authors: Hang Dong, V\'ictor Su\'arez-Paniagua, Huayu Zhang, Minhong Wang,
Arlene Casey, Emma Davidson, Jiaoyan Chen, Beatrice Alex, William Whiteley,
Honghan Wu
- Abstract要約: 機械学習やドメインの専門家によるデータアノテーションの必要性から、希少な疾患の特定は困難である。
本稿では、二方向変換器(BERTなど)からの事前学習した文脈表現を用いたパイプラインと弱い監視手法を提案する。
本研究は,米国と英国にある2つの機関の退院サマリーと放射線学報告の3つの臨床データセットに対するアプローチについて検討した。
- 参考スコア(独自算出の注目度): 13.096008602034086
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computational text phenotyping is the practice of identifying patients with
certain disorders and traits from clinical notes. Rare diseases are challenging
to be identified due to few cases available for machine learning and the need
for data annotation from domain experts. We propose a method using ontologies
and weak supervision, with recent pre-trained contextual representations from
Bi-directional Transformers (e.g. BERT). The ontology-based framework includes
two steps: (i) Text-to-UMLS, extracting phenotypes by contextually linking
mentions to concepts in Unified Medical Language System (UMLS), with a Named
Entity Recognition and Linking (NER+L) tool, SemEHR, and weak supervision with
customised rules and contextual mention representation; (ii) UMLS-to-ORDO,
matching UMLS concepts to rare diseases in Orphanet Rare Disease Ontology
(ORDO). The weakly supervised approach is proposed to learn a phenotype
confirmation model to improve Text-to-UMLS linking, without annotated data from
domain experts. We evaluated the approach on three clinical datasets of
discharge summaries and radiology reports from two institutions in the US and
the UK. Our best weakly supervised method achieved 81.4% precision and 91.4%
recall on extracting rare disease UMLS phenotypes from MIMIC-III discharge
summaries. The overall pipeline processing clinical notes can surface rare
disease cases, mostly uncaptured in structured data (manually assigned ICD
codes). Results on radiology reports from MIMIC-III and NHS Tayside were
consistent with the discharge summaries. We discuss the usefulness of the weak
supervision approach and propose directions for future studies.
- Abstract(参考訳): 計算テキスト表現型付け(compute text phenotyping)は、特定の疾患や特徴を有する患者を臨床ノートから識別する手法である。
機械学習やドメインの専門家によるデータアノテーションの必要性から、希少な疾患の特定は困難である。
本稿では,2方向変換器(BERTなど)から事前学習した文脈表現を用いたオントロジーと弱い監督手法を提案する。
オントロジーベースのフレームワークには2つのステップがある。
一 統一医療言語システム(UMLS)における概念への言及を文脈的にリンクすることで表現型を抽出し、名前付きエンティティ認識リンク(NER+L)ツール、SemEHR、カスタマイズされた規則及び文脈参照表現による弱い監督を行う。
(II) Orphanet Rare Disease Ontology (ORDO)におけるUMLS概念と希少疾患との整合性。
弱教師付きアプローチは、ドメインの専門家による注釈付きデータなしで、テキスト-UMLSリンクを改善するための表現型確認モデルを学ぶために提案される。
本研究は,米国と英国の2つの機関から排出サマリーと放射線学報告の3つの臨床データセットについて検討した。
MIMIC-III放電サマリーからレア疾患UMLS表現型を抽出し81.4%の精度と91.4%のリコールを得た。
パイプライン処理全体の臨床ノートは、ほとんどが構造化データ(icdコード)に格納されていないまれな疾患の症例を表面化することができる。
MIMIC-III, NHS Taysideの放射線検査所見は, 放電サマリーと一致していた。
我々は,弱い監督手法の有用性を議論し,今後の研究の方向性を提案する。
関連論文リスト
- Improving Extraction of Clinical Event Contextual Properties from Electronic Health Records: A Comparative Study [2.0884301753594334]
本研究は,医学テキスト分類のための様々な自然言語モデルの比較分析を行う。
BERTはBi-LSTMモデルを最大28%、ベースラインのBERTモデルを最大16%上回り、マイノリティクラスをリコールする。
論文 参考訳(メタデータ) (2024-08-30T10:28:49Z) - Potential of Multimodal Large Language Models for Data Mining of Medical Images and Free-text Reports [51.45762396192655]
特にGemini-Vision-Series (Gemini) と GPT-4-Series (GPT-4) は、コンピュータビジョンのための人工知能のパラダイムシフトを象徴している。
本研究は,14の医用画像データセットを対象に,Gemini,GPT-4,および4つの一般的な大規模モデルの性能評価を行った。
論文 参考訳(メタデータ) (2024-07-08T09:08:42Z) - SNOBERT: A Benchmark for clinical notes entity linking in the SNOMED CT clinical terminology [43.89160296332471]
本稿では,BERT モデルを用いた SNOMED CT のテキストスパンと特定の概念をリンクする手法を提案する。
本手法は, 候補選択と候補マッチングの2段階からなる。これらのモデルは, ラベル付き臨床ノートの公開データセットの中で, 最大規模で訓練された。
論文 参考訳(メタデータ) (2024-05-25T08:00:44Z) - Cross-Modal Causal Intervention for Medical Report Generation [109.83549148448469]
医療報告生成(MRG)は、コンピュータ支援診断と治療指導に不可欠である。
視覚的および言語的バイアスによって引き起こされる画像テキストデータ内の素早い相関のため、病変領域を確実に記述した正確なレポートを生成することは困難である。
本稿では,視覚分解モジュール (VDM) と言語分解モジュール (LDM) からなるMRGのための新しい視覚言語因果干渉 (VLCI) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-16T07:23:55Z) - MedKLIP: Medical Knowledge Enhanced Language-Image Pre-Training in
Radiology [40.52487429030841]
医用医用視覚言語事前訓練を専門知識と組み合わせて行うことを検討する。
まず, 生の報告を直接処理する既存の作業とは異なり, 医療関連情報を抽出するために, 新規な三重項抽出モジュールを採用する。
第2に,医療分野における豊富な知識を活用するために,知識ベースを問合せすることで,エンティティ翻訳を伴う新しい三重項符号化モジュールを提案する。
第3に、トランスフォーマーを用いた融合モデルを用いて、画像パッチレベルでの実体記述と視覚信号との空間的整合を図り、診断を可能にすることを提案する。
論文 参考訳(メタデータ) (2023-01-05T18:55:09Z) - A Marker-based Neural Network System for Extracting Social Determinants
of Health [12.6970199179668]
健康の社会的決定因子(SDoH)は、患者の医療の質と格差を左右する。
多くのSDoHアイテムは、電子健康記録の構造化形式でコード化されていない。
我々は,臨床ノートから自動的にSDoH情報を抽出する,名前付きエンティティ認識(NER),関係分類(RC),テキスト分類手法を含む多段階パイプラインを探索する。
論文 参考訳(メタデータ) (2022-12-24T18:40:23Z) - Medical Image Captioning via Generative Pretrained Transformers [57.308920993032274]
我々は、Show-Attend-Tell と GPT-3 という2つの言語モデルを組み合わせて、包括的で記述的な放射線学記録を生成する。
提案モデルは、Open-I、MIMIC-CXR、汎用MS-COCOの2つの医療データセットで検証される。
論文 参考訳(メタデータ) (2022-09-28T10:27:10Z) - Self-supervised Answer Retrieval on Clinical Notes [68.87777592015402]
本稿では,ドメイン固有パスマッチングのためのトランスフォーマー言語モデルをトレーニングするためのルールベースのセルフスーパービジョンであるCAPRを紹介する。
目的をトランスフォーマーベースの4つのアーキテクチャ、コンテキスト文書ベクトル、ビ-、ポリエンコーダ、クロスエンコーダに適用する。
本稿では,ドメイン固有パスの検索において,CAPRが強いベースラインを上回り,ルールベースおよび人間ラベル付きパスを効果的に一般化することを示す。
論文 参考訳(メタデータ) (2021-08-02T10:42:52Z) - MIMO: Mutual Integration of Patient Journey and Medical Ontology for
Healthcare Representation Learning [49.57261599776167]
本稿では、医療表現学習と予測分析のための、エンドツーエンドの堅牢なトランスフォーマーベースのソリューション、患者旅行の相互統合、医療オントロジー(MIMO)を提案する。
論文 参考訳(メタデータ) (2021-07-20T07:04:52Z) - Rare Disease Identification from Clinical Notes with Ontologies and Weak
Supervision [3.6471045233540806]
テキストからUMLSのプロセスは、ドメインの専門家による注釈付きデータなしで、監督の弱さで大幅に改善できることを示す。
解析の結果, パイプライン処理の総放電サマリーは, 病院入院時の手動ICDコードにほとんど含まれていないケースを表面化できることがわかった。
論文 参考訳(メタデータ) (2021-05-05T11:49:09Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。