論文の概要: Hybrid deep learning methods for phenotype prediction from clinical
notes
- arxiv url: http://arxiv.org/abs/2108.10682v1
- Date: Mon, 16 Aug 2021 05:57:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-29 12:12:18.524870
- Title: Hybrid deep learning methods for phenotype prediction from clinical
notes
- Title(参考訳): 臨床ノートからの表現型予測のためのハイブリッド深層学習法
- Authors: Sahar Khalafi, Nasser Ghadiri and Milad Moradi
- Abstract要約: 本稿では,自然言語処理とディープラーニングモデルを用いて,患者表現型を自動的に抽出するハイブリッドモデルを提案する。
提案したハイブリッドモデルは,患者の退院報告における表現型を特定するために,ニューラル双方向シーケンスモデル(BiLSTMまたはBiGRU)と畳み込みニューラルネットワーク(CNN)に基づいている。
- 参考スコア(独自算出の注目度): 4.866431869728018
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Identifying patient cohorts from clinical notes in secondary electronic
health records is a fundamental task in clinical information management. The
patient cohort identification needs to identify the patient phenotypes.
However, with the growing number of clinical notes, it becomes challenging to
analyze the data manually. Therefore, automatic extraction of clinical concepts
would be an essential task to identify the patient phenotypes correctly. This
paper proposes a novel hybrid model for automatically extracting patient
phenotypes using natural language processing and deep learning models to
determine the patient phenotypes without dictionaries and human intervention.
The proposed hybrid model is based on a neural bidirectional sequence model
(BiLSTM or BiGRU) and a Convolutional Neural Network (CNN) for identifying
patient's phenotypes in discharge reports. Furthermore, to extract more
features related to each phenotype, an extra CNN layer is run parallel to the
hybrid proposed model. We used pre-trained embeddings such as FastText and
Word2vec separately as the input layers to evaluate other embedding's
performance in identifying patient phenotypes. We also measured the effect of
applying additional data cleaning steps on discharge reports to identify
patient phenotypes by deep learning models. We used discharge reports in the
Medical Information Mart for Intensive Care III (MIMIC III) database.
Experimental results in internal comparison demonstrate significant performance
improvement over existing models. The enhanced model with an extra CNN layer
obtained a relatively higher F1-score than the original hybrid model.
- Abstract(参考訳): 二次電子健康記録における臨床ノートから患者コホートを同定することは臨床情報管理の基本的な課題である。
患者コホート識別は、患者表現型を特定する必要がある。
しかし,臨床ノート数の増加に伴い,手作業で分析することが困難になっている。
したがって, 臨床概念の自動抽出は, 患者表現型を正しく同定するための必須課題となる。
本稿では,自然言語処理とディープラーニングモデルを用いて患者表現型を自動的に抽出し,辞書や人的介入なしに患者表現型を決定するハイブリッドモデルを提案する。
提案するハイブリッドモデルは,神経双方向シーケンスモデル(bilstmまたはbigru)と畳み込みニューラルネットワーク(cnn)に基づいて,退院報告における患者の表現型を同定する。
さらに、各表現型に関するより多くの特徴を抽出するために、追加のcnn層をハイブリッドモデルと並列に実行する。
入力層としてfasttext や word2vec などの事前学習された埋め込みを使い,患者表現型同定における他の埋め込みの性能評価を行った。
また,深層学習モデルによる患者の表現型識別のための退院報告に対する追加データクリーニングステップの適用効果も測定した。
集中治療iii(mimic iii)データベースのための医療情報マート(medical information mart)における退院報告を用いた。
内部比較実験の結果,既存モデルよりも性能が向上した。
追加のcnn層を持つ拡張モデルは、元のハイブリッドモデルよりも比較的高いf1-scoreを得た。
関連論文リスト
- TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - PheME: A deep ensemble framework for improving phenotype prediction from
multi-modal data [42.56953523499849]
PheMEは, 構造化EHRのマルチモーダルデータを用いたアンサンブル・フレームワークであり, 非構造化臨床ノートを用いて, 正確なフェノタイプ予測を行う。
我々はアンサンブル学習を活用し、単一モーダルモデルと多モーダルモデルからの出力を組み合わせて表現型予測を改善する。
論文 参考訳(メタデータ) (2023-03-19T23:41:04Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - A cost-based multi-layer network approach for the discovery of patient
phenotypes [2.816539638885011]
コミュニティ検出手法を用いて表現型を検出するためのコストベース層セレクタモデルを提案する。
私たちのゴールは、その品質を維持しながら、これらの表現型を構築するのに使用される機能の数を最小化することです。
いくつかの後処理変数では、COBALTの表現型を特徴とする予測子は、従来のクラスタリング法で検出された表現型よりも優れていた。
論文 参考訳(メタデータ) (2022-09-19T14:07:10Z) - Bridging the Gap Between Patient-specific and Patient-independent
Seizure Prediction via Knowledge Distillation [7.2666838978096875]
既存のアプローチは通常、てんかんの信号の高度にパーソナライズされた特性のために、患者固有の方法でモデルを訓練する。
患者固有のモデルは、蒸留された知識と追加のパーソナライズされたデータによって得られる。
提案手法を用いて,CHB-MIT sEEGデータベース上で5つの最先端の発作予測法を訓練する。
論文 参考訳(メタデータ) (2022-02-25T10:30:29Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Neural Language Models with Distant Supervision to Identify Major
Depressive Disorder from Clinical Notes [2.1060613825447407]
大うつ病 (Major depressive disorder, MDD) は、世界中で深刻な医療負担を伴う精神疾患である。
近年、Bidirectional Representations for Transformers (BERT) モデルなどのニューラルネットワークモデルが進歩し、最先端のニューラルネットワークモデルが生まれた。
臨床ノートからMDD表現型を同定するために,遠隔監視パラダイムでニューラルネットワークモデルを活用することを提案する。
論文 参考訳(メタデータ) (2021-04-19T21:11:41Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z) - Towards Patient Record Summarization Through Joint Phenotype Learning in
HIV Patients [1.598617270887469]
本研究では、構造化データと非構造化データにまたがる多数の表現型/プロブレムを共同で学習する、教師なし表現型化手法を提案する。
我々は,大都市医療施設のHIVクリニックから患者を表現型化する実験を行った。
臨床専門家による評価では,学習した表現型とその関連性は臨床的に有効であることが判明した。
論文 参考訳(メタデータ) (2020-03-09T15:41:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。