論文の概要: Extracting Lifestyle Factors for Alzheimer's Disease from Clinical Notes
Using Deep Learning with Weak Supervision
- arxiv url: http://arxiv.org/abs/2101.09244v2
- Date: Mon, 25 Jan 2021 03:42:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-20 21:20:47.145284
- Title: Extracting Lifestyle Factors for Alzheimer's Disease from Clinical Notes
Using Deep Learning with Weak Supervision
- Title(参考訳): 弱い指導を伴う深層学習を用いた臨床ノートからアルツハイマー病の生活習慣因子の抽出
- Authors: Zitao Shen, Yoonkwon Yi, Anusha Bompelli, Fang Yu, Yanshan Wang, Rui
Zhang
- Abstract要約: 本研究の目的は,自然言語処理モデル(NLP)がライフスタイル要因を分類できる可能性を示すことである。
BERTモデルの有効性を検証するために,身体活動と過剰食の2つの事例研究を行った。
弱い監視を生かした提案手法はサンプルサイズを大幅に増大させる可能性がある。
- 参考スコア(独自算出の注目度): 9.53786612243512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Since no effective therapies exist for Alzheimer's disease (AD), prevention
has become more critical through lifestyle factor changes and interventions.
Analyzing electronic health records (EHR) of patients with AD can help us
better understand lifestyle's effect on AD. However, lifestyle information is
typically stored in clinical narratives. Thus, the objective of the study was
to demonstrate the feasibility of natural language processing (NLP) models to
classify lifestyle factors (e.g., physical activity and excessive diet) from
clinical texts. We automatically generated labels for the training data by
using a rule-based NLP algorithm. We conducted weak supervision for pre-trained
Bidirectional Encoder Representations from Transformers (BERT) models on the
weakly labeled training corpus. These models include the BERT base model,
PubMedBERT(abstracts + full text), PubMedBERT(only abstracts), Unified Medical
Language System (UMLS) BERT, Bio BERT, and Bio-clinical BERT. We performed two
case studies: physical activity and excessive diet, in order to validate the
effectiveness of BERT models in classifying lifestyle factors for AD. These
models were compared on the developed Gold Standard Corpus (GSC) on the two
case studies. The PubmedBERT(Abs) model achieved the best performance for
physical activity, with its precision, recall, and F-1 scores of 0.96, 0.96,
and 0.96, respectively. Regarding classifying excessive diet, the Bio BERT
model showed the highest performance with perfect precision, recall, and F-1
scores. The proposed approach leveraging weak supervision could significantly
increase the sample size, which is required for training the deep learning
models. The study also demonstrates the effectiveness of BERT models for
extracting lifestyle factors for Alzheimer's disease from clinical notes.
- Abstract(参考訳): アルツハイマー病(AD)に対する効果的な治療法は存在しないため、ライフスタイルの変化や介入によって予防がより重要になっている。
AD患者の電子健康記録(EHR)の分析は、ADに対するライフスタイルの影響をよりよく理解するのに役立ちます。
しかし、ライフスタイル情報は典型的には臨床物語に保存される。
本研究の目的は, 生活習慣因子(身体活動や過度の食事など)を臨床テキストから分類するための自然言語処理(NLP)モデルの有効性を実証することであった。
ルールベースNLPアルゴリズムを用いてトレーニングデータのラベルを自動生成する。
弱ラベル付きトレーニングコーパス上で, BERTモデルから事前学習した双方向エンコーダ表現の弱い監視を行った。
これらのモデルには、BERTベースモデル、PubMedBERT (abstracts + full text)、PubMedBERT (only abstracts)、Unified Medical Language System (UMLS) BERT、Bio BERT、Bio-clinical BERTが含まれる。
生活習慣因子の分類におけるBERTモデルの有効性を検証するために,身体活動と過剰食の2つのケーススタディを行った。
これらのモデルは2つのケーススタディで開発されたゴールドスタンダードコーパス (gsc) で比較された。
PubmedBERT(Abs)モデルは、精度、リコール、F-1スコアはそれぞれ0.96、0.96、0.96で、身体活動において最高のパフォーマンスを達成した。
過度の食事の分類では,Bio BERTモデルが完全精度,リコール,F-1スコアで最高の成績を示した。
弱い監督を利用するアプローチは、ディープラーニングモデルのトレーニングに必要なサンプルサイズを大幅に増加させる可能性がある。
この研究は、臨床ノートからアルツハイマー病のライフスタイル因子を抽出するためのBERTモデルの有効性を示した。
関連論文リスト
- From Glucose Patterns to Health Outcomes: A Generalizable Foundation Model for Continuous Glucose Monitor Data Analysis [50.80532910808962]
GluFormerは、トランスフォーマーアーキテクチャに基づく生体医学的時間的データの生成基盤モデルである。
GluFormerは5つの地理的領域にまたがる4936人を含む15の異なる外部データセットに一般化されている。
今後4年間の健康状態も予測できる。
論文 参考訳(メタデータ) (2024-08-20T13:19:06Z) - Development and Validation of a Deep-Learning Model for Differential Treatment Benefit Prediction for Adults with Major Depressive Disorder Deployed in the Artificial Intelligence in Depression Medication Enhancement (AIDME) Study [0.622895724042048]
大うつ病(MDD)の薬理学的治療は、試行錯誤のアプローチに依存している。
治療結果のパーソナライズを目的とした人工知能(AI)モデルを導入する。
論文 参考訳(メタデータ) (2024-06-07T15:04:59Z) - Nurse-in-the-Loop Artificial Intelligence for Precision Management of
Type 2 Diabetes in a Clinical Trial Utilizing Transfer-Learned Predictive
Digital Twin [5.521385406191426]
本研究は, 予測ディジタルツイン(PDT)を利用したオンラインナース・イン・ザ・ループ予測制御(ONLC)モデルを開発した。
PDTは、最初の3ヶ月から参加者の自己モニタリングデータ(体重、食物ログ、身体活動、グルコース)をトレーニングした。
ONLCは介入グループに個別のフィードバックとテキストメッセージによるレコメンデーションを提供した。
論文 参考訳(メタデータ) (2024-01-05T06:38:50Z) - Bio+Clinical BERT, BERT Base, and CNN Performance Comparison for
Predicting Drug-Review Satisfaction [0.0]
我々は、BERTベースモデル、Bio+Clinical BERT、シンプルなCNNなど、いくつかの分類モデルを実装し、評価する。
以上の結果から,医療領域固有のBio+Clinical BERTモデルは,一般ドメインベースBERTモデルよりも有意に優れていた。
将来の研究は、各モデルの具体的な強みをどのように活用するかを探るかもしれない。
論文 参考訳(メタデータ) (2023-08-02T20:01:38Z) - Textual Data Augmentation for Patient Outcomes Prediction [67.72545656557858]
本稿では,患者の電子カルテに人工的な臨床ノートを作成するための新しいデータ拡張手法を提案する。
生成言語モデルGPT-2を微調整し、ラベル付きテキストを元のトレーニングデータで合成する。
今回,最も多い患者,すなわち30日間の寛解率について検討した。
論文 参考訳(メタデータ) (2022-11-13T01:07:23Z) - Fine-Tuning Large Neural Language Models for Biomedical Natural Language
Processing [55.52858954615655]
バイオメディカルNLPの微調整安定性に関する系統的研究を行った。
我々は、特に低リソース領域において、微調整性能は事前トレーニング設定に敏感であることを示した。
これらの技術は低リソースバイオメディカルNLPアプリケーションの微調整性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2021-12-15T04:20:35Z) - A Study of Social and Behavioral Determinants of Health in Lung Cancer
Patients Using Transformers-based Natural Language Processing Models [23.68697811086486]
社会的および行動的健康決定因子(SBDoH)は、人々の健康を形作る上で重要な役割を担っている。
現在の電子カルテシステムにおける構造化SBDoH情報の欠如による臨床成績におけるSBDoH因子の検討は限られている。
したがって、自然言語処理(NLP)は、構造化されていない臨床テキストからそのような情報を抽出する鍵となる技術である。
論文 参考訳(メタデータ) (2021-08-10T22:11:31Z) - Does BERT Pretrained on Clinical Notes Reveal Sensitive Data? [70.3631443249802]
我々は、トレーニングされたBERTからPersonal Health Informationを復元するためのアプローチのバッテリーを設計する。
具体的には,患者の名前と関連した状態の回復を試みている。
簡単な探索法では,MIMIC-IIIコーパス上で訓練されたBERTから機密情報を有意に抽出できないことがわかった。
論文 参考訳(メタデータ) (2021-04-15T20:40:05Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。