論文の概要: A Study of Social and Behavioral Determinants of Health in Lung Cancer
Patients Using Transformers-based Natural Language Processing Models
- arxiv url: http://arxiv.org/abs/2108.04949v1
- Date: Tue, 10 Aug 2021 22:11:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 13:40:33.471970
- Title: A Study of Social and Behavioral Determinants of Health in Lung Cancer
Patients Using Transformers-based Natural Language Processing Models
- Title(参考訳): トランスフォーマーに基づく自然言語処理モデルを用いた肺癌患者の健康の社会的・行動的要因の検討
- Authors: Zehao Yu, Xi Yang, Chong Dang, Songzi Wu, Prakash Adekkanattu,
Jyotishman Pathak, Thomas J. George, William R. Hogan, Yi Guo, Jiang Bian,
Yonghui Wu
- Abstract要約: 社会的および行動的健康決定因子(SBDoH)は、人々の健康を形作る上で重要な役割を担っている。
現在の電子カルテシステムにおける構造化SBDoH情報の欠如による臨床成績におけるSBDoH因子の検討は限られている。
したがって、自然言語処理(NLP)は、構造化されていない臨床テキストからそのような情報を抽出する鍵となる技術である。
- 参考スコア(独自算出の注目度): 23.68697811086486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social and behavioral determinants of health (SBDoH) have important roles in
shaping people's health. In clinical research studies, especially comparative
effectiveness studies, failure to adjust for SBDoH factors will potentially
cause confounding issues and misclassification errors in either statistical
analyses and machine learning-based models. However, there are limited studies
to examine SBDoH factors in clinical outcomes due to the lack of structured
SBDoH information in current electronic health record (EHR) systems, while much
of the SBDoH information is documented in clinical narratives. Natural language
processing (NLP) is thus the key technology to extract such information from
unstructured clinical text. However, there is not a mature clinical NLP system
focusing on SBDoH. In this study, we examined two state-of-the-art
transformer-based NLP models, including BERT and RoBERTa, to extract SBDoH
concepts from clinical narratives, applied the best performing model to extract
SBDoH concepts on a lung cancer screening patient cohort, and examined the
difference of SBDoH information between NLP extracted results and structured
EHRs (SBDoH information captured in standard vocabularies such as the
International Classification of Diseases codes). The experimental results show
that the BERT-based NLP model achieved the best strict/lenient F1-score of
0.8791 and 0.8999, respectively. The comparison between NLP extracted SBDoH
information and structured EHRs in the lung cancer patient cohort of 864
patients with 161,933 various types of clinical notes showed that much more
detailed information about smoking, education, and employment were only
captured in clinical narratives and that it is necessary to use both clinical
narratives and structured EHRs to construct a more complete picture of
patients' SBDoH factors.
- Abstract(参考訳): 社会的および行動的健康決定因子(SBDoH)は、人々の健康を形作る上で重要な役割を担っている。
臨床研究、特に比較有効研究において、SBDoH因子の調整の失敗は、統計的分析と機械学習ベースのモデルにおいて、相反する問題と誤分類エラーを引き起こす可能性がある。
しかし、現在の電子健康記録(ehr)システムでは構造化されたsbdoh情報がないため、臨床結果のsbdoh因子を調べる研究は限られており、sbdoh情報の多くは臨床物語に記録されている。
したがって、自然言語処理(nlp)は、非構造化臨床テキストからそのような情報を抽出する重要な技術である。
しかし、SBDoHに焦点をあてた成熟した臨床NLPシステムはない。
本研究では,BERTとRoBERTaを含む2種類の最先端トランスフォーマーベースNLPモデルを用いて臨床物語からSBDoH概念を抽出し,肺がん検診患者コホート上でSBDoH概念を抽出するための最高の性能モデルを適用し,NLP抽出結果と構造化ERH(国際疾患分類法などの標準語彙でキャプチャされたSBDoH情報)の相違について検討した。
実験の結果, bert ベースの nlp モデルは 0.8791 と 0.8999 の f1-score が最適であった。
肺がん患者864名161,933名を対象に,NLP抽出SBDoH情報と構造化EHR情報との比較を行ったところ,喫煙,教育,雇用に関する詳細な情報は臨床物語にのみ収録され,臨床物語と構造化EHRの両方を用いて患者のSBDoH因子のより完全な画像を構築する必要があることが示唆された。
関連論文リスト
- Improving Extraction of Clinical Event Contextual Properties from Electronic Health Records: A Comparative Study [2.0884301753594334]
本研究は,医学テキスト分類のための様々な自然言語モデルの比較分析を行う。
BERTはBi-LSTMモデルを最大28%、ベースラインのBERTモデルを最大16%上回り、マイノリティクラスをリコールする。
論文 参考訳(メタデータ) (2024-08-30T10:28:49Z) - Towards Efficient Patient Recruitment for Clinical Trials: Application of a Prompt-Based Learning Model [0.7373617024876725]
臨床試験は医薬品の介入を促進するのに不可欠であるが、適格な参加者を選ぶ際にボトルネックに直面している。
構造化されていない医療用テキストの複雑な性質は、参加者を効率的に識別する上での課題である。
本研究では,コホート選択課題に対するプロンプトベース大規模言語モデルの性能評価を目的とした。
論文 参考訳(メタデータ) (2024-04-24T20:42:28Z) - TREEMENT: Interpretable Patient-Trial Matching via Personalized Dynamic
Tree-Based Memory Network [54.332862955411656]
臨床試験は薬物開発に不可欠であるが、しばしば高価で非効率な患者募集に苦しむ。
近年,患者と臨床試験を自動マッチングすることで患者採用を高速化する機械学習モデルが提案されている。
本稿では,TREement という名前の動的ツリーベースメモリネットワークモデルを導入する。
論文 参考訳(メタデータ) (2023-07-19T12:35:09Z) - Large Language Models for Healthcare Data Augmentation: An Example on
Patient-Trial Matching [49.78442796596806]
患者-心電図マッチング(LLM-PTM)のための革新的なプライバシ対応データ拡張手法を提案する。
本実験では, LLM-PTM法を用いて平均性能を7.32%向上させ, 新しいデータへの一般化性を12.12%向上させた。
論文 参考訳(メタデータ) (2023-03-24T03:14:00Z) - SPeC: A Soft Prompt-Based Calibration on Performance Variability of
Large Language Model in Clinical Notes Summarization [50.01382938451978]
本稿では,ソフトプロンプトを用いたモデルに依存しないパイプラインを導入し,確率に基づく要約の利点を保ちながら分散を減少させる。
実験結果から,本手法は性能を向上するだけでなく,様々な言語モデルの分散を効果的に抑制することが明らかとなった。
論文 参考訳(メタデータ) (2023-03-23T04:47:46Z) - A Multimodal Transformer: Fusing Clinical Notes with Structured EHR Data
for Interpretable In-Hospital Mortality Prediction [8.625186194860696]
臨床ノートと構造化HRデータを融合し,院内死亡率の予測に役立てる新しいマルチモーダルトランスフォーマーを提案する。
そこで本研究では,臨床ノートにおいて重要な単語を選択するための統合的勾配(IG)手法を提案する。
また,臨床 BERT における領域適応型事前訓練とタスク適応型微調整の重要性についても検討した。
論文 参考訳(メタデータ) (2022-08-09T03:49:52Z) - Intelligent Sight and Sound: A Chronic Cancer Pain Dataset [74.77784420691937]
本稿では,Intelligent Sight and Sound (ISS) 臨床試験の一環として収集された,最初の慢性ガン痛データセットを紹介する。
これまで収集されたデータは29の患者、509のスマートフォンビデオ、189,999のフレーム、そして自己報告された感情と活動の痛みのスコアから成っている。
静的画像とマルチモーダルデータを用いて、自己報告された痛みレベルを予測する。
論文 参考訳(メタデータ) (2022-04-07T22:14:37Z) - A causal learning framework for the analysis and interpretation of
COVID-19 clinical data [7.256237785391623]
ワークフローは、BSLを通じて患者の結果の主な原因を特定する、多段階のアプローチから成り立っている。
特徴量の多いCOVID-19データセットに対する我々のアプローチを評価し、提案フレームワークが結果に共同貢献する多要素プロセスのスキーマ的概要を提供することを示す。
対象者の85%の結果を3つの特徴のみに基づいて正確に予測する手法を考案した。
論文 参考訳(メタデータ) (2021-05-14T15:58:18Z) - Extracting Lifestyle Factors for Alzheimer's Disease from Clinical Notes
Using Deep Learning with Weak Supervision [9.53786612243512]
本研究の目的は,自然言語処理モデル(NLP)がライフスタイル要因を分類できる可能性を示すことである。
BERTモデルの有効性を検証するために,身体活動と過剰食の2つの事例研究を行った。
弱い監視を生かした提案手法はサンプルサイズを大幅に増大させる可能性がある。
論文 参考訳(メタデータ) (2021-01-22T17:55:03Z) - Classification supporting COVID-19 diagnostics based on patient survey
data [82.41449972618423]
新型コロナウイルス患者の効果的なスクリーニングを可能にするロジスティック回帰とXGBoost分類器が作成された。
得られた分類モデルは、DECODEサービス(decode.polsl.pl)の基礎を提供し、COVID-19病患者のスクリーニング支援に役立てることができる。
このデータセットは、3,000以上のサンプルで構成されており、ポーランドの病院で収集されたアンケートに基づいている。
論文 参考訳(メタデータ) (2020-11-24T17:44:01Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。