論文の概要: Automated Extraction of Fluoropyrimidine Treatment and Treatment-Related Toxicities from Clinical Notes Using Natural Language Processing
- arxiv url: http://arxiv.org/abs/2510.20727v1
- Date: Thu, 23 Oct 2025 16:44:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:18.426309
- Title: Automated Extraction of Fluoropyrimidine Treatment and Treatment-Related Toxicities from Clinical Notes Using Natural Language Processing
- Title(参考訳): 自然言語処理によるフルオロピリミジン処理および関連毒性の自動抽出
- Authors: Xizhi Wu, Madeline S. Kreider, Philip E. Empey, Chenyu Li, Yanshan Wang,
- Abstract要約: フルオロピリミジンは大腸癌や乳癌に広く処方されているが、手足症候群や心毒性などの毒性と関連している。
毒性ドキュメンテーションは臨床ノートに埋もれていることが多いので, 治療や毒性情報を抽出する自然言語処理法(NLP)を開発し, 評価することを目的とした。
成人腫瘍学患者204,165名を対象に,ゴールド・スタンダード・データセットを作成した。
- 参考スコア(独自算出の注目度): 5.087643457978701
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Objective: Fluoropyrimidines are widely prescribed for colorectal and breast cancers, but are associated with toxicities such as hand-foot syndrome and cardiotoxicity. Since toxicity documentation is often embedded in clinical notes, we aimed to develop and evaluate natural language processing (NLP) methods to extract treatment and toxicity information. Materials and Methods: We constructed a gold-standard dataset of 236 clinical notes from 204,165 adult oncology patients. Domain experts annotated categories related to treatment regimens and toxicities. We developed rule-based, machine learning-based (Random Forest, Support Vector Machine [SVM], Logistic Regression [LR]), deep learning-based (BERT, ClinicalBERT), and large language models (LLM)-based NLP approaches (zero-shot and error-analysis prompting). Models used an 80:20 train-test split. Results: Sufficient data existed to train and evaluate 5 annotated categories. Error-analysis prompting achieved optimal precision, recall, and F1 scores (F1=1.000) for treatment and toxicities extraction, whereas zero-shot prompting reached F1=1.000 for treatment and F1=0.876 for toxicities extraction.LR and SVM ranked second for toxicities (F1=0.937). Deep learning underperformed, with BERT (F1=0.873 treatment; F1= 0.839 toxicities) and ClinicalBERT (F1=0.873 treatment; F1 = 0.886 toxicities). Rule-based methods served as our baseline with F1 scores of 0.857 in treatment and 0.858 in toxicities. Discussion: LMM-based approaches outperformed all others, followed by machine learning methods. Machine and deep learning approaches were limited by small training data and showed limited generalizability, particularly for rare categories. Conclusion: LLM-based NLP most effectively extracted fluoropyrimidine treatment and toxicity information from clinical notes, and has strong potential to support oncology research and pharmacovigilance.
- Abstract(参考訳): 目的: フルオロピリミジンは大腸癌や乳癌に広く処方されているが、手足症候群や心毒性などの毒性と関連している。
毒性ドキュメンテーションは臨床ノートに埋もれていることが多いので, 治療や毒性情報を抽出する自然言語処理法(NLP)を開発し, 評価することを目的とした。
対象と方法:204,165人の成人腫瘍学患者を対象に,ゴールド・スタンダード・データセットを構築した。
ドメインエキスパートは治療規則と毒性に関するカテゴリーを注釈付けした。
我々はルールベース、機械学習ベース(ランダムフォレスト、サポートベクトルマシン(SVM)、ロジスティック回帰(LR))、ディープラーニングベース(BERT、クリニカルBERT)、および大規模言語モデル(LLM)ベースのNLPアプローチ(ゼロショットとエラー解析)を開発した。
モデルでは80:20の列車試験が使用された。
結果:5つの注釈付きカテゴリーをトレーニングし,評価するために十分なデータが存在した。
Error-analysis promptingは治療と毒性の抽出に最適な精度、リコール、F1スコア(F1=1.000)を達成したが、ゼロショットプロンプトは治療にF1=1.000、毒性の抽出にはF1=0.876、毒性の抽出にはLRとSVMが第2位(F1=0.937)に達した。
深層学習では, BERT (F1=0.873, F1=0.839 毒性), クリニカルBERT (F1=0.873, F1=0.886 毒性) が不足した。
基準法はF1スコアが0.857、毒性が0.858であった。
議論: LMMベースのアプローチは他のすべてよりも優れており、その後機械学習手法が続いた。
機械学習とディープラーニングのアプローチは、小さなトレーニングデータによって制限され、特に稀なカテゴリにおいて、限定的な一般化性を示した。
結論: LLMをベースとしたNLPは, 臨床ノートからフルオロピリミジン治療および毒性情報を最も効果的に抽出し, 腫瘍学研究や薬物移動の支援に強い可能性を秘めている。
関連論文リスト
- Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - Fine-Tuning Open-Source Large Language Models to Improve Their Performance on Radiation Oncology Tasks: A Feasibility Study to Investigate Their Potential Clinical Applications in Radiation Oncology [23.986096971629777]
大規模言語モデルは、複雑なテキスト情報を処理する際、顕著な能力を示した。
本研究の目的は、ドメイン知識を持つ微調整LDMがタスクの性能を向上させるかどうかを検討することである。
片面のウィルコクソンサインランク試験は、統計的に結果を分析するために使用された。
論文 参考訳(メタデータ) (2025-01-28T20:37:32Z) - Explainable AI for Mental Health Emergency Returns: Integrating LLMs with Predictive Modeling [2.466324275447403]
救急部門(ED)は精神状態の回復が大きな医療負担となり、患者の24-27%が30日以内に帰国する。
大規模言語モデル(LLM)と機械学習を統合することにより、EDメンタルヘルスリターンリスクモデルの予測精度と臨床的解釈性が向上するか否かを評価する。
論文 参考訳(メタデータ) (2025-01-21T15:41:20Z) - Causal machine learning for predicting treatment outcomes [75.13093479526151]
Causal Machine Learning (ML)は、治療結果を予測するフレキシブルでデータ駆動の方法を提供する。
因果MLの主な利点は、個別化された治療効果を推定できることである。
論文 参考訳(メタデータ) (2024-10-11T12:39:08Z) - CIMIL-CRC: a clinically-informed multiple instance learning framework for patient-level colorectal cancer molecular subtypes classification from H\&E stained images [42.771819949806655]
CIMIL-CRCは、事前学習した特徴抽出モデルと主成分分析(PCA)を効率よく組み合わせ、全てのパッチから情報を集約することで、MSI/MSS MIL問題を解決するフレームワークである。
我々は,TCGA-CRC-DXコホートを用いたモデル開発のための5倍のクロスバリデーション実験装置を用いて,曲線下平均面積(AUC)を用いてCIMIL-CRC法の評価を行った。
論文 参考訳(メタデータ) (2024-01-29T12:56:11Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Natural Language Processing Methods to Identify Oncology Patients at
High Risk for Acute Care with Clinical Notes [9.49721872804122]
本研究は, がん患者の急性期治療(ACU)のリスクを明らかにするために, 自然言語処理がいかに有用かを評価するものである。
構造化健康データ(SHD)を用いたリスク予測は標準となっているが、自由テキスト形式を用いた予測は複雑である。
論文 参考訳(メタデータ) (2022-09-28T06:31:19Z) - Machine Learning for Real-World Evidence Analysis of COVID-19
Pharmacotherapy [0.0]
臨床から生成された実世界のデータは、新型コロナウイルスの薬物療法の実際の証拠を分析するために使用できる。
機械学習(ML)メソッドが使われており、精密医療のための有望なツールである。
本研究では,スペインバレンシア州における新型コロナウイルスの入院に対する治療法の有効性を検討するために,ML法を適用した。
論文 参考訳(メタデータ) (2021-07-19T16:28:54Z) - RealToxicityPrompts: Evaluating Neural Toxic Degeneration in Language
Models [93.151822563361]
事前訓練されたニューラルネットワークモデル(LM)は、安全なデプロイメントを妨げる人種差別的、性差別的、その他の有害な言語を生成する傾向にある。
本研究では, 予め訓練したLMが有害な言語を生成できる範囲と, 有害な変性を防止するための制御可能なテキスト生成アルゴリズムの有効性について検討する。
論文 参考訳(メタデータ) (2020-09-24T03:17:19Z) - Automated Quantification of CT Patterns Associated with COVID-19 from
Chest CT [48.785596536318884]
提案法は,非造影胸部CTを入力として,病変,肺,葉を3次元に分割する。
この方法では、肺の重症度と葉の関与度を2つの組み合わせて測定し、COVID-19の異常度と高不透明度の存在度を定量化する。
このアルゴリズムの評価は、カナダ、ヨーロッパ、米国からの200人の参加者(感染者100人、健康管理100人)のCTで報告されている。
論文 参考訳(メタデータ) (2020-04-02T21:49:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。