論文の概要: Intercept Cancer: Cancer Pre-Screening with Large Scale Healthcare Foundation Models
- arxiv url: http://arxiv.org/abs/2506.00209v1
- Date: Fri, 30 May 2025 20:31:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:32.505073
- Title: Intercept Cancer: Cancer Pre-Screening with Large Scale Healthcare Foundation Models
- Title(参考訳): インターセプションがん : 大規模医療財団モデルによるがん術前治療
- Authors: Liwen Sun, Hao-Ren Yao, Gary Gao, Ophir Frieder, Chenyan Xiong,
- Abstract要約: CATCH-FM, CATch carcinoma early with Healthcare Foundation Models。
Caught-FMは、歴史的医療記録に基づいて、さらなるスクリーニングを行うためのリスクの高い患者を特定する。
各種患者分布におけるCATCH-FMのロバスト性について検討した。
- 参考スコア(独自算出の注目度): 17.739985240125733
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cancer screening, leading to early detection, saves lives. Unfortunately, existing screening techniques require expensive and intrusive medical procedures, not globally available, resulting in too many lost would-be-saved lives. We present CATCH-FM, CATch Cancer early with Healthcare Foundation Models, a cancer pre-screening methodology that identifies high-risk patients for further screening solely based on their historical medical records. With millions of electronic healthcare records (EHR), we establish the scaling law of EHR foundation models pretrained on medical code sequences, pretrain compute-optimal foundation models of up to 2.4 billion parameters, and finetune them on clinician-curated cancer risk prediction cohorts. In our retrospective evaluation comprising of thirty thousand patients, CATCH-FM achieved strong efficacy (60% sensitivity) with low risk (99% specificity and Negative Predictive Value), outperforming feature-based tree models as well as general and medical large language models by large margins. Despite significant demographic, healthcare system, and EHR coding differences, CATCH-FM achieves state-of-the-art pancreatic cancer risk prediction on the EHRSHOT few-shot leaderboard, outperforming EHR foundation models pretrained using on-site patient data. Our analysis demonstrates the robustness of CATCH-FM in various patient distributions, the benefits of operating in the ICD code space, and its ability to capture non-trivial cancer risk factors. Our code will be open-sourced.
- Abstract(参考訳): 早期発見につながるがんスクリーニングは、命を救う。
残念ながら、既存のスクリーニング技術は高価で侵入的な医療処置を必要としており、世界中では利用できない。
CATCH-FM, CATch Cancer early with Healthcare Foundation Models, a cancer pre-screening method that identifieds high-risk patients for further screening based on their historical medical records。
数百万の電子医療記録(EHR)により、医療コードシーケンスで事前訓練されたEHRファンデーションモデルのスケーリング法を確立し、最大40億のパラメータの計算最適化ファンデーションモデルを事前訓練し、クリニカルキュレートされたがんリスク予測コホートでそれらを微調整する。
以上の結果より, CATCH-FMはリスクが低い(99%の特異性, 負の予測値)強い有効性(60%の感度)を達成し, 特徴ベースツリーモデル, 一般・医療大言語モデルよりも大きなマージンを達成できた。
CATCH-FMは、人口統計、医療システム、EHRのコーディングの違いにもかかわらず、EHRSHOTの少数ショットのリーダーボード上で最先端の膵癌リスク予測を達成し、現場の患者データを用いて事前訓練されたEHRファンデーションモデルより優れている。
本分析は,様々な患者分布におけるCATCH-FMのロバスト性,ICD符号空間での操作の利点,非自明ながんリスク因子を捕捉する能力を示す。
私たちのコードはオープンソースになります。
関連論文リスト
- Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - PathBench: A comprehensive comparison benchmark for pathology foundation models towards precision oncology [33.51485504161335]
病理基盤モデル(PFM)の最初の包括的なベンチマークであるPathBenchを紹介する。
我々のフレームワークは大規模データを組み込んで,PFMの客観的比較を可能にする。
当院では10病院で8,549人の患者から15,888件のWSIを収集し,64件以上の診断・予後調査を行った。
論文 参考訳(メタデータ) (2025-05-26T16:42:22Z) - ColonScopeX: Leveraging Explainable Expert Systems with Multimodal Data for Improved Early Diagnosis of Colorectal Cancer [3.541280502270993]
大腸癌(CRC)は、がん関連死亡の2番目に多い原因であり、世界でも3番目に多い悪性腫瘍である。
CRCの早期発見は、その非特異的でしばしば恥ずかしい症状のため、依然として問題である。
説明可能なAI(XAI)手法を利用した機械学習フレームワークであるColonScopeXを提案する。
論文 参考訳(メタデータ) (2025-04-09T20:45:11Z) - Machine Learning Solutions Integrated in an IoT Healthcare Platform for Heart Failure Risk Stratification [3.952604803580729]
慢性心不全(HF)の管理は、現代医療において重要な課題である。
本稿では,HFリスクのある患者を識別するための機械学習(ML)技術に基づく予測モデルを提案する。
論文 参考訳(メタデータ) (2025-04-07T14:07:05Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - A Multi-Institutional Open-Source Benchmark Dataset for Breast Cancer
Clinical Decision Support using Synthetic Correlated Diffusion Imaging Data [82.74877848011798]
Cancer-Net BCaは、乳がん患者の画像データであるボリュームCDI$s$の複数機関のオープンソースベンチマークデータセットである。
Cancer-Net BCaは、機械学習の進歩を加速し、がんと戦う臨床医を助ける、グローバルなオープンソースイニシアチブの一部として、一般公開されている。
論文 参考訳(メタデータ) (2023-04-12T05:41:44Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - Deep-CR MTLR: a Multi-Modal Approach for Cancer Survival Prediction with
Competing Risks [0.4189643331553922]
本稿では,癌生存予測のための新しい機械学習手法であるDeep-CR MTLRを提案する。
2552頭頸部癌患者のコホートにおける単一モダリティ予測器に対するマルチモーダルアプローチの予後改善効果を実証した。
論文 参考訳(メタデータ) (2020-12-10T15:51:47Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。