論文の概要: Toward Scalable Early Cancer Detection: Evaluating EHR-Based Predictive Models Against Traditional Screening Criteria
- arxiv url: http://arxiv.org/abs/2511.11293v1
- Date: Fri, 14 Nov 2025 13:26:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-17 22:42:18.624749
- Title: Toward Scalable Early Cancer Detection: Evaluating EHR-Based Predictive Models Against Traditional Screening Criteria
- Title(参考訳): スケーラブル早期がん検出に向けて:従来のスクリーニング基準に対するEHRに基づく予測モデルの評価
- Authors: Jiheum Park, Chao Pang, Tristan Y. Lee, Jeong Yun Yang, Jacob Berkowitz, Alexander Z. Wei, Nicholas Tatonetti,
- Abstract要約: 現在のがんスクリーニングガイドラインは、いくつかの種類のがんしかカバーしていない。
電子健康記録を用いた予測モデルは、リスクの高いグループを特定するためのより効果的なツールを提供するかもしれない。
- 参考スコア(独自算出の注目度): 36.59932276624224
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current cancer screening guidelines cover only a few cancer types and rely on narrowly defined criteria such as age or a single risk factor like smoking history, to identify high-risk individuals. Predictive models using electronic health records (EHRs), which capture large-scale longitudinal patient-level health information, may provide a more effective tool for identifying high-risk groups by detecting subtle prediagnostic signals of cancer. Recent advances in large language and foundation models have further expanded this potential, yet evidence remains limited on how useful HER-based models are compared with traditional risk factors currently used in screening guidelines. We systematically evaluated the clinical utility of EHR-based predictive models against traditional risk factors, including gene mutations and family history of cancer, for identifying high-risk individuals across eight major cancers (breast, lung, colorectal, prostate, ovarian, liver, pancreatic, and stomach), using data from the All of Us Research Program, which integrates EHR, genomic, and survey data from over 865,000 participants. Even with a baseline modeling approach, EHR-based models achieved a 3- to 6-fold higher enrichment of true cancer cases among individuals identified as high risk compared with traditional risk factors alone, whether used as a standalone or complementary tool. The EHR foundation model, a state-of-the-art approach trained on comprehensive patient trajectories, further improved predictive performance across 26 cancer types, demonstrating the clinical potential of EHR-based predictive modeling to support more precise and scalable early detection strategies.
- Abstract(参考訳): 現在のがんスクリーニングガイドラインは、少数のがんタイプをカバーしており、リスクの高い個人を特定するために、年齢や喫煙履歴のような単一のリスクファクタといった、狭義の基準に依存している。
電子健康記録 (EHRs) を用いた予測モデルは, がんの微妙な診断前信号を検出することにより, リスクの高いグループを識別する上で, より効果的な手段となる可能性がある。
大規模言語や基礎モデルの最近の進歩により、この可能性はさらに拡張されているが、HERベースのモデルがスクリーニングガイドラインで現在使われている従来のリスク要因とどのように有用かという証拠は限られている。
本研究は,8つのがん(乳癌,肺がん,大腸癌,前立腺がん,卵巣がん,肝がん,膵がん,胃がん)にまたがるリスクの高い個人を特定するために,遺伝子変異や癌家族歴を含む従来のリスクファクターに対するEHRベースの予測モデルの臨床的有用性を,EHR,ゲノム、865,000人以上の参加者のデータを統合したAll of Us Research Programのデータを用いて,体系的に評価した。
ベースラインモデリングアプローチであっても、EHRベースのモデルは、単独または補完ツールとして使用しても、従来のリスクファクターのみと比較して、リスクの高い個人において、真のがん症例の3倍から6倍の高密度化を実現した。
EHRファンデーションモデルは、包括的患者の軌跡に基づいて訓練された最先端のアプローチであり、26のがんタイプにわたる予測性能をさらに向上し、より正確でスケーラブルな早期検出戦略をサポートするためのEHRベースの予測モデルの臨床可能性を示した。
関連論文リスト
- Integrating Genomics into Multimodal EHR Foundation Models [56.31910745104141]
本稿では,ポリジェニックリスクスコア(PRS)を基本データモダリティとして統合した,革新的なEHR基盤モデルを提案する。
このフレームワークは、臨床データと遺伝子前置詞の複雑な関係を学習することを目的としている。
このアプローチは、病気の予測、積極的な健康管理、リスク階層化、パーソナライズされた治療戦略に対する新たな洞察を解放するために重要である。
論文 参考訳(メタデータ) (2025-10-24T15:56:40Z) - Intercept Cancer: Cancer Pre-Screening with Large Scale Healthcare Foundation Models [22.56012797703626]
CATCH-FM, CATch carcinoma early with Healthcare Foundation Models。
Caught-FMは、過去の医療記録に基づいて、リスクの高い患者をスクリーニングするために特定する。
本分析は,様々な患者分布におけるCATCH-FMのロバスト性,ICD符号空間での操作の利点,非自明ながんリスク因子を捕捉する能力を示す。
論文 参考訳(メタデータ) (2025-05-30T20:31:09Z) - Adaptable Cardiovascular Disease Risk Prediction from Heterogeneous Data using Large Language Models [70.64969663547703]
AdaCVDは、英国バイオバンクから50万人以上の参加者を対象に、大規模な言語モデルに基づいて構築された適応可能なCVDリスク予測フレームワークである。
包括的かつ可変的な患者情報を柔軟に取り込み、構造化データと非構造化テキストの両方をシームレスに統合し、最小限の追加データを使用して新規患者の集団に迅速に適応する。
論文 参考訳(メタデータ) (2025-05-30T14:42:02Z) - Deep learning-based identification of patients at increased risk of cancer using routine laboratory markers [2.482109221766753]
がんスクリーニングは、スクリーニング方法と頻度を決定するために、最初のリスク階層化ステップを含む。
ほとんどのスクリーニングプログラムでは、年齢や家族歴などの臨床リスク要因は、最初のリスク階層化アルゴリズムの一部である。
本研究は, 大腸癌, 肝癌, 肺癌のリスクのある患者を鑑別するために, 血液計数や完全代謝パネルなどの簡便な血液検査を併用できることを実証した。
論文 参考訳(メタデータ) (2024-10-25T15:50:27Z) - Penalized Deep Partially Linear Cox Models with Application to CT Scans
of Lung Cancer Patients [42.09584755334577]
肺がんは世界中のがん死亡の原因であり、効果的な治療法を設計するための死亡リスクを理解することの重要性を強調している。
NLST(National Lung Screening Trial)は、肺がん患者の死亡リスクを定量化するために、CTテクスチャ解析を用いている。
本稿では,SCADペナルティを組み込んで重要なテクスチャ特徴を抽出し,深層ニューラルネットワークを用いてモデルの非パラメトリック成分を推定する,Pentalized Deep partially Linear Cox Model (Penalized DPLC)を提案する。
論文 参考訳(メタデータ) (2023-03-09T15:38:16Z) - SurvLatent ODE : A Neural ODE based time-to-event model with competing
risks for longitudinal data improves cancer-associated Deep Vein Thrombosis
(DVT) prediction [68.8204255655161]
本稿では,不規則なサンプルデータの下で潜在表現をパラメータ化する生成時間対イベントモデルSurvLatent ODEを提案する。
そこで,本モデルでは,事象特異的ハザード関数の形状を指定せずに,複数の競合イベントの生存時間を柔軟に推定する。
SurvLatent ODEは、DVTリスクグループを成層化するために、現在の臨床標準であるKhorana Riskスコアより優れている。
論文 参考訳(メタデータ) (2022-04-20T17:28:08Z) - UNITE: Uncertainty-based Health Risk Prediction Leveraging Multi-sourced
Data [81.00385374948125]
我々はUNcertaInTyベースのhEalth Risk Prediction(UNITE)モデルを提案する。
UNITEは、複数ソースの健康データを活用した正確な疾患リスク予測と不確実性推定を提供する。
非アルコール性脂肪肝疾患(NASH)とアルツハイマー病(AD)の実態予測タスクにおけるUNITEの評価を行った。
UNITEはAD検出のF1スコアで最大0.841点、NASH検出のPR-AUCで最大0.609点を達成し、最高のベースラインで最大19%の高パフォーマンスを達成している。
論文 参考訳(メタデータ) (2020-10-22T02:28:11Z) - A Large-scale Multimodal Study for Predicting Mortality Risk Using Minimal and Low Parameter Models and Separable Risk Assessment [0.0]
我々は,大規模臨床データセットに基づいて1年間の死亡を予測できる複数のマルチモーダルモデルを開発し,検証する。
1年間の死亡予測に焦点をあてることで、患者に緊急感を与えることができる。
論文 参考訳(メタデータ) (2019-01-23T20:47:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。