論文の概要: TwinWeaver: An LLM-Based Foundation Model Framework for Pan-Cancer Digital Twins
- arxiv url: http://arxiv.org/abs/2601.20906v1
- Date: Wed, 28 Jan 2026 15:40:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.368933
- Title: TwinWeaver: An LLM-Based Foundation Model Framework for Pan-Cancer Digital Twins
- Title(参考訳): TwinWeaver: Pan-Cancer Digital TwinsのためのLLMベースのファンデーションモデルフレームワーク
- Authors: Nikita Makarov, Maria Bordukova, Lena Voith von Voithenberg, Estrella Pivel-Villanueva, Sabrina Mielke, Jonathan Wickes, Hanchen Wang, Mingyu Derek Ma, Keunwoo Choi, Kyunghyun Cho, Stephen Ra, Raul Rodriguez-Esteban, Fabian Schmich, Michael Menden,
- Abstract要約: Genie Digital Twin (GDT) は, がんのタイプ別に93,054人を対象に構築されている。
GDTは予測誤差を著しく低減し、平均絶対誤差(MASE)は0.87である。
GDTは、アウト・オブ・ディストリビューション・マッチング臨床試験に一般化し、ゼロショットでベースラインを訓練し、微調整でそれらを上回った。
- 参考スコア(独自算出の注目度): 33.30007167473537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precision oncology requires forecasting clinical events and trajectories, yet modeling sparse, multi-modal clinical time series remains a critical challenge. We introduce TwinWeaver, an open-source framework that serializes longitudinal patient histories into text, enabling unified event prediction as well as forecasting with large language models, and use it to build Genie Digital Twin (GDT) on 93,054 patients across 20 cancer types. In benchmarks, GDT significantly reduces forecasting error, achieving a median Mean Absolute Scaled Error (MASE) of 0.87 compared to 0.97 for the strongest time-series baseline (p<0.001). Furthermore, GDT improves risk stratification, achieving an average concordance index (C-index) of 0.703 across survival, progression, and therapy switching tasks, surpassing the best baseline of 0.662. GDT also generalizes to out-of-distribution clinical trials, matching trained baselines at zero-shot and surpassing them with fine-tuning, achieving a median MASE of 0.75-0.88 and outperforming the strongest baseline in event prediction with an average C-index of 0.672 versus 0.648. Finally, TwinWeaver enables an interpretable clinical reasoning extension, providing a scalable and transparent foundation for longitudinal clinical modeling.
- Abstract(参考訳): 精度オンコロジーは、臨床イベントや軌跡の予測を必要とするが、スパースでマルチモーダルな臨床時系列をモデル化することは重要な課題である。
我々はTwinWeaverというオープンソースのフレームワークを紹介し,20種類のがん患者93,054人を対象にしたGenie Digital Twin(GDT)を構築するために,縦型患者の履歴をテキストにシリアライズし,イベント予測の統一化と大規模言語モデルによる予測を可能にした。
ベンチマークでは、GDTは予測誤差を著しく低減し、最強の時系列ベースライン(p<0.001)に対して0.87の平均絶対スケールエラー(MASE)を達成する。
さらに、GDTはリスク階層化を改善し、生存時、進行時、治療時切り替え時の平均コンコータンス指数0.703を達成し、最高のベースライン0.662を超えている。
また、GDTはアウト・オブ・ディストリビューション臨床試験を一般化し、訓練されたベースラインをゼロショットでマッチングし、微調整でそれらを超越し、中央値のMASEが0.75-0.88に達し、平均値のCインデックスが0.672対0.648で最強のベースラインを上回った。
最後に、TwinWeaverは解釈可能な臨床推論拡張を可能にし、縦断的臨床モデリングのためのスケーラブルで透明な基盤を提供する。
関連論文リスト
- Explainable Admission-Level Predictive Modeling for Prolonged Hospital Stay in Elderly Populations: Challenges in Low- and Middle-Income Countries [65.4286079244589]
長期滞在期間 (pLoS) は, 院内感染のリスクに関連する重要な要因である。
入院レベルの患者と病院の診療データを用いて, pLosの予測モデルを開発し, 解説する。
論文 参考訳(メタデータ) (2026-01-07T23:35:24Z) - Knowledge Graph Augmented Large Language Models for Disease Prediction [24.992170033802537]
知識グラフ(KG)誘導チェーン・オブ・シント(CoT)フレームワークは,MIMIC-IIIにおける来院レベルの疾患予測のための臨床基礎的推論を生成する。
ICD-9コードはPrimeKGにマッピングされ、病気関連ノードとマルチホップ推論パスが抽出され、CoT生成のための足場として使用される。
KG誘導モデルは、AUROC値0.66から0.70、マクロAUPR値0.40から0.47を達成し、強力な古典的ベースラインを上回った。
盲目臨床評価では,KG誘導型CoT説明の明瞭度,関連性,臨床正当性に一貫した嗜好を示す。
論文 参考訳(メタデータ) (2025-12-01T02:49:17Z) - A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - A Novel Attention-Augmented Wavelet YOLO System for Real-time Brain Vessel Segmentation on Transcranial Color-coded Doppler [49.03919553747297]
我々は,脳動脈を効率よく捉えることができるAIを利用したリアルタイムCoW自動分割システムを提案する。
Transcranial Color-coded Doppler (TCCD) を用いたAIによる脳血管セグメンテーションの事前研究は行われていない。
提案したAAW-YOLOは, 異方性および対側性CoW容器のセグメンテーションにおいて高い性能を示した。
論文 参考訳(メタデータ) (2025-08-19T14:41:22Z) - A SHAP-based explainable multi-level stacking ensemble learning method for predicting the length of stay in acute stroke [3.2906073576204955]
既存の機械学習モデルは、最適以下の予測性能、限定的な一般化可能性を示し、システムレベルの要因を見落としている。
我々は,虚血性脳梗塞と出血性脳梗塞に対する解釈可能な多段階重ねアンサンブルモデルを開発した。
説明可能なアンサンブルモデルは,虚血性脳卒中におけるLOSの延長を効果的に予測する。
出血性脳卒中にはさらなる検証が必要である。
論文 参考訳(メタデータ) (2025-05-30T01:08:26Z) - Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - An Interpretable Web-based Glioblastoma Multiforme Prognosis Prediction
Tool using Random Forest Model [1.1024591739346292]
治療後1年間のGBM患者の健康状態を推定する予測モデルを提案する。
総計467名のGBM患者の臨床像を13の特徴と2つの経過日で比較検討した。
GBM患者生存の予後因子のトップ3はMGMT遺伝子プロモーター,切除範囲,年齢であった。
論文 参考訳(メタデータ) (2021-08-30T07:56:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。