論文の概要: Multimodal Machine Learning for Early Prediction of Metastasis in a Swedish Multi-Cancer Cohort
- arxiv url: http://arxiv.org/abs/2603.29793v1
- Date: Tue, 31 Mar 2026 14:27:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-01 15:25:03.715719
- Title: Multimodal Machine Learning for Early Prediction of Metastasis in a Swedish Multi-Cancer Cohort
- Title(参考訳): スウェーデンのマルチキャスターコホートにおける転移早期予測のためのマルチモーダル機械学習
- Authors: Franco Rugolon, Korbinian Randl, Braslav Jovanovic, Ioanna Miliou, Panagiotis Papapetrou,
- Abstract要約: マルチモーダル機械学習(Multimodal Machine Learning)は、患者の状態の全体像を提供し、電子的健康記録から構造化データと非構造化データを統合する。
EHRデータから6カ月の経過を経過観察し,診断の1ヶ月前に転移リスクを予測する枠組みを提案する。
- 参考スコア(独自算出の注目度): 1.5829605001132387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multimodal Machine Learning offers a holistic view of a patient's status, integrating structured and unstructured data from electronic health records (EHR). We propose a framework to predict metastasis risk one month prior to diagnosis, using six months of clinical history from EHR data. Data from four cancer cohorts collected at Karolinska University Hospital (Stockholm, Sweden) were analyzed: breast (n = 743), colon (n = 387), lung (n = 870), and prostate (n = 1890). The dataset included demographics, comorbidities, laboratory results, medications, and clinical text. We compared traditional and deep learning classifiers across single modalities and multimodal combinations, using various fusion strategies and a Transparent Reporting of a multivariable prediction model for Individual Prognosis Or Diagnosis (TRIPOD) 2a design, with an 80-20 development-validation split to ensure a rigorous, repeatable evaluation. Performance was evaluated using AUROC, AUPRC, F1 score, sensitivity, and specificity. We then employed a multimodal adaptation of SHAP to analyze the classifiers' reasoning. Intermediate fusion achieved the highest F1 scores on breast (0.845), colon (0.786), and prostate cancer (0.845), demonstrating strong predictive performance. For lung cancer, the intermediate fusion achieved an F1 score of 0.819, while the text-only model achieved the highest, with an F1 score of 0.829. Deep learning classifiers consistently outperformed traditional models. Colon cancer, the smallest cohort, had the lowest performance, highlighting the importance of sufficient training data. SHAP analysis showed that the relative importance of modalities varied across cancer types. Fusion strategies offer distinct strengths and weaknesses. Intermediate fusion consistently delivered the best results, but strategy choices should align with data characteristics and organizational needs.
- Abstract(参考訳): マルチモーダル機械学習(Multimodal Machine Learning)は、患者の状態の全体像を提供し、電子健康記録(EHR)から構造化データと非構造化データを統合する。
EHRデータから6カ月の経過を経過観察し,診断の1ヶ月前に転移リスクを予測する枠組みを提案する。
カロリンスカ大学病院(スウェーデンのストックホルム)で収集された4つのがんコホート(乳房(n = 743)、結腸(n = 387)、肺(n = 870)、前立腺(n = 1890)のデータを分析した。
データセットには、人口統計、共同研究、実験結果、医薬品、臨床テキストが含まれていた。
個別診断・診断のための多変量予測モデル (TRIPOD) 2a を, 厳密かつ反復的な評価を確保するために, 80~20個の開発検証スプリットを用いて, 従来の学習分類器と深層学習分類器を比較した。
AUROC, AUPRC, F1スコア, 感度, 特異性を用いて評価した。
次に、SHAPのマルチモーダル適応を用いて分類器の推論を解析した。
中間核融合は、乳房(0.845)、大腸(0.786)、前立腺癌(0.845)で最高F1スコアを達成し、高い予測性能を示した。
肺がんでは,中間核融合が0.819点,テキストのみのモデルが0.829点,F1が0.829点であった。
ディープラーニング分類器は従来のモデルよりも一貫して優れていた。
大腸がんは最小のコホートであり、十分なトレーニングデータの重要性を強調した。
SHAP分析の結果,癌の種類によってモダリティの相対的重要性が変化した。
融合戦略は、異なる強みと弱みを提供する。
中間融合は、常に最高の結果をもたらすが、戦略の選択は、データ特性と組織的ニーズに一致すべきである。
関連論文リスト
- Cerebra: A Multidisciplinary AI Board for Multimodal Dementia Characterization and Risk Assessment [56.62016795093786]
CerebraはインタラクティブなマルチエージェントAIチームで、ERH、臨床ノート、医療画像分析のための特殊エージェントをコーディネートする。
構造化された表現を操作することで、プライバシ保護デプロイメントをサポートし、モダリティが不完全であれば、堅牢である。
Cerebraは、有識者のパフォーマンスを著しく改善し、前向き認知症リスク推定において精度を17.5ポイント向上させた。
論文 参考訳(メタデータ) (2026-03-23T05:46:45Z) - A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer [54.58205672910646]
RenalCLIPは、腎腫瘤の特徴、診断、予後のための視覚言語基盤モデルである。
腎がんの完全な臨床ワークフローにまたがる10のコアタスクにおいて、優れたパフォーマンスと優れた一般化性を実現した。
論文 参考訳(メタデータ) (2025-08-22T17:48:19Z) - Automatic Cough Analysis for Non-Small Cell Lung Cancer Detection [33.37223681850477]
非小細胞肺癌(NSCLC)の早期発見は患者の予後改善に重要である。
本研究では,NSCLC患者と健常者との鑑別のためのスクリーニングツールとして,自動コークス分析の利用について検討する。
記録は、サポートベクタマシン(SVM)やXGBoostといった機械学習技術を用いて分析された。
論文 参考訳(メタデータ) (2025-07-25T11:30:22Z) - Machine learning-based multimodal prognostic models integrating pathology images and high-throughput omic data for overall survival prediction in cancer: a systematic review [0.59374762912328]
病理組織学と分子データを統合するマルチモーダル機械学習は、がんの予後を保証している。
我々は,全スライド画像(WSI)と高スループットオミクスを組み合わせて,全体の生存率を予測する研究を体系的に検討した。
全ての研究は、不明瞭/高い偏見、外部検証の制限、臨床的有用性にはほとんど焦点が当てられなかった。
論文 参考訳(メタデータ) (2025-07-22T11:02:51Z) - Predicting Length of Stay in Neurological ICU Patients Using Classical Machine Learning and Neural Network Models: A Benchmark Study on MIMIC-IV [49.1574468325115]
本研究は、MIMIC-IVデータセットに基づく神経疾患患者を対象とした、ICUにおけるLOS予測のための複数のMLアプローチについて検討する。
評価されたモデルには、古典的MLアルゴリズム(K-Nearest Neighbors、Random Forest、XGBoost、CatBoost)とニューラルネットワーク(LSTM、BERT、テンポラルフュージョントランス)が含まれる。
論文 参考訳(メタデータ) (2025-05-23T14:06:42Z) - A multimodal ensemble approach for clear cell renal cell carcinoma treatment outcome prediction [6.199310532720352]
臨床データ,マルチオミクスデータ,および病理組織学的全スライド画像(WSI)データを統合するマルチモーダルアンサンブルモデル(MMEM)を開発した。
MMEMはccRCC患者の全身生存率(OS)と無病生存率(DFS)を予測した。
論文 参考訳(メタデータ) (2024-12-10T02:51:14Z) - HoneyBee: A Scalable Modular Framework for Creating Multimodal Oncology Datasets with Foundational Embedding Models [11.03503711055749]
HONeYBEEは、腫瘍学の応用のために、マルチモーダルなバイオメディカルデータを統合したオープンソースのフレームワークである。
臨床データ(構造化および非構造化)、全スライダー画像、放射線スキャン、分子プロファイルを処理し、統合された患者レベルの埋め込みを生成する。
これらの埋め込みは生存予測、がん型の分類、患者の類似性検索、コホートクラスタリングを可能にする。
論文 参考訳(メタデータ) (2024-05-13T04:35:14Z) - A Meta-GNN approach to personalized seizure detection and classification [53.906130332172324]
本稿では,特定の患者に限られた発作サンプルから迅速に適応できるパーソナライズされた発作検出・分類フレームワークを提案する。
トレーニング患者の集合からグローバルモデルを学ぶメタGNNベースの分類器を訓練する。
本手法は, 未確認患者20回に限って, 精度82.7%, F1スコア82.08%を達成し, ベースラインよりも優れていた。
論文 参考訳(メタデータ) (2022-11-01T14:12:58Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。