論文の概要: Multimodal Survival Modeling in the Age of Foundation Models
- arxiv url: http://arxiv.org/abs/2505.07683v1
- Date: Mon, 12 May 2025 15:47:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.463652
- Title: Multimodal Survival Modeling in the Age of Foundation Models
- Title(参考訳): 基礎モデル時代におけるマルチモーダルサバイバルモデリング
- Authors: Steven Song, Morgan Borjigin-Wang, Irene Madejski, Robert L. Grossman,
- Abstract要約: マルチモーダル核融合の容易かつ付加的な効果を示す。
全体として、FMと病理報告からの情報抽出を利用して、生存のモデリングを近代化する。
- 参考スコア(独自算出の注目度): 1.1029725477806065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Cancer Genome Atlas (TCGA) has enabled novel discoveries and served as a large-scale reference through its harmonized genomics, clinical, and image data. Prior studies have trained bespoke cancer survival prediction models from unimodal or multimodal TCGA data. A modern paradigm in biomedical deep learning is the development of foundation models (FMs) to derive meaningful feature embeddings, agnostic to a specific modeling task. Biomedical text especially has seen growing development of FMs. While TCGA contains free-text data as pathology reports, these have been historically underutilized. Here, we investigate the feasibility of training classical, multimodal survival models over zero-shot embeddings extracted by FMs. We show the ease and additive effect of multimodal fusion, outperforming unimodal models. We demonstrate the benefit of including pathology report text and rigorously evaluate the effect of model-based text summarization and hallucination. Overall, we modernize survival modeling by leveraging FMs and information extraction from pathology reports.
- Abstract(参考訳): 癌ゲノムアトラス(TCGA)は、新しい発見を可能にし、その調和したゲノム学、臨床、画像データを通じて大規模な参照として機能している。
これまでの研究では、単調またはマルチモーダルTCGAデータから、Bespoke癌生存予測モデルを訓練してきた。
バイオメディカルディープラーニングの現代的なパラダイムは、特定のモデリングタスクに非依存な有意義な特徴埋め込みを導出する基礎モデル(FM)の開発である。
バイオメディカルテキストは特にFMの開発が増加している。
TCGAは、病理報告として自由テキストデータを含んでいるが、これらは歴史的に未利用である。
本稿では,FMから抽出したゼロショット埋め込みを用いた古典的マルチモーダルサバイバルモデルのトレーニングの実現可能性について検討する。
マルチモーダル核融合の容易かつ付加的な効果を示す。
我々は,病理報告テキストを含めることの利点を実証し,モデルに基づくテキスト要約と幻覚の効果を厳格に評価する。
全体として、FMと病理報告からの情報抽出を利用して、生存のモデリングを近代化する。
関連論文リスト
- A Data-Efficient Pan-Tumor Foundation Model for Oncology CT Interpretation [17.993838581176902]
PASTAは、46の腫瘍学タスクのうち45の最先端のパフォーマンスを達成するパン腫瘍CT基盤モデルである。
PASTA-Genは、ピクセルレベルのアノテート病変とペア構造レポートを備えた3万個のCTスキャンの包括的なデータセットを生成する。
論文 参考訳(メタデータ) (2025-02-10T05:45:03Z) - Clinical-grade Multi-Organ Pathology Report Generation for Multi-scale Whole Slide Images via a Semantically Guided Medical Text Foundation Model [3.356716093747221]
患者に対する病理報告を生成するために, 患者レベル多臓器報告生成(PMPRG)モデルを提案する。
我々のモデルはMETEORスコア0.68を達成し、我々のアプローチの有効性を実証した。
論文 参考訳(メタデータ) (2024-09-23T22:22:32Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - HEALNet: Multimodal Fusion for Heterogeneous Biomedical Data [10.774128925670183]
本稿では,フレキシブルなマルチモーダル融合アーキテクチャであるHybrid Early-fusion Attention Learning Network (HEALNet)を提案する。
The Cancer Genome Atlas (TCGA) の4つのがんデータセットにおける全スライド画像と多モードデータを用いたマルチモーダルサバイバル解析を行った。
HEALNetは、他のエンドツーエンドの訓練された融合モデルと比較して最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2023-11-15T17:06:26Z) - PathLDM: Text conditioned Latent Diffusion Model for Histopathology [62.970593674481414]
そこで我々は,高品質な病理像を生成するためのテキスト条件付き遅延拡散モデルPathLDMを紹介した。
提案手法は画像とテキストデータを融合して生成プロセスを強化する。
我々は,TCGA-BRCAデータセット上でのテキスト・ツー・イメージ生成において,SoTA FIDスコア7.64を達成し,FID30.1と最も近いテキスト・コンディショナブル・コンペティタを著しく上回った。
論文 参考訳(メタデータ) (2023-09-01T22:08:32Z) - Classification of lung cancer subtypes on CT images with synthetic
pathological priors [41.75054301525535]
同症例のCT像と病理像との間には,画像パターンに大規模な関連性が存在する。
肺がんサブタイプをCT画像上で正確に分類するための自己生成型ハイブリッド機能ネットワーク(SGHF-Net)を提案する。
論文 参考訳(メタデータ) (2023-08-09T02:04:05Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。