論文の概要: Self-Normalizing Foundation Model for Enhanced Multi-Omics Data Analysis in Oncology
- arxiv url: http://arxiv.org/abs/2405.08226v2
- Date: Sun, 03 Nov 2024 17:07:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-05 14:38:09.225136
- Title: Self-Normalizing Foundation Model for Enhanced Multi-Omics Data Analysis in Oncology
- Title(参考訳): オンコロジーにおける高次マルチオミクスデータ解析のための自己Normalizing Foundation Model
- Authors: Asim Waqas, Aakash Tripathi, Sabeen Ahmed, Ashwin Mukund, Hamza Farooq, Matthew B. Schabath, Paul Stewart, Mia Naeini, Ghulam Rasool,
- Abstract要約: SeNMoは、33のがんタイプにわたるマルチオミクスデータに基づいてトレーニングされた基礎モデルである。
当科では,33のがん部位を含む膵癌マルチオミクスデータを用いて,SeNMoの全身生存を訓練した。
SeNMoはMoffitt Cancer CenterとCPTAC肺扁平上皮癌という2つの独立したコホートで検証された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Multi-omics research has enhanced our understanding of cancer heterogeneity and progression. Investigating molecular data through multi-omics approaches is crucial for unraveling the complex biological mechanisms underlying cancer, thereby enabling more effective diagnosis, treatment, and prevention strategies. However, predicting patient outcomes through the integration of all available multi-omics data is still an under-study research direction. Here, we present SeNMo, a foundation model that has been trained on multi-omics data across 33 cancer types. SeNMo is particularly efficient in handling multi-omics data characterized by high-width and low-length attributes. We trained SeNMo for the task of overall survival of patients using pan-cancer multi-omics data involving 33 cancer sites from the GDC. The training multi-omics data includes gene expression, DNA methylation, miRNA expression, DNA mutations, protein expression modalities, and clinical data. SeNMo was validated on two independent cohorts: Moffitt Cancer Center and CPTAC lung squamous cell carcinoma. We evaluated the model's performance in predicting patient's overall survival using the C-Index. SeNMo performed consistently well in the training regime, reflected by the validation C-Index of 0.76 on GDC's public data. In the testing regime, SeNMo performed with a C-Index of 0.758 on a held-out test set. The model showed an average accuracy of 99.8% on the task of classifying the primary cancer type on the pan-cancer test cohort. SeNMo demonstrated robust performance on the classification task of predicting the primary cancer type of patients. SeNMo further demonstrated significant performance in predicting tertiary lymph structures from multi-omics data, showing generalizability across cancer types, molecular data types, and clinical endpoints.
- Abstract(参考訳): マルチオミクス研究は、がんの不均一性と進行の理解を深めた。
マルチオミクスアプローチによる分子データの調査は、がんの根底にある複雑な生物学的メカニズムの解明に不可欠であり、より効果的な診断、治療、予防戦略を可能にする。
しかし、利用可能な全マルチオミクスデータを統合することで患者の結果を予測することは、まだ研究の方向性としては未練である。
本稿では,33種類の癌に対してマルチオミクスデータをトレーニングした基礎モデルであるSeNMoを紹介する。
SeNMoは特に、高幅および低長の属性を特徴とするマルチオミクスデータを扱うのに効率的である。
我々は,GDCの33のがん部位を含むパン・カンサー・マルチオミクスデータを用いて,SeNMoの全身生存を訓練した。
トレーニングマルチオミクスデータは、遺伝子発現、DNAメチル化、miRNA発現、DNA突然変異、タンパク質発現モダリティ、臨床データを含む。
SeNMoはMoffitt Cancer CenterとCPTAC肺扁平上皮癌という2つの独立したコホートで検証された。
C-Indexを用いた全身生存予測におけるモデルの性能評価を行った。
SeNMoは、GDCの公開データに対するC-Indexの0.76の検証により、トレーニング体制において一貫して良好に機能した。
テスト体制では、SeNMoはホールドアウトテストセットでC-Indexの0.758で実行された。
このモデルでは、膵臓検査コホートにおける原発性がんのタイプを分類する作業において、平均99.8%の精度を示した。
SeNMoは原発性癌の種類を予測するための分類課題に頑健な成績を示した。
さらにSeNMoは, 癌の種類, 分子データ型, 臨床エンドポイントにまたがる一般化性を示すマルチオミクスデータから第3次リンパ構造を予測する上で, 有意な性能を示した。
関連論文リスト
- Multi-modal Medical Image Fusion For Non-Small Cell Lung Cancer Classification [7.002657345547741]
非小細胞肺癌(NSCLC)は、世界中のがん死亡の主な原因である。
本稿では, 融合医療画像(CT, PET)と臨床健康記録, ゲノムデータとを合成する, マルチモーダルデータの革新的な統合について紹介する。
NSCLCの検出と分類精度の大幅な向上により,本研究は既存のアプローチを超越している。
論文 参考訳(メタデータ) (2024-09-27T12:59:29Z) - Embedding-based Multimodal Learning on Pan-Squamous Cell Carcinomas for Improved Survival Outcomes [0.0]
PARADIGMは、マルチモーダルで異質なデータセットから学習し、臨床結果の予測を改善するフレームワークである。
膵扁平上皮癌においてGNNを訓練し,Moffitt Cancer Center肺SCCデータに対するアプローチを検証した。
我々のソリューションは、患者の状況を包括的に理解することを目的としており、異種データ統合と最大データビューの収束の利点についての洞察を提供する。
論文 参考訳(メタデータ) (2024-06-11T22:19:14Z) - CIMIL-CRC: a clinically-informed multiple instance learning framework
for patient-level colorectal cancer molecular subtypes classification from
H\&E stained images [45.32169712547367]
CIMIL-CRCは、事前学習した特徴抽出モデルと主成分分析(PCA)を効率よく組み合わせ、全てのパッチから情報を集約することで、MSI/MSS MIL問題を解決するフレームワークである。
我々は,TCGA-CRC-DXコホートを用いたモデル開発のための5倍のクロスバリデーション実験装置を用いて,曲線下平均面積(AUC)を用いてCIMIL-CRC法の評価を行った。
論文 参考訳(メタデータ) (2024-01-29T12:56:11Z) - Cancer-Net PCa-Gen: Synthesis of Realistic Prostate Diffusion Weighted
Imaging Data via Anatomic-Conditional Controlled Latent Diffusion [68.45407109385306]
カナダでは、前立腺がんは男性でもっとも一般的ながんであり、2022年のこの人口統計では、新しいがん症例の20%を占めている。
拡散強調画像(DWI)データを用いた前立腺癌診断,予後,治療計画のためのディープニューラルネットワークの開発には大きな関心が寄せられている。
本研究では,解剖学的条件制御型潜伏拡散戦略の導入により,現実的な前立腺DWIデータを生成するための潜伏拡散の有効性について検討した。
論文 参考訳(メタデータ) (2023-11-30T15:11:03Z) - Gene-MOE: A sparsely gated prognosis and classification framework
exploiting pan-cancer genomic information [13.57379781623848]
そこで本研究では, RNA-seq解析フレームワークであるGene-MOEについて紹介する。
Gene-MOEは、分析精度を高めるために、MOE層とアテンションエキスパート層の混合物のポテンシャルを利用する。
事前訓練を通じて33種類のがんからパンがん情報を統合することで、過度に適合する課題に対処する。
論文 参考訳(メタデータ) (2023-11-29T07:09:25Z) - Cancer-Net PCa-Data: An Open-Source Benchmark Dataset for Prostate
Cancer Clinical Decision Support using Synthetic Correlated Diffusion Imaging
Data [75.77035221531261]
Cancer-Net PCa-Dataは、PCa患者の画像データであるボリュームCDI$s$のオープンソースベンチマークデータセットである。
Cancer-Net PCa-Dataは、PCa用のCDI$s$画像データの最初の公開データセットである。
論文 参考訳(メタデータ) (2023-11-20T10:28:52Z) - Pathology-and-genomics Multimodal Transformer for Survival Outcome
Prediction [43.1748594898772]
大腸癌生存予測に病理学とゲノム学的知見を統合したマルチモーダルトランスフォーマー(PathOmics)を提案する。
ギガピクセル全スライド画像における組織ミクロ環境間の内在的相互作用を捉えるための教師なし事前訓練を強調した。
我々は,TCGA大腸癌と直腸癌コホートの両方に対するアプローチを評価し,提案手法は競争力があり,最先端の研究より優れていることを示す。
論文 参考訳(メタデータ) (2023-07-22T00:59:26Z) - Deep Orthogonal Fusion: Multimodal Prognostic Biomarker Discovery
Integrating Radiology, Pathology, Genomic, and Clinical Data [0.32622301272834525]
グリオーマ患者の生存率 (OS) を, 深層直交核融合モデルを用いて予測した。
このモデルは、MRI検査、生検に基づくモダリティ、臨床変数から得た情報を総合的なマルチモーダルリスクスコアに組み合わせることを学ぶ。
グリオーマ患者を臨床的サブセット内でOSにより明らかに層分けし、予後不良な臨床グレーディングと分子サブタイプにさらに粒度を付加する。
論文 参考訳(メタデータ) (2021-07-01T17:59:01Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。