論文の概要: Path-GPTOmic: A Balanced Multi-modal Learning Framework for Survival Outcome Prediction
- arxiv url: http://arxiv.org/abs/2403.11375v1
- Date: Mon, 18 Mar 2024 00:02:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-19 17:07:30.160527
- Title: Path-GPTOmic: A Balanced Multi-modal Learning Framework for Survival Outcome Prediction
- Title(参考訳): Path-GPtomic: サバイバルアウトカム予測のためのバランスの取れたマルチモーダル学習フレームワーク
- Authors: Hongxiao Wang, Yang Yang, Zhuo Zhao, Pengfei Gu, Nishchal Sapkota, Danny Z. Chen,
- Abstract要約: 本稿では,癌生存率予測のためのマルチモーダルパスGPTOmicフレームワークを提案する。
基礎モデルである scGPT の埋め込み空間は,最初は単一セルRNA-seq で訓練された。
生存予測のためのCox部分的可能性損失に対応する勾配変調機構を提案する。
- 参考スコア(独自算出の注目度): 14.204637932937082
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: For predicting cancer survival outcomes, standard approaches in clinical research are often based on two main modalities: pathology images for observing cell morphology features, and genomic (e.g., bulk RNA-seq) for quantifying gene expressions. However, existing pathology-genomic multi-modal algorithms face significant challenges: (1) Valuable biological insights regarding genes and gene-gene interactions are frequently overlooked; (2) one modality often dominates the optimization process, causing inadequate training for the other modality. In this paper, we introduce a new multi-modal ``Path-GPTOmic" framework for cancer survival outcome prediction. First, to extract valuable biological insights, we regulate the embedding space of a foundation model, scGPT, initially trained on single-cell RNA-seq data, making it adaptable for bulk RNA-seq data. Second, to address the imbalance-between-modalities problem, we propose a gradient modulation mechanism tailored to the Cox partial likelihood loss for survival prediction. The contributions of the modalities are dynamically monitored and adjusted during the training process, encouraging that both modalities are sufficiently trained. Evaluated on two TCGA(The Cancer Genome Atlas) datasets, our model achieves substantially improved survival prediction accuracy.
- Abstract(参考訳): がん生存率を予測するため、臨床研究における標準的なアプローチは、細胞形態を観察する病理像と、遺伝子発現を定量化するゲノム(例えば、バルクRNA-seq)の2つの主要なモダリティに基づいている。
1)遺伝子と遺伝子-遺伝子相互作用に関する貴重な生物学的洞察は、しばしば見過ごされ、(2)一方のモダリティが最適化プロセスを支配し、他方のモダリティに対する不十分なトレーニングを引き起こす。
本稿では,癌生存率予測のためのマルチモーダル 'Path-GPtomic' フレームワークを提案する。
まず、貴重な生物学的知見を抽出するために、最初は単細胞RNA-seqデータで訓練された基礎モデルの埋め込み空間 scGPT を規制し、バルクRNA-seqデータに適応する。
第2に,不均衡-不均衡-モダリティ問題に対処するため,生存予測のためのCox偏差損失に対応する勾配変調機構を提案する。
モダリティの貢献は、トレーニングプロセス中に動的に監視および調整され、両方のモダリティが十分に訓練されていることを奨励する。
TCGA(The Cancer Genome Atlas)データセットを2つ評価し,生存率予測精度を大幅に改善した。
関連論文リスト
- Semantically Rich Local Dataset Generation for Explainable AI in Genomics [0.716879432974126]
ゲノム配列に基づいて訓練されたブラックボックス深層学習モデルは、異なる遺伝子制御機構の結果を予測するのに優れている。
本稿では、遺伝的プログラミングを用いて、その意味的多様性に寄与する配列の摂動を進化させることによりデータセットを生成することを提案する。
論文 参考訳(メタデータ) (2024-07-03T10:31:30Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images [7.5123289730388825]
ゲノムインフォームドハイパーアテンションネットワーク(G-HANet)は、トレーニング中にヒストリーゲノム知識を効果的に蒸留することができる。
ネットワークは、クロスモーダル・アソシエーション・ブランチ(CAB)とハイパーアテンション・サバイバル・ブランチ(HSB)から構成される。
論文 参考訳(メタデータ) (2024-03-15T06:20:09Z) - Pathology-and-genomics Multimodal Transformer for Survival Outcome
Prediction [43.1748594898772]
大腸癌生存予測に病理学とゲノム学的知見を統合したマルチモーダルトランスフォーマー(PathOmics)を提案する。
ギガピクセル全スライド画像における組織ミクロ環境間の内在的相互作用を捉えるための教師なし事前訓練を強調した。
我々は,TCGA大腸癌と直腸癌コホートの両方に対するアプローチを評価し,提案手法は競争力があり,最先端の研究より優れていることを示す。
論文 参考訳(メタデータ) (2023-07-22T00:59:26Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Deep Biological Pathway Informed Pathology-Genomic Multimodal Survival
Prediction [7.133948707208067]
本稿では,新しい生物学的経路インフォームド・病理-ゲノム深層モデルであるPONETを提案する。
提案手法は優れた予測性能を達成し,有意義な生物学的解釈を明らかにする。
論文 参考訳(メタデータ) (2023-01-06T05:24:41Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - A robust and lightweight deep attention multiple instance learning
algorithm for predicting genetic alterations [4.674211520843232]
本稿では,遺伝子変異を予測するための新しいAttention-based Multiple Instance Mutation Learning (AMIML)モデルを提案する。
AMIMLは連続した1次元畳み込み層、デコーダ、および軽量アテンション機構のさらなる統合を容易にする余剰重量接続から構成されていた。
AMIMLは優れたロバスト性を示し、テスト対象遺伝子の大部分で5つのベースラインアルゴリズムをすべて上回るだけでなく、他の7遺伝子に対してほぼ最高の性能を示した。
論文 参考訳(メタデータ) (2022-05-31T15:45:29Z) - SNP2Vec: Scalable Self-Supervised Pre-Training for Genome-Wide
Association Study [48.75445626157713]
SNP2Vecは、SNPを理解するためのスケーラブルな自己教師付き事前学習手法である。
本研究では,SNP2Vecを用いて時系列ゲノミクスモデリングを行う。
中国コホートにおけるアルツハイマー病のリスク予測におけるアプローチの有効性について検討した。
論文 参考訳(メタデータ) (2022-04-14T01:53:58Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。