論文の概要: MS-ConTab: Multi-Scale Contrastive Learning of Mutation Signatures for Pan Cancer Representation and Stratification
- arxiv url: http://arxiv.org/abs/2508.19424v1
- Date: Tue, 26 Aug 2025 20:42:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.422484
- Title: MS-ConTab: Multi-Scale Contrastive Learning of Mutation Signatures for Pan Cancer Representation and Stratification
- Title(参考訳): MS-ConTab:パン癌表現と成層化のための変異シグナルのマルチスケールコントラスト学習
- Authors: Yifan Dou, Adam Khadre, Ruben C Petreaca, Golrokh Mirzaei,
- Abstract要約: 43種類のがんをクラスタリングするための非教師なしコントラスト学習フレームワークを新たに導入する。
がんの種類ごとに2つの相補的な突然変異の署名を構築した。
得られた潜在表現が生物学的に有意ながんの集団を生じることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivation. Understanding the pan-cancer mutational landscape offers critical insights into the molecular mechanisms underlying tumorigenesis. While patient-level machine learning techniques have been widely employed to identify tumor subtypes, cohort-level clustering, where entire cancer types are grouped based on shared molecular features, has largely relied on classical statistical methods. Results. In this study, we introduce a novel unsupervised contrastive learning framework to cluster 43 cancer types based on coding mutation data derived from the COSMIC database. For each cancer type, we construct two complementary mutation signatures: a gene-level profile capturing nucleotide substitution patterns across the most frequently mutated genes, and a chromosome-level profile representing normalized substitution frequencies across chromosomes. These dual views are encoded using TabNet encoders and optimized via a multi-scale contrastive learning objective (NT-Xent loss) to learn unified cancer-type embeddings. We demonstrate that the resulting latent representations yield biologically meaningful clusters of cancer types, aligning with known mutational processes and tissue origins. Our work represents the first application of contrastive learning to cohort-level cancer clustering, offering a scalable and interpretable framework for mutation-driven cancer subtyping.
- Abstract(参考訳): モチベーション。
汎癌変異の風景を理解することは、腫瘍遺伝の基盤となる分子機構に関する重要な洞察を与える。
患者レベルの機械学習技術は腫瘍のサブタイプを特定するために広く用いられているが、コホートレベルのクラスタリングでは、がんのタイプ全体が共有分子の特徴に基づいてグループ化され、古典的な統計手法に大きく依存している。
結果。
本研究では,COSMICデータベースから得られたコード変異データに基づいて,43種類のがんをクラスタリングする新しい教師なしコントラスト学習フレームワークを提案する。
各がんタイプに対して、最も頻繁に変異される遺伝子にまたがるヌクレオチド置換パターンをキャプチャする遺伝子レベルプロファイルと、染色体間で正常化された置換頻度を表す染色体レベルプロファイルの2つの相補的突然変異署名を構築した。
これらの双対ビューは、TabNetエンコーダを用いて符号化され、マルチスケールのコントラスト学習目標(NT-Xent損失)を用いて最適化され、ガン型埋め込みを学習する。
得られた潜在表現は、既知の突然変異過程や組織の起源と整合して、生物学的に有意ながんタイプのクラスターを生じることを実証する。
我々の研究は、コホートレベルのがんクラスタリングへのコントラスト学習の最初の応用であり、変異駆動型がんサブタイプのためのスケーラブルで解釈可能なフレームワークを提供する。
関連論文リスト
- DLSOM: A Deep learning-based strategy for liver cancer subtyping [0.0]
肝がんは世界中でがん関連死亡の原因となっている。
本研究は,1,139個の肝癌サンプルの体細胞突然変異の全体像を解析するために,積み重ねオートエンコーダを用いたディープラーニングフレームワークであるDLSOMを紹介する。
論文 参考訳(メタデータ) (2024-12-15T23:13:29Z) - Multimodal Prototyping for cancer survival prediction [45.61869793509184]
ギガピクセルヒストロジー全体スライディング画像(WSI)と転写学的プロファイルを組み合わせたマルチモーダルサバイバル法は,患者の予後と成層化に特に有望である。
現在のアプローチでは、WSIを小さなパッチ(>10,000パッチ)にトークン化し、トランスクリプトミクスを遺伝子グループに分割し、結果を予測するためにTransformerを使用して統合する。
このプロセスは多くのトークンを生成し、これは注意を計算するための高いメモリ要求をもたらし、ポストホック解釈可能性分析を複雑にする。
我々のフレームワークは、新しい解釈可能性解析を解き放ちながら、はるかに少ない計算で最先端の手法より優れている。
論文 参考訳(メタデータ) (2024-06-28T20:37:01Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - MoCLIM: Towards Accurate Cancer Subtyping via Multi-Omics Contrastive
Learning with Omics-Inference Modeling [9.900594964709116]
我々は癌サブタイプのための表現学習フレームワークであるMoCLIMを開発した。
その結果,本手法は,高次元癌症例の少ない症例において,データ適合性やサブタイプ性能を著しく向上させることが示唆された。
本フレームワークは, 各種医療評価を最終要素として含み, 医療分析における高い解釈可能性を提供する。
論文 参考訳(メタデータ) (2023-08-17T10:49:48Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - DeepGene Transformer: Transformer for the gene expression-based classification of cancer subtypes [5.179504118679301]
がんとそのサブタイプは世界中の死因の約30%を占める。
マルチヘッド自己認識モジュールを用いた高次元遺伝子発現の複雑さに対処するDeepGene Transformerを提案する。
論文 参考訳(メタデータ) (2021-08-26T15:02:55Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。