論文の概要: A Novel cVAE-Augmented Deep Learning Framework for Pan-Cancer RNA-Seq Classification
- arxiv url: http://arxiv.org/abs/2508.02743v1
- Date: Sat, 02 Aug 2025 16:57:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-06 18:18:55.601933
- Title: A Novel cVAE-Augmented Deep Learning Framework for Pan-Cancer RNA-Seq Classification
- Title(参考訳): パンキャンサRNA-Seq分類のための新しいcVAE拡張ディープラーニングフレームワーク
- Authors: Vinil Polepalli,
- Abstract要約: 本研究では,cVAE (class-conditional variational autoencoder) を用いて,パン・カンサー遺伝子発現分類のためのトレーニングデータを拡張する新しいディープラーニングフレームワークを提案する。
本稿では、VAEトレーニング曲線、性能指標(ROC曲線と混乱行列)、アーキテクチャ図など、詳細な実験結果を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pan-cancer classification using transcriptomic (RNA-Seq) data can inform tumor subtyping and therapy selection, but is challenging due to extremely high dimensionality and limited sample sizes. In this study, we propose a novel deep learning framework that uses a class-conditional variational autoencoder (cVAE) to augment training data for pan-cancer gene expression classification. Using 801 tumor RNA-Seq samples spanning 5 cancer types from The Cancer Genome Atlas (TCGA), we first perform feature selection to reduce 20,531 gene expression features to the 500 most variably expressed genes. A cVAE is then trained on this data to learn a latent representation of gene expression conditioned on cancer type, enabling the generation of synthetic gene expression samples for each tumor class. We augment the training set with these cVAE-generated samples (doubling the dataset size) to mitigate overfitting and class imbalance. A two-layer multilayer perceptron (MLP) classifier is subsequently trained on the augmented dataset to predict tumor type. The augmented framework achieves high classification accuracy (~98%) on a held-out test set, substantially outperforming a classifier trained on the original data alone. We present detailed experimental results, including VAE training curves, classifier performance metrics (ROC curves and confusion matrix), and architecture diagrams to illustrate the approach. The results demonstrate that cVAE-based synthetic augmentation can significantly improve pan-cancer prediction performance, especially for underrepresented cancer classes.
- Abstract(参考訳): RNA-Seqデータを用いた膵癌分類は, 腫瘍の亜型化と治療選択を通知するが, 極めて高次元性, 限られたサンプルサイズのため, 困難である。
本研究では,クラス条件変分オートエンコーダ(cVAE)を用いた新しいディープラーニングフレームワークを提案する。
The Cancer Genome Atlas (TCGA) の5種類の癌にまたがる801のRNA-Seqサンプルを用いて、最初に特徴選択を行い、20,531の遺伝子発現特徴を最も可変に発現する500の遺伝子に還元する。
次に、このデータに基づいてcVAEを訓練し、がんタイプで条件付けられた遺伝子発現の潜伏表現を学習し、腫瘍クラスごとに合成遺伝子発現サンプルを生成する。
トレーニングセットをこれらのcVAE生成サンプル(データセットサイズを2倍にする)で強化し、オーバーフィッティングとクラス不均衡を軽減する。
その後、拡張データセット上で2層多層パーセプトロン(MLP)分類器を訓練し、腫瘍の型を予測する。
拡張フレームワークは、保持されたテストセット上で高い分類精度(約98%)を達成し、元のデータだけで訓練された分類器を大幅に上回る。
本稿では,VAEトレーニング曲線,分類器性能指標(ROC曲線と混乱行列),アーキテクチャ図などの詳細な実験結果を紹介する。
以上の結果から,cVAEをベースとした合成増強は膵癌予知性能を著しく向上させる可能性が示唆された。
関連論文リスト
- Interpretable Graph Kolmogorov-Arnold Networks for Multi-Cancer Classification and Biomarker Identification using Multi-Omics Data [36.92842246372894]
Multi-Omics Graph Kolmogorov-Arnold Network (MOGKAN)は、メッセンジャーRNA、マイクロRNA配列、DNAメチル化サンプルを利用するディープラーニングフレームワークである。
グラフに基づく深層学習とマルチオミクスデータを統合することにより,提案手法は頑健な予測性能と解釈可能性を示す。
論文 参考訳(メタデータ) (2025-03-29T02:14:05Z) - LASSO-MOGAT: A Multi-Omics Graph Attention Framework for Cancer Classification [41.94295877935867]
本稿では,メッセンジャーRNA,マイクロRNA,DNAメチル化データを統合し,31種類のがんを分類するグラフベースのディープラーニングフレームワークLASSO-MOGATを紹介する。
論文 参考訳(メタデータ) (2024-08-30T16:26:04Z) - Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development [59.74920439478643]
本稿では,多様なERUSシナリオをカバーする最初のベンチマークデータセットを収集し,注釈付けする。
ERUS-10Kデータセットは77の動画と10,000の高解像度アノテートフレームで構成されています。
本稿では,ASTR (Adaptive Sparse-context TRansformer) という大腸癌セグメンテーションのベンチマークモデルを提案する。
論文 参考訳(メタデータ) (2024-08-19T15:04:42Z) - Pan-cancer gene set discovery via scRNA-seq for optimal deep learning based downstream tasks [6.869831177092736]
腫瘍生検181例のscRNA-seqデータを13種類の癌で解析した。
高次元重み付き遺伝子共発現ネットワーク解析(hdWGCNA)を行い、関連遺伝子群を同定した。
多層パーセプトロン(MLP)やグラフニューラルネットワーク(GNN)を含むディープラーニングモデルを用いたOncoKBのオンコジーンの評価
論文 参考訳(メタデータ) (2024-08-13T23:24:36Z) - Contrastive Learning for Predicting Cancer Prognosis Using Gene Expression Values [3.1298840947078372]
腫瘍を高リスク群または低リスク群に分類するために分類器を訓練する。
CLをベースとした分類では,14種類の癌に対して,AUC (Receer operating characteristic curve) が0.8以上の領域を達成できた。
我々のCLCoxモデルは,TGAデータを用いて訓練し,19種類のがんの予後を予測する上で,既存手法よりも優れていた。
論文 参考訳(メタデータ) (2023-06-09T22:03:18Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Gene selection from microarray expression data: A Multi-objective PSO
with adaptive K-nearest neighborhood [0.0]
本稿では,遺伝子発現データを用いたヒト癌疾患の分類問題について論じる。
マイクロアレイデータセットを解析し,がん疾患を効果的に分類するための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-27T04:22:10Z) - Deep Learning Based Model for Breast Cancer Subtype Classification [3.419451872918847]
本稿では,乳癌の4つのサブタイプ(Basal,Her2,LumA,LumB)の分類における遺伝子発現データの利用に焦点を当てた。
オートエンコーダを用いて、特徴セットのサイズを20,530の遺伝子発現値から500に縮小する。
第1ステージと第2ステージのネットワークを併用することにより,TGA乳癌データセット上で平均10倍の精度0.907を達成できた。
論文 参考訳(メタデータ) (2021-11-06T17:15:35Z) - DeepGene Transformer: Transformer for the gene expression-based classification of cancer subtypes [5.179504118679301]
がんとそのサブタイプは世界中の死因の約30%を占める。
マルチヘッド自己認識モジュールを用いた高次元遺伝子発現の複雑さに対処するDeepGene Transformerを提案する。
論文 参考訳(メタデータ) (2021-08-26T15:02:55Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Machine Learning Against Cancer: Accurate Diagnosis of Cancer by Machine
Learning Classification of the Whole Genome Sequencing Data [0.0]
我々は,MLAC(Machine Learning Against Cancer)の新たな手法を開発し,完全精度,感度,特異性を実現した。
The Cancer Genome Atlas and Genotype-Tissue Expression project for cancerous and healthy tissues。
論文 参考訳(メタデータ) (2020-09-12T18:51:47Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。