論文の概要: Contrastive Learning for Predicting Cancer Prognosis Using Gene Expression Values
- arxiv url: http://arxiv.org/abs/2306.06276v4
- Date: Thu, 16 May 2024 22:31:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-20 20:43:15.539611
- Title: Contrastive Learning for Predicting Cancer Prognosis Using Gene Expression Values
- Title(参考訳): 遺伝子発現値を用いた癌予後予測のためのコントラスト学習
- Authors: Anchen Sun, Elizabeth J. Franzmann, Zhibin Chen, Xiaodong Cai,
- Abstract要約: 腫瘍を高リスク群または低リスク群に分類するために分類器を訓練する。
CLをベースとした分類では,14種類の癌に対して,AUC (Receer operating characteristic curve) が0.8以上の領域を達成できた。
我々のCLCoxモデルは,TGAデータを用いて訓練し,19種類のがんの予後を予測する上で,既存手法よりも優れていた。
- 参考スコア(独自算出の注目度): 3.1298840947078372
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advancements in image classification have demonstrated that contrastive learning (CL) can aid in further learning tasks by acquiring good feature representation from a limited number of data samples. In this paper, we applied CL to tumor transcriptomes and clinical data to learn feature representations in a low-dimensional space. We then utilized these learned features to train a classifier to categorize tumors into a high- or low-risk group of recurrence. Using data from The Cancer Genome Atlas (TCGA), we demonstrated that CL can significantly improve classification accuracy. Specifically, our CL-based classifiers achieved an area under the receiver operating characteristic curve (AUC) greater than 0.8 for 14 types of cancer, and an AUC greater than 0.9 for 2 types of cancer. We also developed CL-based Cox (CLCox) models for predicting cancer prognosis. Our CLCox models trained with the TCGA data outperformed existing methods significantly in predicting the prognosis of 19 types of cancer under consideration. The performance of CLCox models and CL-based classifiers trained with TCGA lung and prostate cancer data were validated using the data from two independent cohorts. We also show that the CLCox model trained with the whole transcriptome significantly outperforms the Cox model trained with the 21 genes of Oncotype DX that is in clinical use for breast cancer patients. CL-based classifiers and CLCox models for 19 types of cancer are publicly available and can be used to predict cancer prognosis using the RNA-seq transcriptome of an individual tumor. Python codes for model training and testing are also publicly accessible, and can be applied to train new CL-based models using gene expression data of tumors.
- Abstract(参考訳): 近年、画像分類の進歩により、限られたデータサンプルから優れた特徴表現を取得することで、コントラスト学習(CL)がさらなる学習作業を支援することが示されている。
本稿では,腫瘍の転写産物と臨床データにCLを適用し,低次元空間における特徴表現を学習した。
腫瘍を高頻度または低リスクの再発群に分類するための分類器の訓練にこれらの特徴を利用した。
The Cancer Genome Atlas (TCGA)のデータを用いて,CLは分類精度を大幅に向上できることを示した。
具体的には,14種類の癌では,AUCが0.8以上,2種類の癌では0.9以上であった。
また,癌予後を予測するためのCL-based Cox (CLCox) モデルも開発した。
CLCox モデルは,TGA データを用いて訓練し,既存手法よりも有意な性能を示し,検討中の19種類のがんの予後を予測することができた。
TCGA肺および前立腺癌データを訓練したCLCoxモデルとCLベースの分類器の性能を,2つの独立したコホートのデータを用いて検証した。
また,全転写産物で訓練したCLCoxモデルは,乳がん患者に対する臨床応用であるOncotype DXの21遺伝子で訓練したCoxモデルよりも有意に優れていた。
19種類の癌に対するCLベースの分類器およびCLCoxモデルは公開されており、個々の腫瘍のRNA-seq transcriptomeを用いて癌予後を予測するのに使用できる。
モデルトレーニングとテストのためのPythonコードも公開されており、腫瘍の遺伝子発現データを使用して新しいCLベースのモデルのトレーニングに使用することができる。
関連論文リスト
- A Multi-Institutional Open-Source Benchmark Dataset for Breast Cancer
Clinical Decision Support using Synthetic Correlated Diffusion Imaging Data [82.74877848011798]
Cancer-Net BCaは、乳がん患者の画像データであるボリュームCDI$s$の複数機関のオープンソースベンチマークデータセットである。
Cancer-Net BCaは、機械学習の進歩を加速し、がんと戦う臨床医を助ける、グローバルなオープンソースイニシアチブの一部として、一般公開されている。
論文 参考訳(メタデータ) (2023-04-12T05:41:44Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Improving Precancerous Case Characterization via Transformer-based
Ensemble Learning [31.891340667123124]
自然言語処理のがん病理学報告への応用は、がん症例の検出に焦点が当てられている。
先天性腺腫のキャラクタリゼーションの改善は、早期がんの検出と予防のための診断試験の開発を支援する。
以上の結果から,NLPを用いて早期がん予防のための診断試験の開発を促進できる可能性が示唆された。
論文 参考訳(メタデータ) (2022-12-10T00:06:28Z) - Gene selection from microarray expression data: A Multi-objective PSO
with adaptive K-nearest neighborhood [0.0]
本稿では,遺伝子発現データを用いたヒト癌疾患の分類問題について論じる。
マイクロアレイデータセットを解析し,がん疾患を効果的に分類するための新しい手法を提案する。
論文 参考訳(メタデータ) (2022-05-27T04:22:10Z) - Open-Set Recognition of Breast Cancer Treatments [91.3247063132127]
オープンセット認識は、テストサンプルをトレーニングや"未知"から既知のクラスの1つに分類することで、分類タスクを一般化する
乳がん患者データに対して,画像データセットの最先端結果を実現するガウス混合変分オートエンコーダモデルを適用した。
より正確でロバストな分類結果が得られ,F1の平均値が24.5%上昇したばかりでなく,臨床環境への展開性の観点からも,オープンセット認識の再検討を行った。
論文 参考訳(メタデータ) (2022-01-09T04:35:55Z) - Deep Learning Based Model for Breast Cancer Subtype Classification [3.419451872918847]
本稿では,乳癌の4つのサブタイプ(Basal,Her2,LumA,LumB)の分類における遺伝子発現データの利用に焦点を当てた。
オートエンコーダを用いて、特徴セットのサイズを20,530の遺伝子発現値から500に縮小する。
第1ステージと第2ステージのネットワークを併用することにより,TGA乳癌データセット上で平均10倍の精度0.907を達成できた。
論文 参考訳(メタデータ) (2021-11-06T17:15:35Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Topological Data Analysis of copy number alterations in cancer [70.85487611525896]
癌ゲノム情報に含まれる情報を新しいトポロジに基づくアプローチで捉える可能性を探る。
本手法は, 癌体性遺伝データに有意な低次元表現を抽出する可能性を秘めている。
論文 参考訳(メタデータ) (2020-11-22T17:31:23Z) - Machine Learning Against Cancer: Accurate Diagnosis of Cancer by Machine
Learning Classification of the Whole Genome Sequencing Data [0.0]
我々は,MLAC(Machine Learning Against Cancer)の新たな手法を開発し,完全精度,感度,特異性を実現した。
The Cancer Genome Atlas and Genotype-Tissue Expression project for cancerous and healthy tissues。
論文 参考訳(メタデータ) (2020-09-12T18:51:47Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Iteratively Pruned Deep Learning Ensembles for COVID-19 Detection in
Chest X-rays [3.785818062712446]
この病気は、SARS-CoV-2(SARS-CoV-2)ウイルスによって引き起こされる。
カスタム畳み込みニューラルネットワークとImageNet事前訓練モデルの選択を患者レベルでトレーニングし、評価する。
学習した知識は、パフォーマンスと一般化を改善するために伝達され、微調整される。
論文 参考訳(メタデータ) (2020-04-16T00:09:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。