論文の概要: Predicting Molecular Phenotypes with Single Cell RNA Sequencing Data: an
Assessment of Unsupervised Machine Learning Models
- arxiv url: http://arxiv.org/abs/2108.05039v1
- Date: Wed, 11 Aug 2021 05:30:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-12 13:15:22.922603
- Title: Predicting Molecular Phenotypes with Single Cell RNA Sequencing Data: an
Assessment of Unsupervised Machine Learning Models
- Title(参考訳): 単細胞RNAシークエンシングデータを用いた分子現象の予測:教師なし機械学習モデルの評価
- Authors: Anastasia Dunca, Frederick R. Adler
- Abstract要約: 本研究は、異種腫瘍における治療抵抗性表現型分類における教師なし機械学習の評価である。
scRNAseqは細胞のmRNAを定量化し、細胞表現型を特徴づける。
このパイプラインから生成されたクラスターは、がん細胞の挙動と悪性成長を理解するために使用できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: According to the National Cancer Institute, there were 9.5 million
cancer-related deaths in 2018. A challenge in improving treatment is resistance
in genetically unstable cells. The purpose of this study is to evaluate
unsupervised machine learning on classifying treatment-resistant phenotypes in
heterogeneous tumors through analysis of single cell RNA sequencing(scRNAseq)
data with a pipeline and evaluation metrics. scRNAseq quantifies mRNA in cells
and characterizes cell phenotypes. One scRNAseq dataset was analyzed
(tumor/non-tumor cells of different molecular subtypes and patient
identifications). The pipeline consisted of data filtering, dimensionality
reduction with Principal Component Analysis, projection with Uniform Manifold
Approximation and Projection, clustering with nine approaches (Ward, BIRCH,
Gaussian Mixture Model, DBSCAN, Spectral, Affinity Propagation, Agglomerative
Clustering, Mean Shift, and K-Means), and evaluation. Seven models divided
tumor versus non-tumor cells and molecular subtype while six models classified
different patient identification (13 of which were presented in the dataset);
K-Means, Ward, and BIRCH often ranked highest with ~80% accuracy on the tumor
versus non-tumor task and ~60% for molecular subtype and patient ID. An
optimized classification pipeline using K-Means, Ward, and BIRCH models was
evaluated to be most effective for further analysis. In clinical research where
there is currently no standard protocol for scRNAseq analysis, clusters
generated from this pipeline can be used to understand cancer cell behavior and
malignant growth, directly affecting the success of treatment.
- Abstract(参考訳): 国立がん研究所によると、2018年のがん関連死亡数は950万人である。
治療改善の課題は、遺伝学的に不安定な細胞に対する耐性である。
本研究の目的は、単一細胞RNAシークエンシング(scRNAseq)データの解析と評価指標を用いて、異種腫瘍における治療抵抗性表現型を分類する教師なし機械学習を評価することである。
scRNAseqは細胞のmRNAを定量化し、細胞表現型を特徴づける。
1つのscRNAseqデータセットを解析した(異なる分子サブタイプの腫瘍/非腫瘍細胞と患者同定)。
このパイプラインは、データフィルタリング、主成分分析による次元減少、一様多様体近似と投影による投影、9つのアプローチ(Ward, BIRCH, Gaussian Mixture Model, DBSCAN, Spectral, Affinity Propagation, Agglomerative Clustering, Mean Shift, K-Means)によるクラスタリング、および評価で構成された。
7つのモデルが腫瘍と非腫瘍細胞と分子サブタイプを分割し、6つのモデルが異なる患者の識別を分類した(うち13つはデータセットで提示された)。
K-Means, Ward, BIRCHモデルを用いた最適化された分類パイプラインが, さらなる解析に最も有効であることが評価された。
現在、scRNAseq解析の標準プロトコルがない臨床研究において、このパイプラインから生成されたクラスターは、がん細胞の挙動と悪性成長を理解でき、治療の成功に直接影響を及ぼす。
関連論文リスト
- Pan-cancer gene set discovery via scRNA-seq for optimal deep learning based downstream tasks [6.869831177092736]
腫瘍生検181例のscRNA-seqデータを13種類の癌で解析した。
高次元重み付き遺伝子共発現ネットワーク解析(hdWGCNA)を行い、関連遺伝子群を同定した。
多層パーセプトロン(MLP)やグラフニューラルネットワーク(GNN)を含むディープラーニングモデルを用いたOncoKBのオンコジーンの評価
論文 参考訳(メタデータ) (2024-08-13T23:24:36Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Self-Normalizing Foundation Model for Enhanced Multi-Omics Data Analysis in Oncology [0.0]
SeNMoは、33のがんタイプにわたるマルチオミクスデータに基づいてトレーニングされた基礎モデルである。
当科では,33のがん部位を含む膵癌マルチオミクスデータを用いて,SeNMoの全身生存を訓練した。
SeNMoはMoffitt Cancer CenterとCPTAC肺扁平上皮癌という2つの独立したコホートで検証された。
論文 参考訳(メタデータ) (2024-05-13T22:45:44Z) - FlowCyt: A Comparative Study of Deep Learning Approaches for Multi-Class Classification in Flow Cytometry Benchmarking [1.6712896227173808]
FlowCytは、フローコードされたデータにおいて、マルチクラスのシングルセル分類のための最初の包括的なベンチマークである。
このデータセットは、30人の患者の骨髄サンプルからなり、各細胞は12個のマーカーで特徴づけられる。
論文 参考訳(メタデータ) (2024-02-28T15:01:59Z) - hist2RNA: An efficient deep learning architecture to predict gene
expression from breast cancer histopathology images [11.822321981275232]
深層学習アルゴリズムは、デジタル病理画像中の形態パターンを効果的に抽出し、分子の表現型を迅速かつ低コストで予測することができる。
我々は,138遺伝子の発現を予測するために,バルクRNAシークエンシング技術にインスパイアされたhist2RNAという新しい計算効率の高い手法を提案する。
論文 参考訳(メタデータ) (2023-04-10T10:54:32Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Multi-scale Deep Learning Architecture for Nucleus Detection in Renal
Cell Carcinoma Microscopy Image [7.437224586066945]
クリアセル腎細胞癌(CCRCC)は、腎癌の研究における腫瘍内異種性の最も一般的な形態の1つです。
本稿では,IHC染色組織像の細胞分類のための深層学習に基づく検出モデルを提案する。
本モデルでは,マルチスケールピラミッドの特徴と局所境界領域からのサリーエンシー情報をマッピングし,回帰によって境界ボックス座標を予測する。
論文 参考訳(メタデータ) (2021-04-28T03:36:02Z) - Cancer Gene Profiling through Unsupervised Discovery [49.28556294619424]
低次元遺伝子バイオマーカーを発見するための,新しい,自動かつ教師なしのフレームワークを提案する。
本手法は,高次元中心型非監視クラスタリングアルゴリズムLP-Stabilityアルゴリズムに基づく。
私達の署名は免疫炎症および免疫砂漠の腫瘍の区別の有望な結果報告します。
論文 参考訳(メタデータ) (2021-02-11T09:04:45Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。