論文の概要: A systematic evaluation of methods for cell phenotype classification
using single-cell RNA sequencing data
- arxiv url: http://arxiv.org/abs/2110.00681v1
- Date: Fri, 1 Oct 2021 23:24:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-05 15:07:07.604602
- Title: A systematic evaluation of methods for cell phenotype classification
using single-cell RNA sequencing data
- Title(参考訳): 単細胞RNAシークエンシングデータを用いた細胞型分類法の体系的評価
- Authors: Xiaowen Cao, Li Xing, Elham Majd, Hua He, Junhua Gu, Xuekui Zhang
- Abstract要約: 本研究は、細胞表現型を分類する13の一般的な教師付き機械学習アルゴリズムを評価する。
研究結果から、ElasticNetと対話は、中小のデータセットで最善を尽くしたことが示された。
- 参考スコア(独自算出の注目度): 7.62849213621469
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: Single-cell RNA sequencing (scRNA-seq) yields valuable insights
about gene expression and gives critical information about complex tissue
cellular composition. In the analysis of single-cell RNA sequencing, the
annotations of cell subtypes are often done manually, which is time-consuming
and irreproducible. Garnett is a cell-type annotation software based the on
elastic net method. Besides cell-type annotation, supervised machine learning
methods can also be applied to predict other cell phenotypes from genomic data.
Despite the popularity of such applications, there is no existing study to
systematically investigate the performance of those supervised algorithms in
various sizes of scRNA-seq data sets.
Methods and Results: This study evaluates 13 popular supervised machine
learning algorithms to classify cell phenotypes, using published real and
simulated data sets with diverse cell sizes. The benchmark contained two parts.
In the first part, we used real data sets to assess the popular supervised
algorithms' computing speed and cell phenotype classification performance. The
classification performances were evaluated using AUC statistics, F1-score,
precision, recall, and false-positive rate. In the second part, we evaluated
gene selection performance using published simulated data sets with a known
list of real genes.
Conclusion: The study outcomes showed that ElasticNet with interactions
performed best in small and medium data sets. NB was another appropriate method
for medium data sets. In large data sets, XGB works excellent. Ensemble
algorithms were not significantly superior to individual machine learning
methods. Adding interactions to ElasticNet can help, and the improvement was
significant in small data sets.
- Abstract(参考訳): 背景: 単細胞RNAシークエンシング(scRNA-seq)は遺伝子発現に関する貴重な洞察を与え、複雑な組織細胞組成について重要な情報を与える。
単細胞rnaシークエンシングの解析において、細胞サブタイプのアノテーションはしばしば手動で行われ、これは時間消費であり、再現不可能である。
garnettは、elastic netメソッドに基づいたセル型のアノテーションソフトウェアである。
細胞型アノテーションの他に、教師付き機械学習手法はゲノムデータから他の細胞表現型を予測するためにも応用できる。
このような応用が普及しているにもかかわらず、これらの教師付きアルゴリズムの性能を様々なサイズのscRNA-seqデータセットで体系的に研究する研究は存在しない。
方法と結果: 本研究は,13種類の教師付き機械学習アルゴリズムを評価し,細胞サイズの異なる実データとシミュレーションデータセットを用いて細胞表現型を分類する。
ベンチマークには2つの部分が含まれていた。
まず,一般的な教師付きアルゴリズムの計算速度とセル表現型分類性能を評価するために,実データを用いた。
分類性能はAUC統計,F1スコア,精度,リコール,偽陽性率を用いて評価した。
第2部では、既知の実遺伝子リストを持つシミュレーションデータセットを用いて、遺伝子選択性能の評価を行った。
結論: 調査の結果、ElasticNetと相互作用は、中小のデータセットで最もよく機能したことがわかった。
NBは媒体データセットの別の適切な方法であった。
大きなデータセットでは、xgbは素晴らしい働きをします。
アンサンブルアルゴリズムは個々の機械学習手法にはあまり優れていなかった。
ElasticNetへのインタラクションの追加は有効であり、小さなデータセットでは改善が重要だった。
関連論文リスト
- Lower-dimensional projections of cellular expression improves cell type classification from single-cell RNA sequencing [12.66369956714212]
単細胞RNAシークエンシング(scRNA-seq)は単細胞レベルでの細胞多様性の研究を可能にする。
細胞型分類には, 統計的, 機械的, 深層学習に基づく様々な手法が提案されている。
本研究では,EnProCellと呼ばれる細胞型分類のための参照型手法を提案する。
論文 参考訳(メタデータ) (2024-10-13T19:01:38Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Prompt-based Grouping Transformer for Nucleus Detection and
Classification [70.55961378096116]
核の検出と分類は、疾患の診断に有効な情報を生み出す。
既存のほとんどの手法は、核を独立に分類するか、核とそのグループの特徴の間の意味的類似性を十分に利用しない。
グループ変換器をベースとした新しいエンドツーエンドの原子核検出・分類フレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-22T04:50:48Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Optirank: classification for RNA-Seq data with optimal ranking reference
genes [0.0]
そこで我々は,ロジスティック回帰モデルであるOptiicrankを提案し,モデルと遺伝子のパラメータを同時に学習し,ランキングの基準セットとして使用する。
また、列車データと試験データの間に異なる種類の分散シフトを示す実際の分類タスクについても検討する。
論文 参考訳(メタデータ) (2023-01-11T10:49:06Z) - CloudPred: Predicting Patient Phenotypes From Single-cell RNA-seq [6.669618903574761]
単細胞RNAシークエンシング(scRNA-seq)は、病気の予後と精密な医学を知らせる強力な高解像度のシグネチャを提供する可能性がある。
本稿では,cRNA-seqデータから個人の病気の表現型を予測するために,解釈可能な機械学習アルゴリズムであるCloudPredを開発した。
論文 参考訳(メタデータ) (2021-10-13T22:41:30Z) - Approximate kNN Classification for Biomedical Data [1.1852406625172218]
Single-cell RNA-seq (scRNA-seq) は、将来性はあるが重要な計算課題を持つDNAシークエンシング技術である。
scRNA-seqデータにおけるkNN分類のタスクに近似した近接探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-03T18:30:43Z) - Cell Type Identification from Single-Cell Transcriptomic Data via
Semi-supervised Learning [2.4271601178529063]
シングルセルRNAシークエンシング(scRNAseq)データ解析の共通の目的は、シングルセル転写データからの細胞型同定である。
ラベルなしの scRNAseq 細胞とラベル付き scRNAseq 細胞を限定的に使用して細胞識別を行う半教師付き学習モデルを提案する。
提案手法は, ラベル付きcRNAseq細胞を極端に限定して学習することで, 高い性能を達成できることが観察された。
論文 参考訳(メタデータ) (2020-05-06T19:15:43Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。