論文の概要: Active feature selection discovers minimal gene-sets for classifying
cell-types and disease states in single-cell mRNA-seq data
- arxiv url: http://arxiv.org/abs/2106.08317v1
- Date: Tue, 15 Jun 2021 17:49:26 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 14:56:54.919091
- Title: Active feature selection discovers minimal gene-sets for classifying
cell-types and disease states in single-cell mRNA-seq data
- Title(参考訳): 単一細胞mRNA-seqデータを用いた細胞型と疾患状態の最小限の遺伝子セットの探索
- Authors: Xiaoqiao Chen, Sisi Chen, Matt Thomson
- Abstract要約: 現在、単細胞mRNA-seqコストは、多くの生物学的および臨床的タスクに対する単細胞mRNA-seqの適用を禁止している。
本稿では, 細胞型と生理状態の高精度な分類を可能にする, 圧縮された遺伝子セットを構成する能動的学習フレームワークを提案する。
コンパクトだが高情報性の高い遺伝子セットの発見は、単一細胞mRNA-seqの応用に対するシークエンシング要求の劇的な削減を可能にする可能性がある。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Sequencing costs currently prohibit the application of single cell mRNA-seq
for many biological and clinical tasks of interest. Here, we introduce an
active learning framework that constructs compressed gene sets that enable high
accuracy classification of cell-types and physiological states while analyzing
a minimal number of gene transcripts. Our active feature selection procedure
constructs gene sets through an iterative cell-type classification task where
misclassified cells are examined at each round to identify maximally
informative genes through an `active' support vector machine (SVM) classifier.
Our active SVM procedure automatically identifies gene sets that enables
$>90\%$ cell-type classification accuracy in the Tabula Muris mouse tissue
survey as well as a $\sim 40$ gene set that enables classification of multiple
myeloma patient samples with $>95\%$ accuracy. Broadly, the discovery of
compact but highly informative gene sets might enable drastic reductions in
sequencing requirements for applications of single-cell mRNA-seq.
- Abstract(参考訳): 現在、シークエンシングコストは、多くの生物学的および臨床的タスクに対する単一細胞mRNA-seqの使用を禁止している。
本稿では,細胞型と生理状態の高精度な分類を可能にする圧縮遺伝子セットを構築するアクティブラーニングフレームワークについて紹介する。
能動的特徴選択法は,各ラウンドで誤分類された細胞を検査する反復型細胞型分類タスクを通じて遺伝子セットを構築し,"能動的"支援ベクターマシン(SVM)分類器を通じて最大情報的遺伝子を同定する。
当社のアクティブSVMプロシージャは,Tabula Murisマウス組織調査において,$>90\%$細胞型分類精度を実現する遺伝子セットと,$>95\%$精度で多発性骨髄腫患者サンプルの分類を可能にする$\sim 40$遺伝子セットを自動的に識別する。
広くは、コンパクトだが高情報性の高い遺伝子セットの発見は、単一細胞mRNA-seqの応用に対するシークエンシング要求の劇的な削減を可能にする可能性がある。
関連論文リスト
- An Evolutional Neural Network Framework for Classification of Microarray Data [0.0]
本研究の目的は,遺伝的アルゴリズムとニューラルネットワークのハイブリッドモデルを用いて,情報的遺伝子のサブセット選択において問題を克服することである。
実験の結果,提案手法は,他の機械学習アルゴリズムと比較して,高い精度と最小数の選択遺伝子が示唆された。
論文 参考訳(メタデータ) (2024-11-20T13:48:40Z) - eDOC: Explainable Decoding Out-of-domain Cell Types with Evidential Learning [7.036161839497915]
単細胞RNA-seq(scRNA-seq)技術は生物学的システムの複雑さを解明するための強力なツールである。
CTA(Cell Type CTA)は、scRNA-seqデータ解析において必須かつ基本的なタスクの1つである。
上記の課題に対処する新しい手法であるeDOCを開発した。
論文 参考訳(メタデータ) (2024-10-30T20:15:36Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Cell reprogramming design by transfer learning of functional
transcriptional networks [0.0]
我々は,ヒト細胞運命に関連する転写学的データに基づいて事前学習した細胞行動を制御するための転写学習手法を開発した。
本研究では, 発達関連性の低下に伴い, ある運命から別の運命へと進むために必要な遺伝子摂動の数が増加することを示す。
論文 参考訳(メタデータ) (2024-03-07T19:00:02Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Fuzzy Gene Selection and Cancer Classification Based on Deep Learning
Model [1.3072222152900117]
我々は,癌分類を容易にする情報的遺伝子を同定するための新しいファジィ遺伝子選択法(FGS)を開発した。
FGS法で癌分類は96.5%,96.2%,96%,95.9%の精度,精度,リコール,f1スコアを得た。
得られた6つのデータセットを調べることで、提案モデルはがんを効果的に分類する能力を示す。
論文 参考訳(メタデータ) (2023-05-04T21:52:57Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。