論文の概要: Cell Type Identification from Single-Cell Transcriptomic Data via
Semi-supervised Learning
- arxiv url: http://arxiv.org/abs/2005.03994v1
- Date: Wed, 6 May 2020 19:15:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 06:26:16.995816
- Title: Cell Type Identification from Single-Cell Transcriptomic Data via
Semi-supervised Learning
- Title(参考訳): 半教師付き学習による単細胞転写データからの細胞型同定
- Authors: Xishuang Dong, Shanta Chowdhury, Uboho Victor, Xiangfang Li, Lijun
Qian
- Abstract要約: シングルセルRNAシークエンシング(scRNAseq)データ解析の共通の目的は、シングルセル転写データからの細胞型同定である。
ラベルなしの scRNAseq 細胞とラベル付き scRNAseq 細胞を限定的に使用して細胞識別を行う半教師付き学習モデルを提案する。
提案手法は, ラベル付きcRNAseq細胞を極端に限定して学習することで, 高い性能を達成できることが観察された。
- 参考スコア(独自算出の注目度): 2.4271601178529063
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cell type identification from single-cell transcriptomic data is a common
goal of single-cell RNA sequencing (scRNAseq) data analysis. Neural networks
have been employed to identify cell types from scRNAseq data with high
performance. However, it requires a large mount of individual cells with
accurate and unbiased annotated types to build the identification models.
Unfortunately, labeling the scRNAseq data is cumbersome and time-consuming as
it involves manual inspection of marker genes. To overcome this challenge, we
propose a semi-supervised learning model to use unlabeled scRNAseq cells and
limited amount of labeled scRNAseq cells to implement cell identification.
Firstly, we transform the scRNAseq cells to "gene sentences", which is inspired
by similarities between natural language system and gene system. Then genes in
these sentences are represented as gene embeddings to reduce data sparsity.
With these embeddings, we implement a semi-supervised learning model based on
recurrent convolutional neural networks (RCNN), which includes a shared
network, a supervised network and an unsupervised network. The proposed model
is evaluated on macosko2015, a large scale single-cell transcriptomic dataset
with ground truth of individual cell types. It is observed that the proposed
model is able to achieve encouraging performance by learning on very limited
amount of labeled scRNAseq cells together with a large number of unlabeled
scRNAseq cells.
- Abstract(参考訳): シングルセルRNAシークエンシング(scRNAseq)データ解析の共通の目的は、シングルセル転写データからの細胞型同定である。
ニューラルネットワークは、cRNAseqデータからセルタイプを高性能に識別するために使用されている。
しかし、識別モデルを構築するには、正確で偏りのないアノテートタイプを持つ個々の細胞の大きなマウントが必要である。
残念なことに、マーカー遺伝子の手動検査を伴うため、scRNAseqデータのラベル付けは面倒で時間を要する。
この課題を克服するために,ラベルのないscrnaseq細胞と限定されたラベル付きscrnaseq細胞を用いた半教師付き学習モデルを提案する。
まず、scRNAseq細胞を「遺伝子文」に変換し、自然言語システムと遺伝子システムとの類似性から着想を得た。
次に、これらの文中の遺伝子は、データの疎さを減らすために遺伝子埋め込みとして表現される。
これらの組込みにより、共有ネットワーク、教師付きネットワーク、教師なしネットワークを含む再帰畳み込みニューラルネットワーク(rcnn)に基づく半教師付き学習モデルを実装する。
提案モデルは,個々の細胞型の基底真理を持つ大規模単細胞転写データセットであるmacosko2015を用いて評価した。
提案モデルでは, ラベル付きscRNAseq細胞と多数の未ラベルscRNAseq細胞を併用して, ラベル付きscRNAseq細胞を極端に限定的に学習することにより, 高い性能を達成できることが観察された。
関連論文リスト
- MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - scBiGNN: Bilevel Graph Representation Learning for Cell Type
Classification from Single-cell RNA Sequencing Data [62.87454293046843]
グラフニューラルネットワーク(GNN)は、セルタイプの自動分類に広く利用されている。
scBiGNNは2つのGNNモジュールから構成され、細胞型を識別する。
scBiGNNは、scRNA-seqデータから細胞型分類のための様々な方法より優れている。
論文 参考訳(メタデータ) (2023-12-16T03:54:26Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - N-ACT: An Interpretable Deep Learning Model for Automatic Cell Type and
Salient Gene Identification [0.0]
ほとんどのscRNAseq解析パイプラインにおける大きな制限は、細胞のアイデンティティを決定するために手動のアノテーションに依存することである。
N-ACTは、ニューラルアテンションを利用して細胞型同定に使用するサルエント遺伝子を検出するACTIのための、第一級の解釈可能なディープニューラルネットワークである。
論文 参考訳(メタデータ) (2022-05-08T18:13:28Z) - CloudPred: Predicting Patient Phenotypes From Single-cell RNA-seq [6.669618903574761]
単細胞RNAシークエンシング(scRNA-seq)は、病気の予後と精密な医学を知らせる強力な高解像度のシグネチャを提供する可能性がある。
本稿では,cRNA-seqデータから個人の病気の表現型を予測するために,解釈可能な機械学習アルゴリズムであるCloudPredを開発した。
論文 参考訳(メタデータ) (2021-10-13T22:41:30Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - A systematic evaluation of methods for cell phenotype classification
using single-cell RNA sequencing data [7.62849213621469]
本研究は、細胞表現型を分類する13の一般的な教師付き機械学習アルゴリズムを評価する。
研究結果から、ElasticNetと対話は、中小のデータセットで最善を尽くしたことが示された。
論文 参考訳(メタデータ) (2021-10-01T23:24:15Z) - Train your classifier first: Cascade Neural Networks Training from upper
layers to lower layers [54.47911829539919]
我々は,高品質な分類器を探索するアルゴリズムとして見ることのできる,新しいトップダウン学習手法を開発した。
本研究では,自動音声認識(ASR)タスクと言語モデリングタスクについて検討した。
提案手法は,Wall Street Journal 上でのリカレントニューラルネットワーク ASR モデル,Switchboard 上での自己注意型 ASR モデル,WikiText-2 上での AWD-LSTM 言語モデルなど,一貫して改善されている。
論文 参考訳(メタデータ) (2021-02-09T08:19:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。