論文の概要: scMamba: A Pre-Trained Model for Single-Nucleus RNA Sequencing Analysis in Neurodegenerative Disorders
- arxiv url: http://arxiv.org/abs/2502.19429v1
- Date: Wed, 12 Feb 2025 11:48:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-02 02:51:28.311795
- Title: scMamba: A Pre-Trained Model for Single-Nucleus RNA Sequencing Analysis in Neurodegenerative Disorders
- Title(参考訳): scMamba:神経変性疾患における単核RNAシークエンシング解析のための事前訓練モデル
- Authors: Gyutaek Oh, Baekgyu Choi, Seyoung Jin, Inkyung Jung, Jong Chul Ye,
- Abstract要約: scMambaは、snRNA-seq解析の品質と実用性を改善するために設計された事前訓練モデルである。
最近のMambaモデルにインスパイアされた scMamba は、線形アダプタ層、遺伝子埋め込み、双方向のMambaブロックを組み込んだ新しいアーキテクチャを導入している。
scMambaは、セルタイプアノテーション、ダブルト検出、インプット、差分表現された遺伝子の同定など、様々な下流タスクにおいて、ベンチマーク手法よりも優れていることを示す。
- 参考スコア(独自算出の注目度): 43.24785083027205
- License:
- Abstract: Single-nucleus RNA sequencing (snRNA-seq) has significantly advanced our understanding of the disease etiology of neurodegenerative disorders. However, the low quality of specimens derived from postmortem brain tissues, combined with the high variability caused by disease heterogeneity, makes it challenging to integrate snRNA-seq data from multiple sources for precise analyses. To address these challenges, we present scMamba, a pre-trained model designed to improve the quality and utility of snRNA-seq analysis, with a particular focus on neurodegenerative diseases. Inspired by the recent Mamba model, scMamba introduces a novel architecture that incorporates a linear adapter layer, gene embeddings, and bidirectional Mamba blocks, enabling efficient processing of snRNA-seq data while preserving information from the raw input. Notably, scMamba learns generalizable features of cells and genes through pre-training on snRNA-seq data, without relying on dimension reduction or selection of highly variable genes. We demonstrate that scMamba outperforms benchmark methods in various downstream tasks, including cell type annotation, doublet detection, imputation, and the identification of differentially expressed genes.
- Abstract(参考訳): 単一核RNAシークエンシング(snRNA-seq)は神経変性疾患の病因論の理解を著しく進歩させてきた。
しかし、死後脳組織に由来する検体の品質は、疾患の不均一性によって引き起こされる高い多様性と相まって、複数のソースからのsnRNA-seqデータを正確な分析のために統合することは困難である。
これらの課題に対処するために,神経変性疾患を中心に,snRNA-seq解析の質と有用性を改善するための事前学習モデルである scMamba を提案する。
最近のMambaモデルにインスパイアされた scMamba は、線形アダプター層、遺伝子埋め込み、双方向の Mamba ブロックを組み込んだ新しいアーキテクチャを導入し、生の入力から情報を保存しながら、snRNA-seq データの効率的な処理を可能にした。
特に、 scMamba は snRNA-seq データの事前学習を通じて、高度に可変な遺伝子の次元の減少や選択に頼ることなく、細胞と遺伝子の一般化可能な特徴を学習する。
scMambaは、セルタイプアノテーション、ダブルト検出、インプット、差分表現された遺伝子の同定など、様々な下流タスクにおいて、ベンチマーク手法よりも優れていることを示す。
関連論文リスト
- scBIT: Integrating Single-cell Transcriptomic Data into fMRI-based Prediction for Alzheimer's Disease Diagnosis [24.268703526039367]
scBITは、fMRIと単一核RNA(snRNA)を組み合わせてアルツハイマー病(AD)の予測を強化する新しい方法である
snRNAデータを細胞型特異的な遺伝子ネットワークに分割するサンプリング戦略を採用し、自己説明可能なグラフニューラルネットワークを使用してクリティカルなサブグラフを抽出する。
広範囲にわたる実験により、cBITが複雑な脳領域-遺伝子関連を明らかにする効果が検証された。
論文 参考訳(メタデータ) (2025-02-04T18:37:46Z) - Pan-cancer gene set discovery via scRNA-seq for optimal deep learning based downstream tasks [6.869831177092736]
腫瘍生検181例のscRNA-seqデータを13種類の癌で解析した。
高次元重み付き遺伝子共発現ネットワーク解析(hdWGCNA)を行い、関連遺伝子群を同定した。
多層パーセプトロン(MLP)やグラフニューラルネットワーク(GNN)を含むディープラーニングモデルを用いたOncoKBのオンコジーンの評価
論文 参考訳(メタデータ) (2024-08-13T23:24:36Z) - LncRNA-disease association prediction method based on heterogeneous information completion and convolutional neural network [9.17998537192211]
lncRNA-disease associations (LDAs) の精度は、疾患の警告と治療に非常に重要である。
本稿では, HCNNLDA と命名されたlncRNA-解離関連予測に対して, 異種ネットワークと畳み込みニューラルネットワーク(CNN)に基づくディープラーニングモデルを提案する。
実験結果から,提案モデルがいくつかの最新の予測モデルよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-06-02T06:11:27Z) - Path-GPTOmic: A Balanced Multi-modal Learning Framework for Survival Outcome Prediction [14.204637932937082]
本稿では,癌生存率予測のためのマルチモーダルパスGPTOmicフレームワークを提案する。
基礎モデルである scGPT の埋め込み空間は,最初は単一セルRNA-seq で訓練された。
生存予測のためのCox部分的可能性損失に対応する勾配変調機構を提案する。
論文 参考訳(メタデータ) (2024-03-18T00:02:48Z) - scHyena: Foundation Model for Full-Length Single-Cell RNA-Seq Analysis
in Brain [46.39828178736219]
我々はこれらの課題に対処し、脳内のscRNA-seq解析の精度を高めるために設計された基礎モデルであるscHyenaを紹介する。
scHyenaは、線形適応層、遺伝子埋め込みによる位置エンコーディング、および双方向ハイエナ演算子を備えている。
これにより、生データから情報を失うことなく、全長の scRNA-seq データを処理できる。
論文 参考訳(メタデータ) (2023-10-04T10:30:08Z) - Benchmarking Machine Learning Robustness in Covid-19 Genome Sequence
Classification [109.81283748940696]
我々は、IlluminaやPacBioといった一般的なシークエンシングプラットフォームのエラープロファイルを模倣するために、SARS-CoV-2ゲノム配列を摂動する方法をいくつか紹介する。
シミュレーションに基づくいくつかのアプローチは、入力シーケンスに対する特定の敵攻撃に対する特定の埋め込み手法に対して、他の手法よりも堅牢(かつ正確)であることを示す。
論文 参考訳(メタデータ) (2022-07-18T19:16:56Z) - G-MIND: An End-to-End Multimodal Imaging-Genetics Framework for
Biomarker Identification and Disease Classification [49.53651166356737]
診断によって誘導される画像データと遺伝データを統合し、解釈可能なバイオマーカーを提供する新しいディープニューラルネットワークアーキテクチャを提案する。
2つの機能的MRI(fMRI)パラダイムとSingle Nucleotide Polymorphism (SNP)データを含む統合失調症の集団研究で本モデルを評価した。
論文 参考訳(メタデータ) (2021-01-27T19:28:04Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。