論文の概要: A Large-Scale Comparative Analysis of Imputation Methods for Single-Cell RNA Sequencing Data
- arxiv url: http://arxiv.org/abs/2603.24626v1
- Date: Wed, 25 Mar 2026 02:46:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:47.900234
- Title: A Large-Scale Comparative Analysis of Imputation Methods for Single-Cell RNA Sequencing Data
- Title(参考訳): シングルセルRNAシークエンシングデータのインプット手法の大規模比較解析
- Authors: Yuichiro Iwashita, Ahtisham Fazeel Abbasi, Muhammad Nabeel Asim, Andreas Dengel,
- Abstract要約: 単細胞RNAシークエンシング(scRNA-seq)は、本質的に、ドロップアウトイベントによって引き起こされるスパーシリティに影響を受ける。
そこで本研究では,7つの手法カテゴリにまたがる15のscRNA-seq計算手法のベンチマークを示す。
- 参考スコア(独自算出の注目度): 5.2075795897678185
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-cell RNA sequencing (scRNA-seq) is inherently affected by sparsity caused by dropout events, in which expressed genes are recorded as zeros due to technical limitations. These artifacts distort gene expression distributions and can compromise downstream analyses. Numerous imputation methods have been proposed to address this, and these methods encompass a wide range of approaches from traditional statistical models to recently developed deep learning (DL)-based methods. However, their comparative performance remains unclear, as existing benchmarking studies typically evaluate only a limited subset of methods, datasets, and downstream analytical tasks. Here, we present a comprehensive benchmark of 15 scRNA-seq imputation methods spanning 7 methodological categories, including traditional and modern DL-based methods. These methods are evaluated across 30 datasets sourced from 10 experimental protocols and assessed in terms of 6 downstream analytical tasks. Our results show that traditional imputation methods, such as model-based, smoothing-based, and low-rank matrix-based methods, generally outperform DL-based methods, such as diffusion-based, GAN-based, GNN-based, and autoencoder-based methods. In addition, strong performance in numerical gene expression recovery does not necessarily translate into improved biological interpretability in downstream analyses. Furthermore, the performance of imputation methods varies substantially across datasets, protocols, and downstream analytical tasks, and no single method consistently outperforms others across all evaluation scenarios. Together, our results provide practical guidance for selecting imputation methods tailored to specific analytical objectives and highlight the importance of task-specific evaluation when assessing imputation performance in scRNA-seq data analysis.
- Abstract(参考訳): 単細胞RNAシークエンシング(scRNA-seq)は、技術的制限により発現された遺伝子がゼロとして記録されるドロップアウト現象によって引き起こされる疎結合によって本質的に影響を受ける。
これらのアーティファクトは遺伝子発現の分布を歪め、下流の解析を損なう可能性がある。
これらの手法は従来の統計モデルから最近開発されたディープラーニング(DL)ベースの手法まで幅広いアプローチを包含している。
しかしながら、既存のベンチマーク研究は通常、メソッド、データセット、下流分析タスクの限られたサブセットのみを評価するため、それらの比較性能は不明確である。
本稿では,従来のDL法と最近のDL法を含む7つの方法論カテゴリにまたがる15のscRNA-seqインパクション手法の総合的なベンチマークを示す。
これらの手法は、10の実験プロトコルから得られた30のデータセットで評価され、6つの下流分析タスクで評価される。
その結果,モデルベース,平滑化ベース,低ランク行列ベースといった従来の計算手法は,拡散ベース,GANベース,GNNベース,オートエンコーダベースなど,DLベースの手法よりも優れていた。
さらに, 数値的遺伝子発現回復における強い性能は, 下流解析における生物学的解釈可能性の向上に必ずしも寄与しない。
さらに、命令法の性能はデータセット、プロトコル、下流の分析タスクで大きく異なり、すべての評価シナリオで一貫して他よりも優れるメソッドは存在しない。
そこで本研究では,特定の解析目的に適合した命令法を選択するための実践的ガイダンスと,scRNA-seqデータ解析における命令性能の評価におけるタスク固有の評価の重要性について述べる。
関連論文リスト
- scCluBench: Comprehensive Benchmarking of Clustering Algorithms for Single-Cell RNA Sequencing [24.35296206096082]
scCluBenchは、cRNA-seqデータのためのクラスタリングアルゴリズムの包括的なベンチマークである。
まず、 scCluBenchは、様々な公開ソースから収集された36のscRNA-seqデータセットを提供する。
論文 参考訳(メタデータ) (2025-12-02T07:04:38Z) - scUnified: An AI-Ready Standardized Resource for Single-Cell RNA Sequencing Analysis [23.973638982075016]
我々は、シングルセルRNAシークエンシングデータのための、AI対応の標準リソース scUnified を提案する。
scUnified Consolided to 13 high-quality datasets across two species and 9 tissue types。
論文 参考訳(メタデータ) (2025-09-30T07:23:01Z) - Stochastic gradient descent estimation of generalized matrix factorization models with application to single-cell RNA sequencing data [39.146761527401424]
単細胞RNAシークエンシングは、個々の細胞レベルでの遺伝子発現の定量化を可能にする。
次元の減少は、サンプルの可視化、クラスタリング、表現型特徴付けに不可欠な一般的な前処理ステップである。
一般指数分散族分布を仮定した一般化行列分解モデルを提案する。
提案手法は, 数百万セルにシームレスに拡張可能であることを示し, 大規模単一セルデータセットの次元性低減を実現する。
論文 参考訳(メタデータ) (2024-12-29T16:02:15Z) - A Closer Look at Deep Learning Methods on Tabular Datasets [78.61845513154502]
広い範囲にまたがる300以上のデータセットの集合であるTALENTについて広範な研究を行った。
我々の評価では、アンサンブルは木に基づくアプローチとニューラルアプローチの両方に効果があることが示されている。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - BEACON: Benchmark for Comprehensive RNA Tasks and Language Models [60.02663015002029]
本稿では、最初の包括的なRNAベンチマークBEACON(textbfBEnchmtextbfArk for textbfCOmprehensive RtextbfNA Task and Language Models)を紹介する。
まずBEACONは、構造解析、機能研究、工学的応用を網羅した、これまでの広範囲にわたる研究から導かれた13のタスクから構成される。
第2に、CNNのような従来のアプローチや、言語モデルに基づく高度なRNA基盤モデルなど、さまざまなモデルについて検討し、これらのモデルのタスク固有のパフォーマンスに関する貴重な洞察を提供する。
第3に、重要なRNA言語モデルコンポーネントについて検討する。
論文 参考訳(メタデータ) (2024-06-14T19:39:19Z) - Attentional-Biased Stochastic Gradient Descent [74.49926199036481]
深層学習におけるデータ不均衡やラベルノイズ問題に対処するための証明可能な手法(ABSGD)を提案する。
本手法は運動量SGDの簡易な修正であり,各試料に個別の重み付けを行う。
ABSGDは追加コストなしで他の堅牢な損失と組み合わせられるほど柔軟である。
論文 参考訳(メタデータ) (2020-12-13T03:41:52Z) - Interpolation Technique to Speed Up Gradients Propagation in Neural ODEs [71.26657499537366]
本稿では,ニューラルネットワークモデルにおける勾配の効率的な近似法を提案する。
我々は、分類、密度推定、推論近似タスクにおいて、ニューラルODEをトレーニングするリバースダイナミック手法と比較する。
論文 参考訳(メタデータ) (2020-03-11T13:15:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。