論文の概要: Uncovering smooth structures in single-cell data with PCS-guided neighbor embeddings
- arxiv url: http://arxiv.org/abs/2506.22228v1
- Date: Fri, 27 Jun 2025 13:45:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-30 21:12:23.220459
- Title: Uncovering smooth structures in single-cell data with PCS-guided neighbor embeddings
- Title(参考訳): PCS誘導近傍埋め込みによる単細胞データのスムーズな構造発見
- Authors: Rong Ma, Xi Li, Jingyuan Hu, Bin Yu,
- Abstract要約: 単細胞シークエンシングは、細胞-状態遷移の詳細な研究を可能にすることによって生物学に革命をもたらす。
ノイズの多い高次元単細胞データから滑らかで低次元の表現を抽出することは依然として困難である。
NESSは、NE表現を改善するための、原則的で解釈可能な機械学習手法である。
- 参考スコア(独自算出の注目度): 14.708144124501635
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Single-cell sequencing is revolutionizing biology by enabling detailed investigations of cell-state transitions. Many biological processes unfold along continuous trajectories, yet it remains challenging to extract smooth, low-dimensional representations from inherently noisy, high-dimensional single-cell data. Neighbor embedding (NE) algorithms, such as t-SNE and UMAP, are widely used to embed high-dimensional single-cell data into low dimensions. But they often introduce undesirable distortions, resulting in misleading interpretations. Existing evaluation methods for NE algorithms primarily focus on separating discrete cell types rather than capturing continuous cell-state transitions, while dynamic modeling approaches rely on strong assumptions about cellular processes and specialized data. To address these challenges, we build on the Predictability-Computability-Stability (PCS) framework for reliable and reproducible data-driven discoveries. First, we systematically evaluate popular NE algorithms through empirical analysis, simulation, and theory, and reveal their key shortcomings, such as artifacts and instability. We then introduce NESS, a principled and interpretable machine learning approach to improve NE representations by leveraging algorithmic stability and to enable robust inference of smooth biological structures. NESS offers useful concepts, quantitative stability metrics, and efficient computational workflows to uncover developmental trajectories and cell-state transitions in single-cell data. Finally, we apply NESS to six single-cell datasets, spanning pluripotent stem cell differentiation, organoid development, and multiple tissue-specific lineage trajectories. Across these diverse contexts, NESS consistently yields useful biological insights, such as identification of transitional and stable cell states and quantification of transcriptional dynamics during development.
- Abstract(参考訳): 単細胞シークエンシングは、細胞-状態遷移の詳細な研究を可能にすることによって生物学に革命をもたらす。
多くの生物学的プロセスは連続した軌道に沿って展開するが、本質的にノイズの多い高次元単細胞データから滑らかで低次元の表現を抽出することは依然として困難である。
t-SNEやUMAPのような隣接埋め込み(NE)アルゴリズムは、高次元の単一セルデータを低次元に埋め込むために広く用いられている。
しかし、それらはしばしば望ましくない歪みを導入し、誤解を招く解釈をもたらす。
NEアルゴリズムの既存の評価手法は主に、連続的なセル状態遷移をキャプチャするよりも、個別のセルタイプを分離することに焦点を当て、動的モデリングアプローチは、セルプロセスと特殊なデータに関する強い仮定に依存する。
これらの課題に対処するために、信頼性と再現性のあるデータ駆動発見のための予測可能性-計算可能性-安定性(PCS)フレームワークを構築します。
まず、実験分析、シミュレーション、理論を用いて、人気のあるNEアルゴリズムを体系的に評価し、アーティファクトや不安定性などの重要な欠点を明らかにする。
次に、アルゴリズム的安定性を活用してNE表現を改良し、滑らかな生物学的構造の堅牢な推論を可能にする、原理的で解釈可能な機械学習手法であるNESSを紹介した。
NESSは、単一セルデータの発達軌跡と細胞状態遷移を明らかにするための有用な概念、定量的安定性メトリクス、効率的な計算ワークフローを提供する。
最後に、NESSを6つの単細胞データセットに適用し、多能性幹細胞分化、オルガノイド発生、複数の組織特異的な系譜を解析した。
これらの多様な状況の中で、NESSは、遷移状態と安定な細胞状態の同定や、発達中の転写力学の定量化など、有用な生物学的洞察を一貫して得る。
関連論文リスト
- NOBLE -- Neural Operator with Biologically-informed Latent Embeddings to Capture Experimental Variability in Biological Neuron Models [68.89389652724378]
NOBLEは、解釈可能なニューロンの特徴を連続周波数変調した埋め込みから電流注入によって誘導されるソマティック電圧応答へのマッピングを学ぶ神経オペレーターフレームワークである。
内在的な実験変数を考慮したニューラルダイナミクスの分布を予測する。
NOBLEは、実際の実験データに基づいて検証された最初のスケールアップされたディープラーニングフレームワークである。
論文 参考訳(メタデータ) (2025-06-05T01:01:18Z) - Cell as Point: One-Stage Framework for Efficient Cell Tracking [54.19259129722988]
本稿では,セルをポイントとして扱うことで細胞追跡を再現する新しいエンド・ツー・エンドのワンステージフレームワークを提案する。
従来の方法とは異なり、CAPは明示的な検出やセグメンテーションの必要性を排除し、代わりに1段階の配列の細胞を共同で追跡する。
CAPは有望な細胞追跡性能を示し、既存の方法の10倍から55倍効率が高い。
論文 参考訳(メタデータ) (2024-11-22T10:16:35Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - GENOT: Entropic (Gromov) Wasserstein Flow Matching with Applications to Single-Cell Genomics [20.01834405021846]
単細胞ゲノム学は、細胞行動の理解を深め、治療や精密医療の革新を触媒している。
従来の離散的なソルバは、スケーラビリティ、プライバシ、サンプル外推定の問題によって妨げられています。
我々は、OTマップをパラメータ化するニューラルネットワークベースの解法である、ニューラルOTソルバを提案する。
本研究は, 細胞開発研究, 細胞性薬物応答モデリング, 細胞間翻訳への応用を通じて, その汎用性と堅牢性を実証する。
論文 参考訳(メタデータ) (2023-10-13T17:12:04Z) - PhagoStat a scalable and interpretable end to end framework for
efficient quantification of cell phagocytosis in neurodegenerative disease
studies [0.0]
本稿では,食欲活動の定量化と分析を行うためのエンドツーエンド,スケーラブル,汎用的なリアルタイムフレームワークを提案する。
提案するパイプラインでは,大規模なデータセットを処理でき,データ品質検証モジュールも備えている。
我々はこのパイプラインをFTDの微小グリア細胞食細胞解析に応用し,統計的に信頼性の高い結果を得た。
論文 参考訳(メタデータ) (2023-04-26T18:10:35Z) - Learning Causal Representations of Single Cells via Sparse Mechanism
Shift Modeling [3.2435888122704037]
本稿では,各摂動を未知の,しかしスパースな,潜伏変数のサブセットを標的とした介入として扱う単一細胞遺伝子発現データの深部生成モデルを提案する。
これらの手法をシミュレーションした単一セルデータ上でベンチマークし、潜伏単位回復、因果的目標同定、領域外一般化における性能を評価する。
論文 参考訳(メタデータ) (2022-11-07T15:47:40Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。