論文の概要: scE$^2$TM: Toward Interpretable Single-Cell Embedding via Topic Modeling
- arxiv url: http://arxiv.org/abs/2507.08355v1
- Date: Fri, 11 Jul 2025 07:15:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-14 18:03:54.26739
- Title: scE$^2$TM: Toward Interpretable Single-Cell Embedding via Topic Modeling
- Title(参考訳): scE$^2$TM: トピックモデリングによる解釈可能なシングルセル埋め込みを目指して
- Authors: Hegang Chen, Yuyin Lu, Zhiming Dai, Fu Lee Wang, Qing Li, Yanghui Rao,
- Abstract要約: 高品質なセル埋め込みと強力な解釈を提供する,外部知識誘導型単一セル埋め込みトピックモデルである scE2TM を提案する。
20のscRNA-seqデータセットの包括的な評価は、scE2TMがクラスタリング性能を著しく向上することを示す。
- 参考スコア(独自算出の注目度): 21.79077173300944
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent advances in sequencing technologies have enabled researchers to explore cellular heterogeneity at single-cell resolution. Meanwhile, interpretability has gained prominence parallel to the rapid increase in the complexity and performance of deep learning models. In recent years, topic models have been widely used for interpretable single-cell embedding learning and clustering analysis, which we refer to as single-cell embedded topic models. However, previous studies evaluated the interpretability of the models mainly through qualitative analysis, and these single-cell embedded topic models suffer from the potential problem of interpretation collapse. Furthermore, their neglect of external biological knowledge constrains analytical performance. Here, we present scE2TM, an external knowledge-guided single-cell embedded topic model that provides a high-quality cell embedding and strong interpretation, contributing to comprehensive scRNA-seq data analysis. Our comprehensive evaluation across 20 scRNA-seq datasets demonstrates that scE2TM achieves significant clustering performance gains compared to 7 state-of-the-art methods. In addition, we propose a new interpretability evaluation benchmark that introduces 10 metrics to quantitatively assess the interpretability of single-cell embedded topic models. The results show that the interpretation provided by scE2TM performs encouragingly in terms of diversity and consistency with the underlying biological signals, contributing to a better revealing of the underlying biological mechanisms.
- Abstract(参考訳): シークエンシング技術の最近の進歩により、研究者は単一細胞の分解能で細胞不均一性を探究できるようになった。
一方、深層学習モデルの複雑さと性能の急激な増加と平行して解釈可能性が高まっている。
近年,シングルセル埋め込み学習とクラスタリング解析の解釈に話題モデルが広く用いられており,これをシングルセル埋め込みトピックモデルと呼ぶ。
しかし、従来の研究では、主に定性分析によってモデルの解釈可能性を評価しており、これらの単一セル埋め込みトピックモデルは、解釈崩壊の潜在的な問題に悩まされている。
さらに、外部生物学的知識の無視は分析性能を制約する。
本稿では、高品質なセル埋め込みと強力な解釈を提供する外部知識誘導シングルセル埋め込みトピックモデルである scE2TM について紹介し、包括的な scRNA-seq データ解析に寄与する。
20のscRNA-seqデータセットの総合的な評価は、scE2TMが7つの最先端手法と比較して大きなクラスタリング性能向上を実現していることを示している。
さらに,1セル組込みトピックモデルの解釈可能性を定量的に評価する10の指標を導入した新しい解釈可能性評価ベンチマークを提案する。
以上の結果から, scE2TMの解釈は, 生物学的信号の多様性や一貫性の面で, 生物機構の解明に寄与することが示唆された。
関連論文リスト
- Information-theoretic Quantification of High-order Feature Effects in Classification Problems [0.19791587637442676]
特徴重要度(Hi-Fi)法における高次相互作用の情報理論拡張について述べる。
私たちのフレームワークは、機能のコントリビューションをユニークでシナジスティックで冗長なコンポーネントに分解します。
その結果,提案した推定器は理論的および予測された結果を正確に復元することがわかった。
論文 参考訳(メタデータ) (2025-07-06T11:50:30Z) - CellVerse: Do Large Language Models Really Understand Cell Biology? [74.34984441715517]
我々は,4種類のシングルセルマルチオミクスデータを統合する統一言語中心の質問応答ベンチマークであるCellVerseを紹介する。
我々は,CellVerse上で160Mから671Bまでの14のオープンソースおよびクローズドソースLLMの性能を体系的に評価した。
論文 参考訳(メタデータ) (2025-05-09T06:47:23Z) - GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Benchmarking Transcriptomics Foundation Models for Perturbation Analysis : one PCA still rules them all [1.507700065820919]
転写学的シークエンシングの最近の進歩は、価値ある洞察を明らかにする新しい機会を提供する。
摂動解析におけるこれらの上昇モデルの有効性をしっかり評価するためのベンチマークは行われていない。
本稿では,生物学的に動機づけた新しい評価フレームワークと摂動解析タスクの階層について述べる。
論文 参考訳(メタデータ) (2024-10-17T18:27:51Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - Interpretable deep learning in single-cell omics [5.0934939727101565]
単一セルオミクス技術の基本と解釈可能なディープラーニングの概念を紹介する。
続いて、様々な単細胞オミクス研究に適用された近年の解釈可能なディープラーニングモデルについてレビューする。
論文 参考訳(メタデータ) (2024-01-11T23:59:37Z) - Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.24726622142558]
$k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-12-15T14:04:23Z) - Regression-Based Analysis of Multimodal Single-Cell Data Integration
Strategies [0.0]
マルチモーダルシングルセル技術は、個々のセルから多様なデータ型の同時収集を可能にする。
この研究は、Echo State Networksの異常なパフォーマンスを強調し、顕著な相関スコアが0.94である。
これらの発見は、機械学習の可能性を生かして、細胞の分化と機能に関する理解を深めることを約束している。
論文 参考訳(メタデータ) (2023-11-21T16:31:27Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Out of Distribution Generalization via Interventional Style Transfer in
Single-Cell Microscopy [1.7778546320705952]
コンピュータビジョンシステムの現実的な展開には、文脈的ニュアンスに不変な因果表現が必要である。
我々は,OOD一般化の難易度が高まる中で,モデルが因果表現を学習する程度を評価するテストを提案する。
他の確立された指標によって評価されるように、一見強靭なパフォーマンスにもかかわらず、これらのテストでは、悪質なベースラインと現代的なベースラインの両方が、相反することを防ぐために設計されている。
論文 参考訳(メタデータ) (2023-06-15T20:08:16Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。