論文の概要: Constructing Cell-type Taxonomy by Optimal Transport with Relaxed Marginal Constraints
- arxiv url: http://arxiv.org/abs/2501.18650v1
- Date: Wed, 29 Jan 2025 21:29:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-03 14:02:49.004201
- Title: Constructing Cell-type Taxonomy by Optimal Transport with Relaxed Marginal Constraints
- Title(参考訳): Relaxed Marginal Constraintsを用いた最適輸送による細胞型分類法の構築
- Authors: Sebastian Pena, Lin Lin, Jia Li,
- Abstract要約: 細胞のクラスタ分析における課題の1つは、異なる起源や条件のデータセットから抽出されたクラスタのマッチングである。
提案手法は,全サンプルにまたがるセルクラスタの分類を構築し,これらのクラスタのアノテート性を向上し,下流分析のための特徴を効果的に抽出することを目的としている。
- 参考スコア(独自算出の注目度): 14.831346286039151
- License:
- Abstract: The rapid emergence of single-cell data has facilitated the study of many different biological conditions at the cellular level. Cluster analysis has been widely applied to identify cell types, capturing the essential patterns of the original data in a much more concise form. One challenge in the cluster analysis of cells is matching clusters extracted from datasets of different origins or conditions. Many existing algorithms cannot recognize new cell types present in only one of the two samples when establishing a correspondence between clusters obtained from two samples. Additionally, when there are more than two samples, it is advantageous to align clusters across all samples simultaneously rather than performing pairwise alignment. Our approach aims to construct a taxonomy for cell clusters across all samples to better annotate these clusters and effectively extract features for downstream analysis. A new system for constructing cell-type taxonomy has been developed by combining the technique of Optimal Transport with Relaxed Marginal Constraints (OT-RMC) and the simultaneous alignment of clusters across multiple samples. OT-RMC allows us to address challenges that arise when the proportions of clusters vary substantially between samples or when some clusters do not appear in all the samples. Experiments on more than twenty datasets demonstrate that the taxonomy constructed by this new system can yield highly accurate annotation of cell types. Additionally, sample-level features extracted based on the taxonomy result in accurate classification of samples.
- Abstract(参考訳): 単細胞データの急速な出現により、細胞レベルでの様々な生物学的状態の研究が容易になった。
クラスタ分析は細胞の種類を特定するために広く応用され、元のデータの本質的なパターンをより簡潔に捉えている。
細胞のクラスタ分析における課題の1つは、異なる起源や条件のデータセットから抽出されたクラスタのマッチングである。
多くの既存のアルゴリズムは、2つのサンプルから得られたクラスタ間の対応を確立する際に、2つのサンプルのうちの1つだけに存在する新しい細胞タイプを認識することができない。
さらに、2つ以上のサンプルがある場合、ペアのアライメントを行うのではなく、すべてのサンプルに同時にクラスタをアライメントすることが有利である。
提案手法は,全サンプルにまたがるセルクラスタの分類を構築し,これらのクラスタのアノテート性を向上し,下流解析の機能を効果的に抽出することを目的としている。
細胞型分類法を構築するための新しいシステムとして, 最適輸送法とレラクシドマージナル制約法(OT-RMC)を併用し, 複数の試料にまたがるクラスタの同時アライメントを開発した。
OT-RMCは、サンプル間でクラスタの割合が著しく異なる場合や、すべてのサンプルにいくつかのクラスタが存在しない場合に発生する課題に対処することを可能にする。
20以上のデータセットに対する実験により、この新システムによって構築された分類は、高い精度で細胞型のアノテーションが得られることが示された。
さらに、分類に基づいて抽出されたサンプルレベルの特徴は、試料の正確な分類をもたらす。
関連論文リスト
- HBIC: A Biclustering Algorithm for Heterogeneous Datasets [0.0]
Biclusteringは、データマトリックス内で行と列を同時にクラスタすることを目的とした、教師なしの機械学習アプローチである。
複素異種データから有意義なビクラスタを発見することが可能な,HBICと呼ばれるビクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2024-08-23T16:48:10Z) - scGHSOM: Hierarchical clustering and visualization of single-cell and CRISPR data using growing hierarchical SOM [0.8452349885923507]
階層型自己組織化マップ (GHSOM) を育成するアン教師なしクラスタリングによる包括的遺伝子セル依存性の可視化を提案する。
GHSOMは、クラスタの自己成長構造が必要な変動を満足するように階層構造でクラスタサンプルに適用される。
本稿では,クラスタ特徴マップとクラスタ分布マップの2つの革新的な可視化ツールを提案する。
論文 参考訳(メタデータ) (2024-07-24T04:01:09Z) - Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.31109141089598]
シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文 参考訳(メタデータ) (2023-11-28T08:34:58Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Bayesian outcome-guided multi-view mixture models with applications in
molecular precision medicine [0.0]
クラスタリングは一般的に、'オミクスデータセットの構造を明らかにするための最初の分析ステップとして実行される。
本稿では,変数群(ビュー)を識別する多視点ベイズ混合モデルを提案する。
本研究は成層医療の応用を考察し,臨床応用可能な疾患のサブタイプを明確に定義した患者集団の同定を主目的とする。
論文 参考訳(メタデータ) (2023-03-01T08:32:23Z) - Sparse and geometry-aware generalisation of the mutual information for joint discriminative clustering and feature selection [19.066989850964756]
GEMINIと呼ばれる相互情報の幾何を考慮した一般化を最大化しようとする識別クラスタリングモデルを導入する。
このアルゴリズムは,特徴探索の負担を回避し,識別クラスタリングモデルのみを設計しながら,高次元データや大量のサンプルに対して容易にスケーラブルである。
以上の結果から,Sparse GEMINIは競合アルゴリズムであり,関連基準や事前仮説を使わずに,クラスタリングに関して変数の関連するサブセットを選択することができることがわかった。
論文 参考訳(メタデータ) (2023-02-07T10:52:04Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。