論文の概要: Distribution-based Sketching of Single-Cell Samples
- arxiv url: http://arxiv.org/abs/2207.00584v1
- Date: Thu, 30 Jun 2022 19:43:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-09 16:00:41.001906
- Title: Distribution-based Sketching of Single-Cell Samples
- Title(参考訳): 単一セルサンプルの分布に基づくスケッチ
- Authors: Vishal Athreya Baskaran, Jolene Ranek, Siyuan Shan, Natalie Stanley,
Junier B. Oliva
- Abstract要約: 我々は,免疫細胞型を基本周波数に保ちながら,すべての細胞のサブサンプルを限定的に選択するカーネル・ハーディングに基づく新規なスケッチ手法を提案する。
我々は3つのフローとマスのデータセットと1つの単一セルRNAシークエンシングデータセットを用いてアプローチを検証した。
- 参考スコア(独自算出の注目度): 6.904244323294012
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Modern high-throughput single-cell immune profiling technologies, such as
flow and mass cytometry and single-cell RNA sequencing can readily measure the
expression of a large number of protein or gene features across the millions of
cells in a multi-patient cohort. While bioinformatics approaches can be used to
link immune cell heterogeneity to external variables of interest, such as,
clinical outcome or experimental label, they often struggle to accommodate such
a large number of profiled cells. To ease this computational burden, a limited
number of cells are typically \emph{sketched} or subsampled from each patient.
However, existing sketching approaches fail to adequately subsample rare cells
from rare cell-populations, or fail to preserve the true frequencies of
particular immune cell-types. Here, we propose a novel sketching approach based
on Kernel Herding that selects a limited subsample of all cells while
preserving the underlying frequencies of immune cell-types. We tested our
approach on three flow and mass cytometry datasets and on one single-cell RNA
sequencing dataset and demonstrate that the sketched cells (1) more accurately
represent the overall cellular landscape and (2) facilitate increased
performance in downstream analysis tasks, such as classifying patients
according to their clinical outcome. An implementation of sketching with Kernel
Herding is publicly available at
\url{https://github.com/vishalathreya/Set-Summarization}.
- Abstract(参考訳): フローやマスサイトメトリー、シングルセルRNAシークエンシングといった現代の高スループット単一細胞免疫プロファイリング技術は、多患者コホートにおいて数百万の細胞にまたがる多数のタンパク質や遺伝子の発現を容易に測定することができる。
バイオインフォマティクスのアプローチは、免疫細胞の不均一性を臨床結果や実験的なラベルなど、興味のある外部変数に結びつけることができるが、そのような多数のプロファイル細胞に対応するのに苦労することが多い。
この計算の負担を軽減するために、限られた数の細胞は通常、各患者から \emph{sketched} またはサブサンプリングされる。
しかし、既存のスケッチ法では、稀な細胞集団から稀な細胞を適切に分離したり、特定の免疫細胞型の真の頻度を維持できない。
本稿では, 免疫細胞型を基本周波数に保ちながら, 全細胞のサブサンプルを限定的に選択する, Kernel Herding に基づく新しいスケッチ手法を提案する。
3つのフローおよびマスサイトメトリーデータセットと1つの単細胞RNAシークエンシングデータセットを用いてアプローチを検証し、スケッチ細胞(1)が細胞全体の景観をより正確に表現し、(2)患者を臨床結果に応じて分類するなどの下流分析タスクにおけるパフォーマンスの向上を促進することを示した。
Kernel Herdingによるスケッチの実装は、 \url{https://github.com/vishalathreya/Set-Summarization}で公開されている。
関連論文リスト
- Generating Multi-Modal and Multi-Attribute Single-Cell Counts with CFGen [76.02070962797794]
マルチモーダル単細胞数に対するフローベース条件生成モデルであるセルフロー・フォー・ジェネレーションを提案する。
本研究は, 新規な生成タスクを考慮に入れた上で, 重要な生物学的データ特性の回復性の向上を示唆するものである。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Single-cell Multi-view Clustering via Community Detection with Unknown
Number of Clusters [64.31109141089598]
シングルセルデータに適した,革新的なマルチビュークラスタリング手法である scUNC を導入する。
scUNCは、事前に定義された数のクラスタを必要とせずに、異なるビューからの情報をシームレスに統合する。
3つの異なる単一セルデータセットを用いて,SCUNCの総合評価を行った。
論文 参考訳(メタデータ) (2023-11-28T08:34:58Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - Machine Learning for Flow Cytometry Data Analysis [0.0]
フローサイトメーターは、同時に数万の細胞を迅速に分析し、同時に単一の細胞から複数のパラメータを測定できる。
何百万もの細胞から収集された多次元データの中で、興味深い細胞集団を手動で識別できる必要がある。
3つの代表的な自動クラスタリングアルゴリズムが選択され、完全にかつ部分的に自動ゲーティングによって適用され、比較され、評価される。
論文 参考訳(メタデータ) (2023-03-16T00:43:46Z) - A biology-driven deep generative model for cell-type annotation in
cytometry [0.0]
Scyanはシングルセルサイトメトリーネットワークで,事前知識のみを用いて細胞タイプを自動的にアノテートする。
Scyanは、複数の公開データセット上の関連する最先端モデルよりも高速で解釈可能である。
さらに、Scyanはバッチ効果除去、デバーコーディング、人口発見など、いくつかの補完的なタスクを克服している。
論文 参考訳(メタデータ) (2022-08-11T10:50:44Z) - Interpretable Single-Cell Set Classification with Kernel Mean Embeddings [14.686560033030101]
Kernel Mean Embeddingは、各プロファイルされた生物学的サンプルの細胞景観をエンコードする。
簡単な線形分類器を訓練し、3つのフローおよび質量データセットの最先端の分類精度を実現する。
論文 参考訳(メタデータ) (2022-01-18T21:40:36Z) - Contrastive Cycle Adversarial Autoencoders for Single-cell Multi-omics
Alignment and Integration [0.0]
本稿では,単一セルRNA-seqデータと単一セルATAC-seqデータとの整合と統合のための新しいフレームワークを提案する。
他の最先端手法と比較して,本手法はシミュレーションデータと実シングルセルデータの両方において優れた性能を発揮する。
論文 参考訳(メタデータ) (2021-12-05T13:00:58Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Automated Phenotyping via Cell Auto Training (CAT) on the Cell DIVE
Platform [0.5599792629509229]
多重蛍光画像を用いた自動トレーニングセットを用いて, 組織試料中の細胞の自動分類法を提案する。
本発明の方法は、ロバストなハイパープレックス免疫蛍光プラットフォーム上の1つの組織部位に、その場で染色された複数のマーカーを利用する。
論文 参考訳(メタデータ) (2020-07-18T16:45:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。