論文の概要: FlowCyt: A Comparative Study of Deep Learning Approaches for Multi-Class Classification in Flow Cytometry Benchmarking
- arxiv url: http://arxiv.org/abs/2403.00024v2
- Date: Thu, 25 Apr 2024 09:20:47 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-26 20:58:26.823820
- Title: FlowCyt: A Comparative Study of Deep Learning Approaches for Multi-Class Classification in Flow Cytometry Benchmarking
- Title(参考訳): FlowCyt:フローサイトメトリーベンチマークにおける複数クラス分類のためのディープラーニングアプローチの比較検討
- Authors: Lorenzo Bini, Fatemeh Nassajian Mojarrad, Margarita Liarou, Thomas Matthes, Stéphane Marchand-Maillet,
- Abstract要約: FlowCytは、フローコードされたデータにおいて、マルチクラスのシングルセル分類のための最初の包括的なベンチマークである。
このデータセットは、30人の患者の骨髄サンプルからなり、各細胞は12個のマーカーで特徴づけられる。
- 参考スコア(独自算出の注目度): 1.6712896227173808
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents FlowCyt, the first comprehensive benchmark for multi-class single-cell classification in flow cytometry data. The dataset comprises bone marrow samples from 30 patients, with each cell characterized by twelve markers. Ground truth labels identify five hematological cell types: T lymphocytes, B lymphocytes, Monocytes, Mast cells, and Hematopoietic Stem/Progenitor Cells (HSPCs). Experiments utilize supervised inductive learning and semi-supervised transductive learning on up to 1 million cells per patient. Baseline methods include Gaussian Mixture Models, XGBoost, Random Forests, Deep Neural Networks, and Graph Neural Networks (GNNs). GNNs demonstrate superior performance by exploiting spatial relationships in graph-encoded data. The benchmark allows standardized evaluation of clinically relevant classification tasks, along with exploratory analyses to gain insights into hematological cell phenotypes. This represents the first public flow cytometry benchmark with a richly annotated, heterogeneous dataset. It will empower the development and rigorous assessment of novel methodologies for single-cell analysis.
- Abstract(参考訳): 本稿ではフローサイトメトリーデータにおけるマルチクラスシングルセル分類のための最初の総合的なベンチマークであるFlowCytを提案する。
このデータセットは、30人の患者の骨髄サンプルからなり、各細胞は12個のマーカーで特徴づけられる。
地上の真理ラベルは、Tリンパ球、Bリンパ球、単球、肥満細胞、造血幹細胞(HSPC)の5種類の血液学的細胞を識別する。
実験では、患者1人当たり100万の細胞で、教師付き誘導学習と半教師付きトランスダクティブ学習を利用する。
ベースラインメソッドには、ガウス混合モデル、XGBoost、ランダムフォレスト、ディープニューラルネットワーク、グラフニューラルネットワーク(GNN)などがある。
GNNは、グラフ符号化データにおける空間的関係を利用して、優れた性能を示す。
このベンチマークは、血液細胞表現型に関する洞察を得るために、臨床関連分類タスクの標準化された評価と探索分析を可能にする。
これは、リッチな注釈付きヘテロジニアスデータセットを備えた最初の公開フローサイトメトリーベンチマークである。
単細胞解析のための新しい方法論の開発と厳密な評価を強化する。
関連論文リスト
- MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - Injecting Hierarchical Biological Priors into Graph Neural Networks for Flow Cytometry Prediction [1.7709249262395883]
本研究では、単一セルのマルチクラス分類のためのグラフニューラルネットワーク(GNN)に階層的な事前知識を注入することを検討する。
本稿では,複数のGNNモデル,すなわちFCHC-GNNに適用可能な階層的なプラグイン手法を提案する。
論文 参考訳(メタデータ) (2024-05-28T18:24:16Z) - HemaGraph: Breaking Barriers in Hematologic Single Cell Classification
with Graph Attention [0.9499648210774584]
HemaGraphはフローデータから血液細胞の単細胞多クラス分類のための新しいフレームワークである。
HemaGraphは、30人の患者のデータに基づいて、5つの異なる細胞クラスにまたがる分類性能を示す。
本手法は, より大規模なコホート患者および他の血液疾患からの単細胞データに応用することを目的としている。
論文 参考訳(メタデータ) (2024-02-28T15:15:38Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - Machine Learning for Flow Cytometry Data Analysis [0.0]
フローサイトメーターは、同時に数万の細胞を迅速に分析し、同時に単一の細胞から複数のパラメータを測定できる。
何百万もの細胞から収集された多次元データの中で、興味深い細胞集団を手動で識別できる必要がある。
3つの代表的な自動クラスタリングアルゴリズムが選択され、完全にかつ部分的に自動ゲーティングによって適用され、比較され、評価される。
論文 参考訳(メタデータ) (2023-03-16T00:43:46Z) - Topological Data Analysis in Time Series: Temporal Filtration and
Application to Single-Cell Genomics [13.173307471333619]
単細胞トポロジカル単純解析(scTSA)を提案する。
このアプローチを細胞の局所ネットワークから単細胞遺伝子発現プロファイルに適用すると、これまで見つからなかった細胞生態のトポロジーが明らかになる。
38,731細胞,25細胞タイプ,12時間ステップにまたがるゼブラフィッシュ胚発生の単一細胞RNA-seqデータに基づいて,本研究は胃粘膜を最も重要な段階として強調する。
論文 参考訳(メタデータ) (2022-04-29T12:46:14Z) - Interpretable Single-Cell Set Classification with Kernel Mean Embeddings [14.686560033030101]
Kernel Mean Embeddingは、各プロファイルされた生物学的サンプルの細胞景観をエンコードする。
簡単な線形分類器を訓練し、3つのフローおよび質量データセットの最先端の分類精度を実現する。
論文 参考訳(メタデータ) (2022-01-18T21:40:36Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。