論文の概要: Interpretable Single-Cell Set Classification with Kernel Mean Embeddings
- arxiv url: http://arxiv.org/abs/2201.07322v1
- Date: Tue, 18 Jan 2022 21:40:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-21 01:15:09.521476
- Title: Interpretable Single-Cell Set Classification with Kernel Mean Embeddings
- Title(参考訳): カーネル平均埋め込みを用いた解釈可能な単セル集合分類
- Authors: Siyuan Shan, Vishal Baskaran, Haidong Yi, Jolene Ranek, Natalie
Stanley, Junier Oliva
- Abstract要約: Kernel Mean Embeddingは、各プロファイルされた生物学的サンプルの細胞景観をエンコードする。
簡単な線形分類器を訓練し、3つのフローおよび質量データセットの最先端の分類精度を実現する。
- 参考スコア(独自算出の注目度): 14.686560033030101
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Modern single-cell flow and mass cytometry technologies measure the
expression of several proteins of the individual cells within a blood or tissue
sample. Each profiled biological sample is thus represented by a set of
hundreds of thousands of multidimensional cell feature vectors, which incurs a
high computational cost to predict each biological sample's associated
phenotype with machine learning models. Such a large set cardinality also
limits the interpretability of machine learning models due to the difficulty in
tracking how each individual cell influences the ultimate prediction. Using
Kernel Mean Embedding to encode the cellular landscape of each profiled
biological sample, we can train a simple linear classifier and achieve
state-of-the-art classification accuracy on 3 flow and mass cytometry datasets.
Our model contains few parameters but still performs similarly to deep learning
models with millions of parameters. In contrast with deep learning approaches,
the linearity and sub-selection step of our model make it easy to interpret
classification results. Clustering analysis further shows that our method
admits rich biological interpretability for linking cellular heterogeneity to
clinical phenotype.
- Abstract(参考訳): 現代の単細胞フローおよび質量サイトメトリー技術は、血液または組織サンプル内の個々の細胞のいくつかのタンパク質の発現を測定する。
各プロファイルされた生物学的サンプルは、数十万の多次元細胞特徴ベクトルによって表現され、各生物学的サンプルの表現型を機械学習モデルで予測するために高い計算コストがかかる。
このような大きな集合の濃度は、個々のセルが最終的な予測にどのように影響するかを追跡するのが困難であるため、機械学習モデルの解釈可能性を制限する。
Kernel Mean Embeddingを用いて、各プロファイルされた生体試料の細胞景観を符号化し、簡単な線形分類器を訓練し、3つのフローおよび質量サイトメトリーデータセットの最先端の分類精度を達成できる。
私たちのモデルはパラメータは少ないが、数百万のパラメータを持つディープラーニングモデルと同じように動作する。
ディープラーニングのアプローチとは対照的に,モデルの線形性とサブ選択ステップによって,分類結果の解釈が容易になる。
また, クラスタリング解析により, 細胞多様性を臨床表現型と結びつける上で, 高い生物学的解釈性が得られた。
関連論文リスト
- MMIL: A novel algorithm for disease associated cell type discovery [58.044870442206914]
単一細胞データセットは、しばしば個々の細胞ラベルを欠いているため、病気に関連する細胞を特定することは困難である。
セルレベルの分類器の訓練と校正を可能にする予測手法であるMixture Modeling for Multiple Learning Instance (MMIL)を導入する。
論文 参考訳(メタデータ) (2024-06-12T15:22:56Z) - FlowCyt: A Comparative Study of Deep Learning Approaches for Multi-Class Classification in Flow Cytometry Benchmarking [1.6712896227173808]
FlowCytは、フローコードされたデータにおいて、マルチクラスのシングルセル分類のための最初の包括的なベンチマークである。
このデータセットは、30人の患者の骨髄サンプルからなり、各細胞は12個のマーカーで特徴づけられる。
論文 参考訳(メタデータ) (2024-02-28T15:01:59Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Mixed Models with Multiple Instance Learning [51.440557223100164]
一般化線形混合モデル(GLMM)とMultiple Instance Learning(MIL)を統合するフレームワークであるMixMILを紹介する。
実験結果から,MixMILは単一セルデータセットにおいて既存のMILモデルより優れていることがわかった。
論文 参考訳(メタデータ) (2023-11-04T16:42:42Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - VOLTA: an Environment-Aware Contrastive Cell Representation Learning for
Histopathology [0.3436781233454516]
病理組織像における細胞表現学習のための自己組織化フレームワーク(VOLTA)を提案する。
我々は、世界中の複数の機関から収集されたデータに関する広範な実験にモデルを適用した。
提案フレームワークの有効性を明らかにするため, 卵巣癌および子宮内膜癌にVOLTAを応用した。
論文 参考訳(メタデータ) (2023-03-08T16:35:47Z) - Machine learning based lens-free imaging technique for field-portable
cytometry [0.0]
提案手法の精度は98%に向上し,多くの細胞に対して5dB以上の信号が増強された。
モデルは、数回の学習イテレーションで新しいタイプのサンプルを学ぶために適応し、新しく導入されたサンプルをうまく分類することができる。
論文 参考訳(メタデータ) (2022-03-02T07:09:29Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Sickle-cell disease diagnosis support selecting the most appropriate
machinelearning method: Towards a general and interpretable approach for
cellmorphology analysis from microscopy images [0.0]
本稿では,最先端技術に基づく分類手法と特徴の選択手法を提案する。
当科では,他の研究例に応用できる病原体疾患のサンプルを用いて検討した。
論文 参考訳(メタデータ) (2020-10-09T11:46:38Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Distinguishing Cell Phenotype Using Cell Epigenotype [0.0]
顕微鏡観察とマクロな振る舞いの関係は、生体物理学システムにおける根本的なオープンな問題である。
既存の手法とは対照的に,ヒトの組織多様性と利用可能なデータの制限を考慮に入れた場合でも,マクロ分子データから細胞型を予測する統一的なアプローチを開発する。
論文 参考訳(メタデータ) (2020-03-20T18:00:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。