論文の概要: Conditional Similarity Triplets Enable Covariate-Informed Representations of Single-Cell Data
- arxiv url: http://arxiv.org/abs/2406.08638v2
- Date: Sun, 24 Nov 2024 04:23:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:14:46.100765
- Title: Conditional Similarity Triplets Enable Covariate-Informed Representations of Single-Cell Data
- Title(参考訳): 単セルデータの共変量インフォーム表現を可能にする条件類似トリプレット
- Authors: Chi-Jane Chen, Haidong Yi, Natalie Stanley,
- Abstract要約: 機械学習のアプローチは、しばしば免疫学的要約やサンプルごとの成果を計算するために使われる。
サンプルごとの表現を計算するための現在の教師付き学習アプローチは、単一の結果を正確に予測するためにのみ訓練される。
提案するCytoCoSetは,サンプルごとの成果を学習するためのセットベースの符号化手法である。
- 参考スコア(独自算出の注目度): 0.49157446832511503
- License:
- Abstract: Single-cell technologies enable comprehensive profiling of diverse immune cell-types through the measurement of multiple genes or proteins per individual cell. In order to translate immune signatures assayed from blood or tissue into powerful diagnostics, machine learning approaches are often employed to compute immunological summaries or per-sample featurizations, which can be used as inputs to models for outcomes of interest. Current supervised learning approaches for computing per-sample representations are trained only to accurately predict a single outcome and do not take into account relevant additional clinical features or covariates that are likely to also be measured for each sample. Here, we introduce a novel approach for incorporating measured covariates in optimizing model parameters to ultimately specify per-sample encodings that accurately affect both immune signatures and additional clinical information. Our introduced method CytoCoSet is a set-based encoding method for learning per-sample featurizations, which formulates a loss function with an additional triplet term penalizing samples with similar covariates from having disparate embedding results in per-sample representations. Overall, incorporating clinical covariates enables the learning of encodings for each individual sample that ultimately improve prediction of clinical outcome.
- Abstract(参考訳): 単細胞技術は、個々の細胞ごとに複数の遺伝子またはタンパク質を測定することによって、多様な免疫細胞型の包括的プロファイリングを可能にする。
血液や組織から検出される免疫シグネチャを強力な診断に翻訳するために、機械学習のアプローチは、しばしば、興味ある結果のモデルへの入力として使用できる免疫学的要約やサンプルごとの成果を計算するために使用される。
サンプルごとの表現を計算するための現在の教師付き学習アプローチは、単一の結果の正確な予測と、サンプル毎に測定される可能性のある関連する臨床特徴や共変量を考慮していないように訓練されている。
そこで本研究では, モデルパラメータの最適化に測定共変体を組み込むことにより, 免疫署名と追加臨床情報の両方に正確に影響を及ぼすサンプル単位のエンコーディングを究極的に特定する手法を提案する。
提案手法であるCytoCoSetは、サンプルごとの成果を学習するためのセットベースの符号化手法であり、類似の共変量を持つ三項項のペナル化サンプルを、サンプルごとの表現に異なる埋め込み結果を持つことから、損失関数を定式化する。
全体として、臨床共変体を取り入れることで、個々のサンプルのエンコーディングを学習し、最終的に臨床結果の予測を改善することができる。
関連論文リスト
- Generalize Drug Response Prediction by Latent Independent Projection for Asymmetric Constrained Domain Generalization [11.649397977546435]
本稿では,この課題に対処する新しいドメイン一般化フレームワークであるpanCancerDRを提案する。
本研究は,癌細胞株をドメイン特異的な試料として,各がんタイプを異なるソースドメインとして概念化する。
実験により,PanCancerDRは多様なソースドメインからタスク関連機能を効果的に学習できることが実証された。
論文 参考訳(メタデータ) (2025-02-06T12:53:45Z) - Imbalanced Classification via a Tabular Translation GAN [4.864819846886142]
本稿では,多数のサンプルを対応する合成マイノリティ標本にマッピングするために,新たな正規化損失を用いたジェネレーティブ・アドバイサル・ネットワークに基づくモデルを提案する。
提案手法は, 再加重法やオーバーサンプリング法と比較して, 平均精度を向上することを示す。
論文 参考訳(メタデータ) (2022-04-19T06:02:53Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Meta-Learners for Estimation of Causal Effects: Finite Sample Cross-Fit
Performance [0.0]
メタラーナーの有限試料特性を不均一な処理効果評価のために検討した。
有限サンプルにおけるメタラーナーの性能は推定方法に大きく依存していることが判明した。
論文 参考訳(メタデータ) (2022-01-30T00:52:33Z) - Interpretable Single-Cell Set Classification with Kernel Mean Embeddings [14.686560033030101]
Kernel Mean Embeddingは、各プロファイルされた生物学的サンプルの細胞景観をエンコードする。
簡単な線形分類器を訓練し、3つのフローおよび質量データセットの最先端の分類精度を実現する。
論文 参考訳(メタデータ) (2022-01-18T21:40:36Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Sickle-cell disease diagnosis support selecting the most appropriate
machinelearning method: Towards a general and interpretable approach for
cellmorphology analysis from microscopy images [0.0]
本稿では,最先端技術に基づく分類手法と特徴の選択手法を提案する。
当科では,他の研究例に応用できる病原体疾患のサンプルを用いて検討した。
論文 参考訳(メタデータ) (2020-10-09T11:46:38Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。