論文の概要: Conditional Similarity Triplets Enable Covariate-Informed Representations of Single-Cell Data
- arxiv url: http://arxiv.org/abs/2406.08638v1
- Date: Wed, 12 Jun 2024 20:53:07 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-14 22:07:36.910776
- Title: Conditional Similarity Triplets Enable Covariate-Informed Representations of Single-Cell Data
- Title(参考訳): 単セルデータの共変量インフォーム表現を可能にする条件類似トリプレット
- Authors: Chi-Jane Chen, Haidong Yi, Natalie Stanley,
- Abstract要約: 機械学習アプローチは、サンプルごとの免疫学的要約を計算するために使用される。
本稿では,新たに三重項ペナライズ法を用いて損失関数を定式化する,集合ベースの符号化法であるCytoCoSetを紹介する。
- 参考スコア(独自算出の注目度): 0.49157446832511503
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Single-cell technologies enable comprehensive profiling of diverse immune cell-types through the measurement of multiple genes or proteins per cell. In order to translate data from immune profiling assays into powerful diagnostics, machine learning approaches are used to compute per-sample immunological summaries, or featurizations that can be used as inputs to models for outcomes of interest. Current supervised learning approaches for computing per-sample representations are optimized based only on the outcome variable to be predicted and do not take into account clinically-relevant covariates that are likely to also be measured. Here we expand the optimization problem to also take into account such additional patient covariates to directly inform the learned per-sample representations. To do this, we introduce CytoCoSet, a set-based encoding method, which formulates a loss function with an additional triplet term penalizing samples with similar covariates from having disparate embedding results in per-sample representations. Overall, incorporating clinical covariates leads to improved prediction of clinical phenotypes.
- Abstract(参考訳): 単細胞技術は、細胞毎の複数の遺伝子またはタンパク質の測定を通じて、多様な免疫細胞型の包括的プロファイリングを可能にする。
免疫プロファイリングアッセイからのデータから強力な診断へと変換するために、機械学習のアプローチは、サンプルごとの免疫学的要約や、興味ある結果のモデルへの入力として使用できる成果化を計算するために用いられる。
現在、サンプルごとの表現を計算するための教師付き学習アプローチは、予測される結果変数のみに基づいて最適化されており、測定される可能性の高い臨床関連共変量を考慮していない。
ここでは、このような患者共変量を考慮した最適化問題を拡張し、学習したサンプルごとの表現を直接通知する。
これを実現するために,CytoCoSetというセットベースの符号化手法を導入し,類似した共変量を持つ三項項のペナル化サンプルをサンプルごとの表現に異なる埋め込み結果を持つことから,損失関数を定式化する。
全体として、臨床共変体を取り入れることで、臨床表現型の予測が改善される。
関連論文リスト
- Generalize Drug Response Prediction by Latent Independent Projection for Asymmetric Constrained Domain Generalization [11.649397977546435]
本稿では,この課題に対処する新しいドメイン一般化フレームワークであるpanCancerDRを提案する。
本研究は,癌細胞株をドメイン特異的な試料として,各がんタイプを異なるソースドメインとして概念化する。
実験により,PanCancerDRは多様なソースドメインからタスク関連機能を効果的に学習できることが実証された。
論文 参考訳(メタデータ) (2025-02-06T12:53:45Z) - Imbalanced Classification via a Tabular Translation GAN [4.864819846886142]
本稿では,多数のサンプルを対応する合成マイノリティ標本にマッピングするために,新たな正規化損失を用いたジェネレーティブ・アドバイサル・ネットワークに基づくモデルを提案する。
提案手法は, 再加重法やオーバーサンプリング法と比較して, 平均精度を向上することを示す。
論文 参考訳(メタデータ) (2022-04-19T06:02:53Z) - Equivariance Allows Handling Multiple Nuisance Variables When Analyzing
Pooled Neuroimaging Datasets [53.34152466646884]
本稿では,構造空間上でインスタンス化された同変表現学習における最近の結果と,因果推論における古典的結果の簡易な利用が,いかに効果的に実現されたかを示す。
いくつかの仮定の下で、我々のモデルが複数のニュアンス変数を扱えることを実証し、そうでなければサンプルの大部分を取り除く必要のあるシナリオにおいて、プールされた科学データセットの分析を可能にする。
論文 参考訳(メタデータ) (2022-03-29T04:54:06Z) - Meta-Learners for Estimation of Causal Effects: Finite Sample Cross-Fit
Performance [0.0]
メタラーナーの有限試料特性を不均一な処理効果評価のために検討した。
有限サンプルにおけるメタラーナーの性能は推定方法に大きく依存していることが判明した。
論文 参考訳(メタデータ) (2022-01-30T00:52:33Z) - Interpretable Single-Cell Set Classification with Kernel Mean Embeddings [14.686560033030101]
Kernel Mean Embeddingは、各プロファイルされた生物学的サンプルの細胞景観をエンコードする。
簡単な線形分類器を訓練し、3つのフローおよび質量データセットの最先端の分類精度を実現する。
論文 参考訳(メタデータ) (2022-01-18T21:40:36Z) - Adversarial Sample Enhanced Domain Adaptation: A Case Study on
Predictive Modeling with Electronic Health Records [57.75125067744978]
ドメイン適応を容易にするデータ拡張手法を提案する。
逆生成したサンプルはドメイン適応時に使用される。
その結果,本手法の有効性とタスクの一般性が確認された。
論文 参考訳(メタデータ) (2021-01-13T03:20:20Z) - Sickle-cell disease diagnosis support selecting the most appropriate
machinelearning method: Towards a general and interpretable approach for
cellmorphology analysis from microscopy images [0.0]
本稿では,最先端技術に基づく分類手法と特徴の選択手法を提案する。
当科では,他の研究例に応用できる病原体疾患のサンプルを用いて検討した。
論文 参考訳(メタデータ) (2020-10-09T11:46:38Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Predictive Modeling of ICU Healthcare-Associated Infections from
Imbalanced Data. Using Ensembles and a Clustering-Based Undersampling
Approach [55.41644538483948]
本研究は,集中治療室における危険因子の同定と医療関連感染症の予測に焦点をあてる。
感染発生率の低減に向けた意思決定を支援することを目的とする。
論文 参考訳(メタデータ) (2020-05-07T16:13:12Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。