論文の概要: Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia
- arxiv url: http://arxiv.org/abs/2407.17329v1
- Date: Wed, 24 Jul 2024 14:53:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-25 13:34:51.545381
- Title: Low dimensional representation of multi-patient flow cytometry datasets using optimal transport for minimal residual disease detection in leukemia
- Title(参考訳): 白血病における最小残存病変検出のための最適輸送を用いた多施設フローサイトメトリーデータセットの低次元的表現
- Authors: Erell Gachon, Jérémie Bigot, Elsa Cazelles, Aguirre Mimoun, Jean-Philippe Vial,
- Abstract要約: 急性骨髄性白血病(AML)におけるMRD(Representing and Minimal Residual Disease)は予後と予後に必須である。
本稿では, 最適輸送(OT)に基づく統計的学習手法について検討し, フロー計測の低次元表現を実現する。
特に、我々のOTベースのアプローチは、FlowSomアルゴリズムの結果の関連性および情報的2次元表現を可能にする。
- 参考スコア(独自算出の注目度): 1.3980986259786223
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Representing and quantifying Minimal Residual Disease (MRD) in Acute Myeloid Leukemia (AML), a type of cancer that affects the blood and bone marrow, is essential in the prognosis and follow-up of AML patients. As traditional cytological analysis cannot detect leukemia cells below 5\%, the analysis of flow cytometry dataset is expected to provide more reliable results. In this paper, we explore statistical learning methods based on optimal transport (OT) to achieve a relevant low-dimensional representation of multi-patient flow cytometry measurements (FCM) datasets considered as high-dimensional probability distributions. Using the framework of OT, we justify the use of the K-means algorithm for dimensionality reduction of multiple large-scale point clouds through mean measure quantization by merging all the data into a single point cloud. After this quantization step, the visualization of the intra and inter-patients FCM variability is carried out by embedding low-dimensional quantized probability measures into a linear space using either Wasserstein Principal Component Analysis (PCA) through linearized OT or log-ratio PCA of compositional data. Using a publicly available FCM dataset and a FCM dataset from Bordeaux University Hospital, we demonstrate the benefits of our approach over the popular kernel mean embedding technique for statistical learning from multiple high-dimensional probability distributions. We also highlight the usefulness of our methodology for low-dimensional projection and clustering patient measurements according to their level of MRD in AML from FCM. In particular, our OT-based approach allows a relevant and informative two-dimensional representation of the results of the FlowSom algorithm, a state-of-the-art method for the detection of MRD in AML using multi-patient FCM.
- Abstract(参考訳): 急性骨髄性白血病(AML)におけるMRD(minimal Residual Disease)の表現と定量化は,AML患者の予後と予後に必須である。
従来の細胞学的解析では5倍以下の白血病細胞は検出できないため、フローサイトメトリーデータセットの解析はより信頼性の高い結果をもたらすことが期待されている。
本稿では,多患者フローサイトメトリー測定(FCM)データセットを高次元確率分布とみなすための,最適輸送(OT)に基づく統計的学習手法について検討する。
OTの枠組みを用いて,全データを単一点クラウドにマージして平均測度定量化することにより,K平均アルゴリズムを複数の大規模点クラウドの次元的低減に活用することを正当化する。
この量子化ステップの後、構成データの線形化OTまたは対数比PCAを介して、ワーッサーシュタイン主成分分析(PCA)を用いて、低次元量子化確率測度を線形空間に埋め込み、患者内および患者間FCM変動の可視化を行う。
ボルドー大学病院から公開されているFCMデータセットとFCMデータセットを用いて,複数の高次元確率分布から統計学習を行うために,一般的なカーネル平均埋め込み技術に対するアプローチの利点を実証した。
また,FCMからのAMLにおけるMDDのレベルに応じて,低次元投影法とクラスタリング患者測定法の有用性を強調した。
特に,我々のOTベースのアプローチは,多患者FCMを用いたAMLにおけるMDD検出の最先端手法であるFlowSomアルゴリズムの結果の関連性および情報的2次元表現を可能にする。
関連論文リスト
- On the importance of local and global feature learning for automated measurable residual disease detection in flow cytometry data [4.550634499956126]
本稿では,フロー(FCM)データにおけるMRD検出のための様々な深層学習手法について検討する。
本稿では,現在最先端(SOTA)モデルへの2つの適応を提案する。
コントリビューションには、SOTAモデルの拡張、公開データセットのパフォーマンス向上、実験室間の一般化の改善などが含まれています。
論文 参考訳(メタデータ) (2024-11-23T18:15:34Z) - Measuring Variable Importance in Individual Treatment Effect Estimation with High Dimensional Data [35.104681814241104]
因果機械学習(ML)は、個々の治療効果を推定するための強力なツールを提供する。
ML手法は、医療応用にとって重要な解釈可能性の重要な課題に直面している。
統計的に厳密な変数重要度評価のための条件置換重要度(CPI)法に基づく新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-23T11:44:07Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - XAI for In-hospital Mortality Prediction via Multimodal ICU Data [57.73357047856416]
マルチモーダルICUデータを用いて病院内死亡率を予測するための,効率的で説明可能なAIソリューションを提案する。
我々は,臨床データから異種入力を受信し,意思決定を行うマルチモーダル・ラーニングを我々のフレームワークに導入する。
我々の枠組みは、医療研究において重要な要素の発見を容易にする他の臨床課題に容易に移行することができる。
論文 参考訳(メタデータ) (2023-12-29T14:28:04Z) - Sparse high-dimensional linear mixed modeling with a partitioned empirical Bayes ECM algorithm [41.25603565852633]
この研究は、高次元LMMに対する効率的かつ正確なベイズ的枠組みを示す。
このアプローチの斬新さは、パーティショニングとパラメータ拡張と、高速でスケーラブルな計算にある。
実世界の例では、小児のループスの研究データを用いて、新しいループスバイオマーカーに関連する遺伝子と臨床因子を特定し、時間とともにバイオマーカーを予測する。
論文 参考訳(メタデータ) (2023-10-18T19:34:56Z) - Dimensionality Reduction of Longitudinal 'Omics Data using Modern Tensor
Factorization [4.740719424255845]
TCAMはマルチウェイデータのための次元削減手法である。
そこで本研究では,TAMが従来の手法よりも優れていること,および長手形マイクロバイオームデータ解析における最先端のテンソルベースのアプローチについて述べる。
論文 参考訳(メタデータ) (2021-11-28T14:50:14Z) - Lung Cancer Lesion Detection in Histopathology Images Using Graph-Based
Sparse PCA Network [93.22587316229954]
ヘマトキシリンとエオシン(H&E)で染色した組織学的肺スライドにおける癌病変の自動検出のためのグラフベーススパース成分分析(GS-PCA)ネットワークを提案する。
我々は,SVM K-rasG12D肺がんモデルから得られたH&Eスライダーの精度・リコール率,Fスコア,谷本係数,レシーバ演算子特性(ROC)の曲線下領域を用いて,提案アルゴリズムの性能評価を行った。
論文 参考訳(メタデータ) (2021-10-27T19:28:36Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。