論文の概要: Linearized Optimal Transport for Analysis of High-Dimensional Point-Cloud and Single-Cell Data
- arxiv url: http://arxiv.org/abs/2510.22033v2
- Date: Wed, 29 Oct 2025 23:56:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 13:50:54.713025
- Title: Linearized Optimal Transport for Analysis of High-Dimensional Point-Cloud and Single-Cell Data
- Title(参考訳): 高次元点群・単セルデータ解析のための線形最適輸送
- Authors: Tianxiang Wang, Yingtong Ke, Dhananjay Bhaskar, Smita Krishnaswamy, Alexander Cloninger,
- Abstract要約: シングルセル技術は、細胞の高次元点雲を生成する。
各患者は単純なベクトルではなく不規則な点雲で表される。
線形最適輸送フレームワークを用いて不規則点雲を固定次元ユークリッド空間に埋め込む。
- 参考スコア(独自算出の注目度): 45.87606039212519
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Single-cell technologies generate high-dimensional point clouds of cells, enabling detailed characterization of complex patient states and treatment responses. Yet each patient is represented by an irregular point cloud rather than a simple vector, making it difficult to directly quantify and compare biological differences between individuals. Nonlinear methods such as kernels and neural networks achieve predictive accuracy but act as black boxes, offering little biological interpretability. To address these limitations, we adapt the Linear Optimal Transport (LOT) framework to this setting, embedding irregular point clouds into a fixed-dimensional Euclidean space while preserving distributional structure. This embedding provides a principled linear representation that preserves optimal transport geometry while enabling downstream analysis. It also forms a registration between any two patients, enabling direct comparison of their cellular distributions. Within this space, LOT enables: (i) \textbf{accurate and interpretable classification} of COVID-19 patient states, where classifier weights map back to specific markers and spatial regions driving predictions; and (ii) \textbf{synthetic data generation} for patient-derived organoids, exploiting the linearity of the LOT embedding. LOT barycenters yield averaged cellular profiles representing combined conditions or samples, supporting drug interaction testing. Together, these results establish LOT as a unified framework that bridges predictive performance, interpretability, and generative modeling. By transforming heterogeneous point clouds into structured embeddings directly traceable to the original data, LOT opens new opportunities for understanding immune variation and treatment effects in high-dimensional biological systems.
- Abstract(参考訳): シングルセル技術は、細胞の高次元点雲を生成し、複雑な患者の状態と治療反応の詳細な評価を可能にする。
しかし、各患者は単純なベクトルではなく不規則な点雲で表され、個体間の生物学的差異を直接定量化し比較することは困難である。
カーネルやニューラルネットワークのような非線形手法は予測精度を達成するが、ブラックボックスとして機能し、生物学的解釈性はほとんどない。
これらの制約に対処するため、この設定に線形最適輸送(LOT)フレームワークを適用し、不規則点雲を分布構造を保ちながら固定次元ユークリッド空間に埋め込む。
この埋め込みは、下流解析を可能としながら最適な輸送幾何学を保存する、原則化された線形表現を提供する。
また、2人の患者の間で登録し、細胞分布を直接比較することができる。
この空間内では、LOTは:
i) 特定マーカーや空間領域に重みをマッピングして予測を行う患者状態の「textbf{accurate and interpretable classification」
(ii)LOT埋め込みの線形性を利用した患者由来のオルガノイドに対するtextbf{synthetic data generation}。
LOTバリセンターは、結合した条件またはサンプルを表す平均的な細胞プロファイルを生成し、薬物相互作用のテストをサポートする。
これらの結果は、予測性能、解釈可能性、生成モデリングを橋渡しする統一的なフレームワークとしてLOTを確立する。
不均一な点雲を元のデータに直接トレース可能な構造的な埋め込みに変換することで、LOTは高次元生物学的システムにおける免疫の変化と治療効果を理解する新たな機会を開く。
関連論文リスト
- Uncovering smooth structures in single-cell data with PCS-guided neighbor embeddings [14.708144124501635]
単細胞シークエンシングは、細胞-状態遷移の詳細な研究を可能にすることによって生物学に革命をもたらす。
ノイズの多い高次元単細胞データから滑らかで低次元の表現を抽出することは依然として困難である。
NESSは、NE表現を改善するための、原則的で解釈可能な機械学習手法である。
論文 参考訳(メタデータ) (2025-06-27T13:45:55Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - Fourier Asymmetric Attention on Domain Generalization for Pan-Cancer Drug Response Prediction [11.649397977546435]
本稿では,この課題に対処するため,FourierDrugと呼ばれる新しいドメイン一般化フレームワークを提案する。
実験により,本モデルは多様なソースドメインからタスク関連特徴を効果的に学習し,未確認癌に対する薬物応答の正確な予測を行うことができた。
これらの知見は,本手法の現実的臨床応用の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2025-02-06T12:53:45Z) - Is your data alignable? Principled and interpretable alignability
testing and integration of single-cell data [24.457344926393397]
単細胞データ統合は、細胞の包括的な分子ビューを提供する。
既存の方法にはいくつかの基本的な制限がある。
スペクトル多様体アライメントと推論の枠組みを提案する。
論文 参考訳(メタデータ) (2023-08-03T16:04:14Z) - Batch Normalization in Cytometry Data by kNN-Graph Preservation [0.0]
Time-of-Flight(CyTOF)データによる高次元サイトメトリーにおけるバッチ効果は、比較分析の課題である。
従来のバッチ正規化法は、細胞集団に固有の複雑なトポロジカル構造を保存できない可能性がある。
本稿では,CyTOFデータのバッチ正規化に特化した,残差ニューラルネットワークを用いたポイントセット登録手法を提案する。
論文 参考訳(メタデータ) (2023-03-31T18:06:26Z) - Score-based Causal Representation Learning with Interventions [54.735484409244386]
本稿では,潜在因果変数を間接的に観察する際の因果表現学習問題について検討する。
目的は、 (i) 未知の線形変換(スケーリングまで)を回復し、 (ii) 潜在変数の下の有向非巡回グラフ(DAG)を決定することである。
論文 参考訳(メタデータ) (2023-01-19T18:39:48Z) - Modelling Technical and Biological Effects in scRNA-seq data with
Scalable GPLVMs [6.708052194104378]
我々は,ガウス過程潜在変数モデルである確率的非線形次元減少に対する一般的なアプローチを拡張し,大規模単一セルデータセットに拡張する。
鍵となる考え方は、高速な変動推論を可能にする下位境界の分解可能性を保存する拡張カーネルを使用することである。
論文 参考訳(メタデータ) (2022-09-14T15:25:15Z) - Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions
Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。
wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。
新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文 参考訳(メタデータ) (2020-12-08T02:26:03Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。