論文の概要: Geodesic Sinkhorn: optimal transport for high-dimensional datasets
- arxiv url: http://arxiv.org/abs/2211.00805v1
- Date: Wed, 2 Nov 2022 00:51:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 14:30:49.084164
- Title: Geodesic Sinkhorn: optimal transport for high-dimensional datasets
- Title(参考訳): geodesic sinkhorn:高次元データセットのための最適トランスポート
- Authors: Guillaume Huguet, Alexander Tong, Mar\'ia Ramos Zapatero, Guy Wolf,
Smita Krishnaswamy
- Abstract要約: データ多様体に沿って人口を補間する方法であるGeodesic Sinkhornを提案する。
本手法では, ユークリッドの地表面距離と比較して, 単細胞力学を補間するのにより高精度な地表面距離を用いる。
- 参考スコア(独自算出の注目度): 71.71857590540894
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the dynamics and reactions of cells from population snapshots
is a major challenge in single-cell transcriptomics. Here, we present Geodesic
Sinkhorn, a method for interpolating populations along a data manifold that
leverages existing kernels developed for single-cell dimensionality reduction
and visualization methods. Our Geodesic Sinkhorn method uses a heat-geodesic
ground distance that, as compared to Euclidean ground distances, is more
accurate for interpolating single-cell dynamics on a wide variety of datasets
and significantly speeds up the computation for sparse kernels. We first apply
Geodesic Sinkhorn to 10 single-cell transcriptomics time series interpolation
datasets as a drop-in replacement for existing interpolation methods where it
outperforms on all datasets, showing its effectiveness in modeling cell
dynamics. Second, we show how to efficiently approximate the operator with
polynomial kernels allowing us to improve scaling to large datasets. Finally,
we define the conditional Wasserstein-average treatment effect and show how it
can elucidate the treatment effect on single-cell populations on a drug screen.
- Abstract(参考訳): 集団スナップショットから細胞の動態と反応を理解することは、単細胞転写学において大きな課題である。
本稿では,単細胞次元の縮小と可視化のために開発された既存カーネルを活用したデータ多様体上の個体群を補間する手法であるgeodesic sinkhornを提案する。
測地線シンクホーン法では, ユークリッドの接地距離と比較して, 様々なデータセット上で単一セルダイナミクスを補間し, スパースカーネルの計算を著しく高速化する熱-測地線接地距離を用いる。
まず、Geodesic Sinkhornを10個の単一セルトランスクリプトミクス時系列補間データセットに適用し、既存の補間手法の代替として、すべてのデータセットで性能が向上し、セルダイナミクスをモデル化する効果を示す。
次に,演算子を多項式カーネルで効率的に近似し,大規模データセットのスケーリングを改善する方法を示す。
最後に, 条件付きワッサースタイン平均治療効果を定義し, 薬物スクリーン上の単細胞集団に対する治療効果を解明する方法を示す。
関連論文リスト
- Relative-Translation Invariant Wasserstein Distance [82.6068808353647]
距離の新しい族、相対翻訳不変ワッサーシュタイン距離(RW_p$)を導入する。
我々は、$RW_p 距離もまた、分布変換に不変な商集合 $mathcalP_p(mathbbRn)/sim$ 上で定義される実距離測度であることを示す。
論文 参考訳(メタデータ) (2024-09-04T03:41:44Z) - Sketching the Heat Kernel: Using Gaussian Processes to Embed Data [4.220336689294244]
本稿では, ガウス過程の実現に基づく低次元ユークリッド空間にデータを埋め込む新しい非決定論的手法を提案する。
我々の手法は、その強靭性から外れ値へのさらなる優位性を示す。
論文 参考訳(メタデータ) (2024-03-01T22:56:19Z) - Bivariate DeepKriging for Large-scale Spatial Interpolation of Wind Fields [2.586710925821896]
高空間分解能風速データは、気候、海洋学、気象学研究における幅広い応用に不可欠である。
2次元の速度を持つ二変量風場の大規模空間計算やダウンスケーリングは難しい課題である。
本稿では,空間的ラジアル基底関数によって構築された埋め込み層を持つ空間依存型ディープニューラルネットワーク(DNN)であるバイバリケートディープクリギングを提案する。
提案したDNNモデルの計算効率とスケーラビリティを,従来の手法に比べて平均20倍高速な計算で実証する。
論文 参考訳(メタデータ) (2023-07-16T13:34:44Z) - Graph Fourier MMD for Signals on Graphs [67.68356461123219]
本稿では,グラフ上の分布と信号の間の新しい距離を提案する。
GFMMDは、グラフ上で滑らかであり、期待差を最大化する最適な目撃関数によって定義される。
グラフベンチマークのデータセットと単一セルRNAシークエンシングデータ解析について紹介する。
論文 参考訳(メタデータ) (2023-06-05T00:01:17Z) - GraphWalks: Efficient Shape Agnostic Geodesic Shortest Path Estimation [93.60478281489243]
3次元曲面上の測地線経路を近似する学習可能なネットワークを提案する。
提案手法は,最短経路の効率的な近似と測地距離推定を提供する。
論文 参考訳(メタデータ) (2022-05-30T16:22:53Z) - Entropic Optimal Transport in Random Graphs [8.7314407902481]
グラフ解析において、古典的なタスクはノード間の(グループの)類似性の計算によって構成される。
潜在空間におけるノード群間の距離を連続的に推定することは可能であることを示す。
論文 参考訳(メタデータ) (2022-01-11T13:52:34Z) - Near-optimal estimation of smooth transport maps with kernel
sums-of-squares [81.02564078640275]
滑らかな条件下では、2つの分布の間の正方形ワッサーシュタイン距離は、魅力的な統計的誤差上界で効率的に計算できる。
生成的モデリングのような応用への関心の対象は、基礎となる最適輸送写像である。
そこで本研究では,地図上の統計的誤差であるL2$が,既存のミニマックス下限値とほぼ一致し,スムーズな地図推定が可能となる最初のトラクタブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-03T13:45:36Z) - Fast and Scalable Optimal Transport for Brain Tractograms [4.610968512889579]
線形メモリフットプリント上での正規化最適輸送問題を解くための新しいマルチスケールアルゴリズムを提案する。
本手法は, ファイバー束やトラック密度マップとしてモデル化された脳幹図に対して有効性を示す。
論文 参考訳(メタデータ) (2021-07-05T13:28:41Z) - Combining Pseudo-Point and State Space Approximations for Sum-Separable
Gaussian Processes [48.64129867897491]
我々は,擬似点法と状態空間GP近似フレームワークを組み合わせて両世界の長所を得る,シンプルでエレガントな方法が存在することを示す。
組み合わせたアプローチは、どちらの方法よりも拡張性が高く、時間的問題にも適用可能であることを実証する。
論文 参考訳(メタデータ) (2021-06-18T16:30:09Z) - Convergence of Gaussian-smoothed optimal transport distance with
sub-gamma distributions and dependent samples [12.77426855794452]
本稿では,より一般的な設定下でのGOT距離を推定するための収束保証を提供する。
我々の分析における重要なステップは、GOT距離がカーネルの最大誤差距離の族に支配されていることを示すことである。
論文 参考訳(メタデータ) (2021-02-28T04:30:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。