論文の概要: Persistent homology for high-dimensional data based on spectral methods
- arxiv url: http://arxiv.org/abs/2311.03087v1
- Date: Mon, 6 Nov 2023 13:18:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 14:27:02.478796
- Title: Persistent homology for high-dimensional data based on spectral methods
- Title(参考訳): スペクトル法に基づく高次元データの持続的ホモロジー
- Authors: Sebastian Damrich, Philipp Berens, Dmitry Kobak
- Abstract要約: バニラの持続的ホモロジーはノイズに非常に敏感になり、正確なトポロジーを検出できないことを示す。
k$-nearest-neighborグラフ上のスペクトル距離は、高次元ノイズの存在下でも、永続ホモロジーが正しいトポロジーを検出できることを示している。
- 参考スコア(独自算出の注目度): 18.63671450223062
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Persistent homology is a popular computational tool for detecting non-trivial
topology of point clouds, such as the presence of loops or voids. However, many
real-world datasets with low intrinsic dimensionality reside in an ambient
space of much higher dimensionality. We show that in this case vanilla
persistent homology becomes very sensitive to noise and fails to detect the
correct topology. The same holds true for most existing refinements of
persistent homology. As a remedy, we find that spectral distances on the
$k$-nearest-neighbor graph of the data, such as diffusion distance and
effective resistance, allow persistent homology to detect the correct topology
even in the presence of high-dimensional noise. Furthermore, we derive a novel
closed-form expression for effective resistance in terms of the
eigendecomposition of the graph Laplacian, and describe its relation to
diffusion distances. Finally, we apply these methods to several
high-dimensional single-cell RNA-sequencing datasets and show that spectral
distances on the $k$-nearest-neighbor graph allow robust detection of cell
cycle loops.
- Abstract(参考訳): 永続ホモロジー(persistent homology)は、ループやボイドの存在など点雲の非自明なトポロジーを検出する一般的な計算ツールである。
しかし、内在次元が低い実世界の多くのデータセットは、より高次元の周囲空間に存在する。
この場合、バニラの持続的ホモロジーはノイズに非常に敏感になり、正確なトポロジーを検出できないことを示す。
同じことが、永続ホモロジーの既存のほとんどの改良にも当てはまる。
対策として,拡散距離や有効抵抗といったデータの$k$-nearest-neighborグラフ上のスペクトル距離は,高次元ノイズの存在下においても,持続的ホモロジーが正しいトポロジーを検出できることを示す。
さらに, グラフラプラシアンの固有分解の観点から, 有効抵抗に対する新しい閉形式式を導出し, その拡散距離との関係を記述した。
最後に、これらの手法を高次元単細胞RNAシークエンシングデータセットに適用し、$k$-nearest-neighborグラフ上のスペクトル距離がセルサイクルループの堅牢な検出を可能にすることを示す。
関連論文リスト
- Non-isotropic Persistent Homology: Leveraging the Metric Dependency of
PH [5.70896453969985]
連続ホモロジーを単一距離関数に制限する場合、点雲の情報が失われることを示す。
非等方的永続ホモロジーは、ランダムに生成された点雲の向き、向きのばらつき、スケーリングに関する情報を抽出できることを数値的に示す。
論文 参考訳(メタデータ) (2023-10-25T08:03:17Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - Convolutional Filtering on Sampled Manifolds [122.06927400759021]
サンプル多様体上の畳み込みフィルタリングは連続多様体フィルタリングに収束することを示す。
本研究は,ナビゲーション制御の問題点を実証的に明らかにした。
論文 参考訳(メタデータ) (2022-11-20T19:09:50Z) - Geodesic Sinkhorn for Fast and Accurate Optimal Transport on Manifolds [53.110934987571355]
多様体グラフ上の熱核に基づく測地学的シンクホーンを提案する。
化学療法中の患者試料からの高次元単細胞データの複数分布のバリセンタの計算に本法を適用した。
論文 参考訳(メタデータ) (2022-11-02T00:51:35Z) - Robust Inference of Manifold Density and Geometry by Doubly Stochastic
Scaling [8.271859911016719]
我々は高次元雑音下で頑健な推論のためのツールを開発する。
提案手法は, セルタイプにまたがる技術的ノイズレベルの変動に頑健であることを示す。
論文 参考訳(メタデータ) (2022-09-16T15:39:11Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Tight basis cycle representatives for persistent homology of large data
sets [0.0]
永続ホモロジー(PH)はトポロジカルデータ解析の一般的なツールであり、様々な分野の研究に応用されている。
理論上は強力だが、PHは大規模データセットへの適用を妨げる高い計算コストに悩まされている。
大規模データセットにおける非自明なロバストな特徴に関する厳密な代表的境界を計算するための戦略とアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-06-06T22:00:42Z) - Robust Topological Inference in the Presence of Outliers [18.6112824677157]
コンパクト集合への距離関数は、位相データ解析のパラダイムにおいて重要な役割を果たす。
ハウスドルフ距離における摂動に対する安定性にもかかわらず、永続ホモロジーは外れ値に対して非常に敏感である。
距離関数(textsfMoM Dist$)の$textitmedian-of-means$変種を提案し、その統計特性を確立する。
論文 参考訳(メタデータ) (2022-06-03T19:45:43Z) - Time-inhomogeneous diffusion geometry and topology [69.55228523791897]
拡散凝縮(英: Diffusion condensation)は、各ステップが最初に計算し、そのデータに拡散演算子を適用する時間不均質な過程である。
我々はこの過程の収束と進化を幾何学的、スペクトル的、位相的観点から理論的に分析する。
我々の研究は拡散凝縮の収束に関する理論的洞察を与え、トポロジカルデータ解析と幾何学的データ解析のリンクを提供することを示している。
論文 参考訳(メタデータ) (2022-03-28T16:06:17Z) - Spatially relaxed inference on high-dimensional linear models [48.989769153211995]
本研究では,空間的に制約されたクラスタリング,統計的推論,アンサンブルを組み合わせ,複数のクラスタリング推論解を集約するアンサンブルクラスタリング推論アルゴリズムの特性について検討する。
アンサンブルクラスタ推論アルゴリズムは,最大クラスター径に等しい$delta$-FWERの標準仮定で$delta$-FWERを制御することを示す。
論文 参考訳(メタデータ) (2021-06-04T16:37:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。