論文の概要: A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction
- arxiv url: http://arxiv.org/abs/2305.19043v1
- Date: Tue, 30 May 2023 13:58:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 16:02:34.635408
- Title: A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction
- Title(参考訳): 測地線保存次元低減における熱拡散の展望
- Authors: Guillaume Huguet, Alexander Tong, Edward De Brouwer, Yanlei Zhang, Guy
Wolf, Ian Adelstein, Smita Krishnaswamy
- Abstract要約: 熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
- 参考スコア(独自算出の注目度): 66.21060114843202
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion-based manifold learning methods have proven useful in
representation learning and dimensionality reduction of modern high
dimensional, high throughput, noisy datasets. Such datasets are especially
present in fields like biology and physics. While it is thought that these
methods preserve underlying manifold structure of data by learning a proxy for
geodesic distances, no specific theoretical links have been established. Here,
we establish such a link via results in Riemannian geometry explicitly
connecting heat diffusion to manifold distances. In this process, we also
formulate a more general heat kernel based manifold embedding method that we
call heat geodesic embeddings. This novel perspective makes clearer the choices
available in manifold learning and denoising. Results show that our method
outperforms existing state of the art in preserving ground truth manifold
distances, and preserving cluster structure in toy datasets. We also showcase
our method on single cell RNA-sequencing datasets with both continuum and
cluster structure, where our method enables interpolation of withheld
timepoints of data. Finally, we show that parameters of our more general method
can be configured to give results similar to PHATE (a state-of-the-art
diffusion based manifold learning method) as well as SNE (an
attraction/repulsion neighborhood based method that forms the basis of t-SNE).
- Abstract(参考訳): 拡散に基づく多様体学習法は、現代高次元、高スループット、ノイズデータセットの表現学習と次元縮小に有用であることが証明されている。
このようなデータセットは特に生物学や物理学などの分野に存在する。
これらの手法は測地線距離のプロキシを学習することでデータの基本多様体構造を保存していると考えられるが、具体的な理論的リンクは確立されていない。
ここでは、リーマン幾何学において、熱拡散を多様体距離に明示的に接続する結果を通じてそのようなリンクを確立する。
このプロセスでは、熱測地埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法も定式化する。
この新しい視点は、多様体の学習と認知において利用できる選択肢を明確にする。
その結果,本手法は,地中真理多様体距離の保存,および玩具データセットのクラスタ構造の保存において,既存の技術よりも優れていた。
また, 連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用し, 非保持タイムポイントの補間を可能にする。
最後に,より一般的な手法のパラメータは,PHATE(最先端拡散型多様体学習法)やSNE(t-SNEの基盤となるアトラクション/反発近傍法)に類似した結果を与えるように構成できることを示す。
関連論文リスト
- Pullback Flow Matching on Data Manifolds [10.187244125099479]
プルバックフローマッチング(Pullback Flow Matching、PFM)は、データ多様体上の生成モデリングのためのフレームワークである。
PFMの有効性を、合成、データダイナミクス、タンパク質配列データに適用し、特定の性質を持つ新規なタンパク質を生成することによって実証する。
本手法は, 創薬・材料科学に強い可能性を示し, 特定の性質を持つ新規試料の生成に大きな関心を寄せている。
論文 参考訳(メタデータ) (2024-10-06T16:41:26Z) - Scaling Riemannian Diffusion Models [68.52820280448991]
非自明な多様体上の高次元タスクにスケールできることを示す。
我々は、$SU(n)$格子上のQCD密度と高次元超球面上の対照的に学習された埋め込みをモデル化する。
論文 参考訳(メタデータ) (2023-10-30T21:27:53Z) - Generative Modeling on Manifolds Through Mixture of Riemannian Diffusion Processes [57.396578974401734]
一般多様体上に生成拡散過程を構築するための原理的枠組みを導入する。
従来の拡散モデルの認知的アプローチに従う代わりに、橋梁プロセスの混合を用いて拡散過程を構築する。
混合過程を幾何学的に理解し,データ点への接する方向の重み付け平均としてドリフトを導出する。
論文 参考訳(メタデータ) (2023-10-11T06:04:40Z) - Manifold-augmented Eikonal Equations: Geodesic Distances and Flows on
Differentiable Manifolds [5.0401589279256065]
多様体の幾何学が距離場にどのように影響するかを示し、測地線流を利用して、グローバルな長さ最小曲線を直接得る。
この研究は、微分可能多様体上の統計学と減階モデリングの機会を開放する。
論文 参考訳(メタデータ) (2023-10-09T21:11:13Z) - Short and Straight: Geodesics on Differentiable Manifolds [6.85316573653194]
本研究では,測地線長を最小化するための既存の手法をまず解析する。
次に,連続多様体上の距離場と測地流のモデルに基づくパラメータ化を提案する。
第3に,Ricciスカラーのより大きい値を示す多様体の領域において,曲率に基づくトレーニング機構,サンプリングおよびスケーリングポイントを開発する。
論文 参考訳(メタデータ) (2023-05-24T15:09:41Z) - Time-inhomogeneous diffusion geometry and topology [69.55228523791897]
拡散凝縮(英: Diffusion condensation)は、各ステップが最初に計算し、そのデータに拡散演算子を適用する時間不均質な過程である。
我々はこの過程の収束と進化を幾何学的、スペクトル的、位相的観点から理論的に分析する。
我々の研究は拡散凝縮の収束に関する理論的洞察を与え、トポロジカルデータ解析と幾何学的データ解析のリンクを提供することを示している。
論文 参考訳(メタデータ) (2022-03-28T16:06:17Z) - Inferring Manifolds From Noisy Data Using Gaussian Processes [17.166283428199634]
ほとんどの既存の多様体学習アルゴリズムは、元のデータを低次元座標で置き換える。
本稿では,これらの問題に対処するための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-10-14T15:50:38Z) - Learning Manifold Implicitly via Explicit Heat-Kernel Learning [63.354671267760516]
そこで,本研究では,熱カーネルを学習することで,多様体情報を暗黙的に取得する,暗黙的多様体学習の概念を提案する。
学習した熱カーネルは、データ生成のための深層生成モデル(DGM)やベイズ推論のためのスタイン変分勾配Descentなど、さまざまなカーネルベースの機械学習モデルに適用することができる。
論文 参考訳(メタデータ) (2020-10-05T03:39:58Z) - Manifold Learning via Manifold Deflation [105.7418091051558]
次元削減法は、高次元データの可視化と解釈に有用な手段を提供する。
多くの一般的な手法は単純な2次元のマニフォールドでも劇的に失敗する。
本稿では,グローバルな構造を座標として組み込んだ,新しいインクリメンタルな空間推定器の埋め込み手法を提案する。
実験により,本アルゴリズムは実世界および合成データセットに新規で興味深い埋め込みを復元することを示した。
論文 参考訳(メタデータ) (2020-07-07T10:04:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。