論文の概要: Sketching the Heat Kernel: Using Gaussian Processes to Embed Data
- arxiv url: http://arxiv.org/abs/2403.07929v1
- Date: Fri, 1 Mar 2024 22:56:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-18 05:50:41.735695
- Title: Sketching the Heat Kernel: Using Gaussian Processes to Embed Data
- Title(参考訳): 熱カーネルの走査:ガウス過程を用いた埋め込みデータ
- Authors: Anna C. Gilbert, Kevin O'Neill,
- Abstract要約: 本稿では, ガウス過程の実現に基づく低次元ユークリッド空間にデータを埋め込む新しい非決定論的手法を提案する。
我々の手法は、その強靭性から外れ値へのさらなる優位性を示す。
- 参考スコア(独自算出の注目度): 4.220336689294244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper introduces a novel, non-deterministic method for embedding data in low-dimensional Euclidean space based on computing realizations of a Gaussian process depending on the geometry of the data. This type of embedding first appeared in (Adler et al, 2018) as a theoretical model for a generic manifold in high dimensions. In particular, we take the covariance function of the Gaussian process to be the heat kernel, and computing the embedding amounts to sketching a matrix representing the heat kernel. The Karhunen-Lo\`eve expansion reveals that the straight-line distances in the embedding approximate the diffusion distance in a probabilistic sense, avoiding the need for sharp cutoffs and maintaining some of the smaller-scale structure. Our method demonstrates further advantage in its robustness to outliers. We justify the approach with both theory and experiments.
- Abstract(参考訳): 本稿では、ガウス過程の計算実現に基づく低次元ユークリッド空間にデータを埋め込む新しい非決定論的手法を提案する。
この種の埋め込みは、高次元の一般多様体の理論モデルとして (Adler et al, 2018) に初めて現れた。
特に、ガウス過程の共分散関数を熱核とみなし、埋め込み量を計算して熱核を表す行列をスケッチする。
Karhunen-Lo\eve展開は、埋め込み中の直線距離が確率的な意味で拡散距離に近似していることを明らかにし、鋭いカットオフを回避し、より小さな構造の一部を維持する。
我々の手法は、その強靭性から外れ値へのさらなる優位性を示す。
我々は理論と実験の両方でアプローチを正当化する。
関連論文リスト
- von Mises Quasi-Processes for Bayesian Circular Regression [57.88921637944379]
円値ランダム関数上の表現的および解釈可能な分布の族を探索する。
結果の確率モデルは、統計物理学における連続スピンモデルと関係を持つ。
後続推論のために、高速マルコフ連鎖モンテカルロサンプリングに寄与するストラトノビッチのような拡張を導入する。
論文 参考訳(メタデータ) (2024-06-19T01:57:21Z) - Learning on manifolds without manifold learning [0.0]
未知分布からランダムに描画されたデータに基づく関数近似は、機械学習において重要な問題である。
本稿では,未知多様体を部分多様体の周囲超球面として投影し,超球面上に特別に設計されたカーネルを用いてワンショット近似を構築する問題について考察する。
論文 参考訳(メタデータ) (2024-02-20T03:27:53Z) - Scaling Riemannian Diffusion Models [68.52820280448991]
非自明な多様体上の高次元タスクにスケールできることを示す。
我々は、$SU(n)$格子上のQCD密度と高次元超球面上の対照的に学習された埋め込みをモデル化する。
論文 参考訳(メタデータ) (2023-10-30T21:27:53Z) - Implicit Manifold Gaussian Process Regression [49.0787777751317]
ガウス過程の回帰は、よく校正された不確実性推定を提供するために広く用いられている。
これは、データが実際に存在する暗黙の低次元多様体のため、高次元データに苦しむ。
本稿では,データ(ラベル付きおよびラベルなし)から直接暗黙構造を完全に微分可能な方法で推定できる手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T09:52:48Z) - Generative Modeling on Manifolds Through Mixture of Riemannian Diffusion Processes [57.396578974401734]
一般多様体上に生成拡散過程を構築するための原理的枠組みを導入する。
従来の拡散モデルの認知的アプローチに従う代わりに、橋梁プロセスの混合を用いて拡散過程を構築する。
混合過程を幾何学的に理解し,データ点への接する方向の重み付け平均としてドリフトを導出する。
論文 参考訳(メタデータ) (2023-10-11T06:04:40Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - Kernelized Diffusion maps [2.817412580574242]
本稿では、再生カーネルヒルベルト空間法を用いて、ラプラシアンの異なる推定器を構築する。
我々は、構築したカーネル推定器が次元性の呪いを回避できることを示す非漸近統計率を提供する。
論文 参考訳(メタデータ) (2023-02-13T23:54:36Z) - Isotropic Gaussian Processes on Finite Spaces of Graphs [71.26737403006778]
種々の非重み付きグラフの集合上でガウス過程の先行を定義するための原理的手法を提案する。
さらに、未重み付きグラフの同値類の集合を検討し、それに対する事前の適切なバージョンを定義する。
化学の応用に触発されて、我々は、小データ構造における実際の分子特性予測タスクについて、提案手法を解説した。
論文 参考訳(メタデータ) (2022-11-03T10:18:17Z) - Local Random Feature Approximations of the Gaussian Kernel [14.230653042112834]
本稿では,一般的なガウスカーネルと,ランダムな特徴近似を用いてカーネルベースモデルを線形化する手法に着目する。
このような手法は、高周波データをモデル化する際、悪い結果をもたらすことを示すとともに、カーネル近似と下流性能を大幅に改善する新たなローカライズ手法を提案する。
論文 参考訳(メタデータ) (2022-04-12T09:52:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。