論文の概要: Time-inhomogeneous diffusion geometry and topology
- arxiv url: http://arxiv.org/abs/2203.14860v1
- Date: Mon, 28 Mar 2022 16:06:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 13:38:24.837632
- Title: Time-inhomogeneous diffusion geometry and topology
- Title(参考訳): 時間不均質拡散幾何学と位相
- Authors: Guillaume Huguet, Alexander Tong, Bastian Rieck, Jessie Huang, Manik
Kuchroo, Matthew Hirn, Guy Wolf, Smita Krishnaswamy
- Abstract要約: 拡散凝縮(英: Diffusion condensation)は、各ステップが最初に計算し、そのデータに拡散演算子を適用する時間不均質な過程である。
我々はこの過程の収束と進化を幾何学的、スペクトル的、位相的観点から理論的に分析する。
我々の研究は拡散凝縮の収束に関する理論的洞察を与え、トポロジカルデータ解析と幾何学的データ解析のリンクを提供することを示している。
- 参考スコア(独自算出の注目度): 69.55228523791897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion condensation is a dynamic process that yields a sequence of
multiscale data representations that aim to encode meaningful abstractions. It
has proven effective for manifold learning, denoising, clustering, and
visualization of high-dimensional data. Diffusion condensation is constructed
as a time-inhomogeneous process where each step first computes and then applies
a diffusion operator to the data. We theoretically analyze the convergence and
evolution of this process from geometric, spectral, and topological
perspectives. From a geometric perspective, we obtain convergence bounds based
on the smallest transition probability and the radius of the data, whereas from
a spectral perspective, our bounds are based on the eigenspectrum of the
diffusion kernel. Our spectral results are of particular interest since most of
the literature on data diffusion is focused on homogeneous processes. From a
topological perspective, we show diffusion condensation generalizes
centroid-based hierarchical clustering. We use this perspective to obtain a
bound based on the number of data points, independent of their location. To
understand the evolution of the data geometry beyond convergence, we use
topological data analysis. We show that the condensation process itself defines
an intrinsic diffusion homology. We use this intrinsic topology as well as an
ambient topology to study how the data changes over diffusion time. We
demonstrate both homologies in well-understood toy examples. Our work gives
theoretical insights into the convergence of diffusion condensation, and shows
that it provides a link between topological and geometric data analysis.
- Abstract(参考訳): 拡散凝縮(distribution condensation)は、意味のある抽象化をエンコードすることを目的とした、多スケールのデータ表現のシーケンスを生成する動的プロセスである。
多様体学習、復調、クラスタリング、高次元データの可視化に有効であることが証明されている。
拡散凝縮は、各ステップがまず計算し、次に拡散演算子をデータに適用する時間不均一なプロセスとして構成される。
我々はこの過程の収束と進化を幾何学的、スペクトル的、位相的観点から理論的に分析する。
幾何学的な観点からは、最小の遷移確率とデータの半径に基づいて収束境界を得るが、スペクトル的な観点では、我々の境界は拡散核の固有スペクトルに基づいている。
データ拡散に関する文献のほとんどは均質なプロセスに焦点を当てているため、我々のスペクトル結果は特に興味深い。
トポロジカルな視点から、拡散凝縮はセントロイドに基づく階層的クラスタリングを一般化する。
この視点を用いて,データポイント数に基づくバウンダリを,その位置とは無関係に取得する。
収束を超えたデータ幾何学の進化を理解するために、トポロジカルデータ解析を用いる。
凝縮過程自体が内在的拡散ホモロジーを定義することを示した。
この内在的トポロジと環境的トポロジを用いて拡散時間とともにデータがどのように変化するかを研究する。
両ホモロジーをよく理解されたおもちゃの例で示す。
本研究は拡散凝縮の収束に関する理論的知見を与え,位相的データ解析と幾何学的データ解析の関係を示す。
関連論文リスト
- Manifolds, Random Matrices and Spectral Gaps: The geometric phases of generative diffusion [8.389423957434818]
スコア関数のヤコビアンの固有値のスペクトルを解析し、その不連続性(ギャップ)は異なる部分多様体の存在と次元性を明らかにする。
本研究は, 生成過程における3つの異なる定性相の存在を明らかにした。
論文 参考訳(メタデータ) (2024-10-08T10:55:40Z) - Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Dynamical Regimes of Diffusion Models [14.797301819675454]
空間の次元とデータ数が大きい体制における生成拡散モデルについて検討する。
本研究は, 逆向き発生拡散過程における3つの異なる動的状態を明らかにするものである。
崩壊時間の次元とデータ数への依存性は、拡散モデルにおける次元の呪いの徹底的な評価を与える。
論文 参考訳(メタデータ) (2024-02-28T17:19:26Z) - Datacube segmentation via Deep Spectral Clustering [76.48544221010424]
拡張ビジョン技術は、しばしばその解釈に挑戦する。
データ立方体スペクトルの巨大な次元性は、その統計的解釈において複雑なタスクを生じさせる。
本稿では,符号化空間における教師なしクラスタリング手法の適用の可能性について検討する。
統計的次元削減はアドホック訓練(可変)オートエンコーダで行い、クラスタリング処理は(学習可能な)反復K-Meansクラスタリングアルゴリズムで行う。
論文 参考訳(メタデータ) (2024-01-31T09:31:28Z) - Persistent Homology for High-dimensional Data Based on Spectral Methods [16.58218530585593]
持続的ホモロジーはノイズに非常に敏感になり、正確なトポロジを検出できないことを示す。
拡散距離や有効抵抗など,データのk-アネレス近傍グラフ上のスペクトル距離は,高次元ノイズがあっても正確な位相を検出することができる。
論文 参考訳(メタデータ) (2023-11-06T13:18:08Z) - A Heat Diffusion Perspective on Geodesic Preserving Dimensionality
Reduction [66.21060114843202]
熱測地線埋め込みと呼ばれるより一般的な熱カーネルベースの多様体埋め込み法を提案する。
その結果,本手法は,地中真理多様体距離の保存において,既存の技術よりも優れていることがわかった。
また,連続体とクラスタ構造を併用した単一セルRNAシークエンシングデータセットに本手法を適用した。
論文 参考訳(メタデータ) (2023-05-30T13:58:50Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Convolutional Filtering on Sampled Manifolds [122.06927400759021]
サンプル多様体上の畳み込みフィルタリングは連続多様体フィルタリングに収束することを示す。
本研究は,ナビゲーション制御の問題点を実証的に明らかにした。
論文 参考訳(メタデータ) (2022-11-20T19:09:50Z) - Manifold Density Estimation via Generalized Dequantization [9.090451761951101]
ある種のデータは、その基礎となる幾何学がユークリッドであると仮定してよくモデル化されていない。
例えば、ある種のデータは球面上に存在することが知られているかもしれない。
そこで我々は,周辺ユークリッド空間の座標変換を通じて解釈する「量子化」に関する文献に触発された手法を提案する。
論文 参考訳(メタデータ) (2021-02-14T12:40:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。