論文の概要: How high is `high'? Rethinking the roles of dimensionality in topological data analysis and manifold learning
- arxiv url: http://arxiv.org/abs/2505.16879v1
- Date: Thu, 22 May 2025 16:34:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.458975
- Title: How high is `high'? Rethinking the roles of dimensionality in topological data analysis and manifold learning
- Title(参考訳): ハイ」はどのくらい高いのか?トポロジカルデータ分析と多様体学習における次元の役割を再考する
- Authors: Hannah Sansford, Nick Whiteley, Patrick Rubin-Delanchy,
- Abstract要約: 我々は、一般化されたハンソン・ライトの不等式を示し、それをデータポイントクラウドの幾何学に関する新しい統計的知見を確立するために利用する。
ガードナーらによる格子細胞活動における等尺トロイダル構造の画期的な神経科学的な発見を再考する。
我々の発見は、この構造が実際に物理空間にあるという証拠を初めて明らかにし、格子状細胞活動が現実世界の幾何学的に忠実な表現を伝達していることを意味する。
- 参考スコア(独自算出の注目度): 8.397730500554047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a generalised Hanson-Wright inequality and use it to establish new statistical insights into the geometry of data point-clouds. In the setting of a general random function model of data, we clarify the roles played by three notions of dimensionality: ambient intrinsic dimension $p_{\mathrm{int}}$, which measures total variability across orthogonal feature directions; correlation rank, which measures functional complexity across samples; and latent intrinsic dimension, which is the dimension of manifold structure hidden in data. Our analysis shows that in order for persistence diagrams to reveal latent homology and for manifold structure to emerge it is sufficient that $p_{\mathrm{int}}\gg \log n$, where $n$ is the sample size. Informed by these theoretical perspectives, we revisit the ground-breaking neuroscience discovery of toroidal structure in grid-cell activity made by Gardner et al. (Nature, 2022): our findings reveal, for the first time, evidence that this structure is in fact isometric to physical space, meaning that grid cell activity conveys a geometrically faithful representation of the real world.
- Abstract(参考訳): 我々は、一般化されたハンソン・ライトの不等式を示し、それをデータポイントクラウドの幾何学に関する新しい統計的知見を確立するために利用する。
データの一般ランダム関数モデルの設定において, 空間内在性次元$p_{\mathrm{int}}$, 直交的特徴方向の総変動度, サンプル間の機能的複雑性を測る相関ランク, データ内に隠された多様体構造の次元である潜時内在性次元の3つの概念で表される役割を明らかにする。
解析により、永続図形が潜在ホモロジーを明らかにし、多様体構造が出現するためには、$p_{\mathrm{int}}\gg \log n$, ここで$n$は標本サイズである。
Gardnerらによるグリッド細胞活動におけるトロイダル構造(Nature, 2022)の基盤的な神経科学的な発見を再考した結果、この構造が実際に物理空間に等しく、格子細胞活動が現実世界の幾何学的に忠実な表現を伝達しているという証拠が初めて明らかになった。
関連論文リスト
- (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Information-Theoretic Thresholds for Planted Dense Cycles [52.076657911275525]
本研究では,社会科学や生物科学においてユビキタスな小世界ネットワークのランダムグラフモデルについて検討する。
植え込み高密度サイクルの検出と回復の両面において、情報理論の閾値を$n$, $tau$、エッジワイド信号対雑音比$lambda$で特徴づける。
論文 参考訳(メタデータ) (2024-02-01T03:39:01Z) - A Hitchhiker's Guide to Geometric GNNs for 3D Atomic Systems [87.30652640973317]
原子系の計算モデリングの最近の進歩は、これらを3次元ユークリッド空間のノードとして埋め込まれた原子を含む幾何学的グラフとして表現している。
Geometric Graph Neural Networksは、タンパク質構造予測から分子シミュレーション、物質生成まで、幅広い応用を駆動する機械学習アーキテクチャとして好まれている。
本稿では,3次元原子システムのための幾何学的GNNの分野について,包括的で自己完結した概要を述べる。
論文 参考訳(メタデータ) (2023-12-12T18:44:19Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - Study of Manifold Geometry using Multiscale Non-Negative Kernel Graphs [32.40622753355266]
データの幾何学的構造を研究するための枠組みを提案する。
我々は最近導入された非負のカーネル回帰グラフを用いて、点密度、固有次元、およびデータ多様体(曲率)の線型性を推定する。
論文 参考訳(メタデータ) (2022-10-31T17:01:17Z) - Shape And Structure Preserving Differential Privacy [70.08490462870144]
正方形距離関数の勾配がラプラス機構よりも感度をよりよく制御できることを示す。
また,2乗距離関数の勾配を用いることで,ラプラス機構よりも感度を制御できることを示す。
論文 参考訳(メタデータ) (2022-09-21T18:14:38Z) - Statistical Mechanics of Neural Processing of Object Manifolds [3.4809730725241605]
この論文は、物体の神経処理の計算理論の基礎を築いた。
多様体のキャパシティは,有効半径, R_M, 有効次元, D_Mと決定される。
論文 参考訳(メタデータ) (2021-06-01T20:49:14Z) - Identifying the latent space geometry of network models through analysis
of curvature [7.644165047073435]
本稿では,可換空間の経験的に関連するクラスから多様体の種類,次元,曲率を一貫して推定する手法を提案する。
私たちのコアインサイトは、このグラフを、シリック間の結びつきに基づく騒々しい距離行列として表現することで実現します。
論文 参考訳(メタデータ) (2020-12-19T00:35:29Z) - Visualizing the Finer Cluster Structure of Large-Scale and
High-Dimensional Data [7.400745342582259]
一般化されたシグモイド関数を用いて高次元空間と低次元空間の距離類似性をモデル化する。
本研究では,シミュレーションと実世界の両方のデータセットを用いて,一様多様体の近似と投影に匹敵する可視化結果が得られることを示す。
論文 参考訳(メタデータ) (2020-07-17T01:36:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。