論文の概要: Statistical exploration of the Manifold Hypothesis
- arxiv url: http://arxiv.org/abs/2208.11665v4
- Date: Fri, 9 Feb 2024 16:10:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-12 21:32:03.030278
- Title: Statistical exploration of the Manifold Hypothesis
- Title(参考訳): マニフォールド仮説の統計的探索
- Authors: Nick Whiteley, Annie Gray, Patrick Rubin-Delanchy
- Abstract要約: マニフォールド仮説は、名目上高次元データは、高次元空間に埋め込まれた低次元多様体の近くに実際に集中していると主張している。
データのリッチかつ複雑な多様体構造が、汎用的かつ驚くほど単純な統計モデルから生まれることを示す。
我々は、高次元データの幾何学を発見し、解釈する手順を導出し、データ生成機構に関する仮説を探求する。
- 参考スコア(独自算出の注目度): 10.389701595098922
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Manifold Hypothesis is a widely accepted tenet of Machine Learning which
asserts that nominally high-dimensional data are in fact concentrated near a
low-dimensional manifold, embedded in high-dimensional space. This phenomenon
is observed empirically in many real world situations, has led to development
of a wide range of statistical methods in the last few decades, and has been
suggested as a key factor in the success of modern AI technologies. We show
that rich and sometimes intricate manifold structure in data can emerge from a
generic and remarkably simple statistical model -- the Latent Metric Model --
via elementary concepts such as latent variables, correlation and stationarity.
This establishes a general statistical explanation for why the Manifold
Hypothesis seems to hold in so many situations. Informed by the Latent Metric
Model we derive procedures to discover and interpret the geometry of
high-dimensional data, and explore hypotheses about the data generating
mechanism. These procedures operate under minimal assumptions and make use of
well known, scaleable graph-analytic algorithms.
- Abstract(参考訳): 多様体仮説は機械学習において広く受け入れられている理論であり、名目上高次元データは実際には高次元空間に埋め込まれた低次元多様体の近くに集中していると主張する。
この現象は多くの現実世界の状況で実証的に観察され、ここ数十年で幅広い統計手法が開発され、現代のAI技術の成功の重要な要因として示唆されている。
データのリッチかつ複雑な多様体構造は、潜在変数、相関、定常性といった基本的な概念によって、総称的かつ驚くほど単純な統計モデル(潜在計量モデル)から生じうることを示す。
このことは、なぜマニフォールド仮説がこれほど多くの状況で成り立つのかという一般的な統計的説明を確立している。
潜在計量モデルによってインフォームドされ、高次元データの幾何学を発見し解釈し、データ生成機構に関する仮説を探求する手順を導出する。
これらの手順は最小限の仮定の下で動作し、よく知られたスケール可能なグラフ解析アルゴリズムを利用する。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - A Multivariate Unimodality Test Harnessing the Dip Statistic of
Mahalanobis Distances Over Random Projections [0.21756081703275998]
線形ランダムプロジェクションとポイント・ツー・ポイント・ディスタンシングにより、一次元の一様性原理を多次元空間に拡張する。
我々の手法は$alpha$-unimodalityの仮定に根ざし、泥ッドと呼ばれる新しい一様性試験を提示する。
理論的および実証的研究は,多次元データセットの一様性評価における本手法の有効性を確認した。
論文 参考訳(メタデータ) (2023-11-28T09:11:02Z) - Directed Cyclic Graph for Causal Discovery from Multivariate Functional
Data [15.26007975367927]
因果構造学習のための機能線形構造方程式モデルを提案する。
解釈可能性を高めるために,本モデルは低次元因果埋め込み空間を含む。
提案モデルが標準仮定の下で因果的同定可能であることを示す。
論文 参考訳(メタデータ) (2023-10-31T15:19:24Z) - Conformal inference for regression on Riemannian Manifolds [49.7719149179179]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、Xで表される共変数がユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Towards a mathematical understanding of learning from few examples with
nonlinear feature maps [68.8204255655161]
トレーニングセットがわずか数個のデータポイントから構成されるデータ分類の問題を考える。
我々は、AIモデルの特徴空間の幾何学、基礎となるデータ分布の構造、モデルの一般化能力との間の重要な関係を明らかにする。
論文 参考訳(メタデータ) (2022-11-07T14:52:58Z) - Learning from few examples with nonlinear feature maps [68.8204255655161]
我々はこの現象を探求し、AIモデルの特徴空間の次元性、データ分散の非退化、モデルの一般化能力の間の重要な関係を明らかにする。
本分析の主な推力は、元のデータを高次元および無限次元空間にマッピングする非線形特徴変換が結果のモデル一般化能力に与える影響である。
論文 参考訳(メタデータ) (2022-03-31T10:36:50Z) - Nonparametric Functional Analysis of Generalized Linear Models Under
Nonlinear Constraints [0.0]
本稿では、一般化線形モデルのための新しい非パラメトリック方法論を紹介する。
これは二項回帰の強さとカテゴリーデータに対する潜在変数の定式化の強さを組み合わせたものである。
これは最近公開された方法論のパラメトリックバージョンを拡張し、一般化する。
論文 参考訳(メタデータ) (2021-10-11T04:49:59Z) - A Farewell to the Bias-Variance Tradeoff? An Overview of the Theory of
Overparameterized Machine Learning [37.01683478234978]
機械学習(ML)の急速な進歩は、この分野の長年のドグマに挑戦する科学的な疑問を数多く提起している。
最も重要なライドルの1つは、パラメータ化されたモデルの優れた経験的一般化である。
論文 参考訳(メタデータ) (2021-09-06T10:48:40Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - Information-theoretic limits of a multiview low-rank symmetric spiked
matrix model [19.738567726658875]
我々は、高次元推論問題の重要なクラス、すなわちスパイクされた対称行列モデルの一般化を考える。
シングルレター公式の証明を通じて情報理論の限界を厳格に確立する。
我々は最近導入された適応手法を改良し、低ランクモデルの研究に利用できるようにした。
論文 参考訳(メタデータ) (2020-05-16T15:31:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。