論文の概要: Tangent Space and Dimension Estimation with the Wasserstein Distance
- arxiv url: http://arxiv.org/abs/2110.06357v4
- Date: Mon, 25 Sep 2023 10:01:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-27 05:21:46.085299
- Title: Tangent Space and Dimension Estimation with the Wasserstein Distance
- Title(参考訳): ワッサーシュタイン距離を用いたタンジェント空間と次元推定
- Authors: Uzu Lim, Harald Oberhauser, Vidit Nanda
- Abstract要約: ユークリッド空間の滑らかなコンパクト部分多様体の近くで独立にサンプリングされた点の集合を考える。
我々は、その多様体の次元と接空間の両方を推定するために必要なサンプル点の数について数学的に厳密な境界を与える。
- 参考スコア(独自算出の注目度): 10.118241139691952
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Consider a set of points sampled independently near a smooth compact
submanifold of Euclidean space. We provide mathematically rigorous bounds on
the number of sample points required to estimate both the dimension and the
tangent spaces of that manifold with high confidence. The algorithm for this
estimation is Local PCA, a local version of principal component analysis. Our
results accommodate for noisy non-uniform data distribution with the noise that
may vary across the manifold, and allow simultaneous estimation at multiple
points. Crucially, all of the constants appearing in our bound are explicitly
described. The proof uses a matrix concentration inequality to estimate
covariance matrices and a Wasserstein distance bound for quantifying
nonlinearity of the underlying manifold and non-uniformity of the probability
measure.
- Abstract(参考訳): ユークリッド空間の滑らかなコンパクト部分多様体の近くで独立にサンプリングされた点の集合を考える。
我々は、その多様体の次元と接空間の両方を高い信頼性で推定するために必要なサンプル点の数に関する数学的に厳密な境界を与える。
この推定のアルゴリズムは、主成分分析のローカルバージョンであるlocal pcaである。
この結果から, 多様体毎に異なるノイズを持つ雑音非一様データ分布が得られ, 複数点の同時推定が可能となった。
重要なことに、我々の境界に現れる定数はすべて明示的に記述されている。
この証明は行列濃度の不等式を用いて共分散行列とワッサーシュタイン距離を推定し、基礎多様体の非線形性と確率測度の非均一性を定量化する。
関連論文リスト
- Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Sampling and estimation on manifolds using the Langevin diffusion [45.57801520690309]
離散化マルコフ過程に基づく$mu_phi $の線形汎函数の2つの推定器を検討する。
誤差境界は、本質的に定義されたランゲヴィン拡散の離散化を用いてサンプリングと推定のために導出される。
論文 参考訳(メタデータ) (2023-12-22T18:01:11Z) - Intrinsic Bayesian Cramér-Rao Bound with an Application to Covariance Matrix Estimation [49.67011673289242]
本稿では, 推定パラメータが滑らかな多様体内にある推定問題に対して, 新たな性能境界を提案する。
これはパラメータ多様体の幾何学と推定誤差測度の本質的な概念を誘導する。
論文 参考訳(メタデータ) (2023-11-08T15:17:13Z) - Fermat Distances: Metric Approximation, Spectral Convergence, and
Clustering Algorithms [7.07321040534471]
我々は、フェルマー距離が、データの本質的な次元に依存する正確な速度で、小さな近傍の連続体類似物に収束することを証明した。
この結果は、離散的なサンプル駆動のフェルマー距離に基づく離散グラフラプラシアンが、対応する連続体作用素に収束することを証明するために用いられる。
個別から連続的なFermat距離分析によって得られる視点は、データのための新しいクラスタリングアルゴリズムに繋がる。
論文 参考訳(メタデータ) (2023-07-07T16:36:00Z) - Mean-Square Analysis of Discretized It\^o Diffusions for Heavy-tailed
Sampling [17.415391025051434]
重み付きポインカーの不等式に関連する伊藤拡散の自然クラスを離散化することにより、重み付き分布のクラスからのサンプリングの複雑さを分析する。
平均二乗解析に基づいて、ワッサーシュタイン2計量のターゲット分布に近い分布が$epsilon$のサンプルを得るための反復複雑性を確立する。
論文 参考訳(メタデータ) (2023-03-01T15:16:03Z) - Nonlinear Sufficient Dimension Reduction for
Distribution-on-Distribution Regression [9.086237593805173]
本稿では,予測値と応答値の両方が分布データである場合に,非線形に十分な次元を減少させる新しい手法を提案する。
我々の重要なステップは、計量空間上に普遍カーネル(cc-ユニバーサル)を構築することである。
論文 参考訳(メタデータ) (2022-07-11T04:11:36Z) - Kernel distance measures for time series, random fields and other
structured data [71.61147615789537]
kdiffは、構造化データのインスタンス間の距離を推定するためのカーネルベースの新しい尺度である。
これはインスタンス間の自己類似性と交差類似性の両方を考慮し、距離分布の低い定量値を用いて定義される。
kdiffをクラスタリングと分類問題のための距離尺度として用いた分離性条件について,いくつかの理論的結果が得られた。
論文 参考訳(メタデータ) (2021-09-29T22:54:17Z) - Spatially relaxed inference on high-dimensional linear models [48.989769153211995]
本研究では,空間的に制約されたクラスタリング,統計的推論,アンサンブルを組み合わせ,複数のクラスタリング推論解を集約するアンサンブルクラスタリング推論アルゴリズムの特性について検討する。
アンサンブルクラスタ推論アルゴリズムは,最大クラスター径に等しい$delta$-FWERの標準仮定で$delta$-FWERを制御することを示す。
論文 参考訳(メタデータ) (2021-06-04T16:37:19Z) - Depth-based pseudo-metrics between probability distributions [1.1470070927586016]
本研究では,データ深度に基づく連続確率測度と関連する中央領域の2つの疑似測度を提案する。
Wasserstein距離とは対照的に、提案された疑似メトリックは次元の呪いに苦しむことはない。
地域ベースの擬似メトリックは堅牢なw.r.tである。
両端と尾が重い。
論文 参考訳(メタデータ) (2021-03-23T17:33:18Z) - Minimax Optimal Estimation of KL Divergence for Continuous Distributions [56.29748742084386]
Kullback-Leibler の同一および独立に分布するサンプルからの発散は、様々な領域において重要な問題である。
単純で効果的な推定器の1つは、これらのサンプル間の近辺 k に基づいている。
論文 参考訳(メタデータ) (2020-02-26T16:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。