論文の概要: Balancing Geometry and Density: Path Distances on High-Dimensional Data
- arxiv url: http://arxiv.org/abs/2012.09385v1
- Date: Thu, 17 Dec 2020 04:03:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:35:07.316921
- Title: Balancing Geometry and Density: Path Distances on High-Dimensional Data
- Title(参考訳): 幾何と密度のバランス:高次元データを用いた経路距離
- Authors: Anna Little, Daniel McKenzie and James Murphy
- Abstract要約: パワー重み付き最短経路距離(PWSPD)の新しい幾何学的および計算的解析について述べる。
これらのメトリクスが基礎データの密度とジオメトリのバランスをとる方法を照らすことによって、これらのメトリクスが実際にどのように選択されるかについて議論します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: New geometric and computational analyses of power-weighted shortest-path
distances (PWSPDs) are presented. By illuminating the way these metrics balance
density and geometry in the underlying data, we clarify their key parameters
and discuss how they may be chosen in practice. Comparisons are made with
related data-driven metrics, which illustrate the broader role of density in
kernel-based unsupervised and semi-supervised machine learning.
Computationally, we relate PWSPDs on complete weighted graphs to their
analogues on weighted nearest neighbor graphs, providing high probability
guarantees on their equivalence that are near-optimal. Connections with
percolation theory are developed to establish estimates on the bias and
variance of PWSPDs in the finite sample setting. The theoretical results are
bolstered by illustrative experiments, demonstrating the versatility of PWSPDs
for a wide range of data settings. Throughout the paper, our results require
only that the underlying data is sampled from a low-dimensional manifold, and
depend crucially on the intrinsic dimension of this manifold, rather than its
ambient dimension.
- Abstract(参考訳): pwspds(power-weighted shortest-path distances)の新しい幾何学的および計算的解析を行った。
これらの指標が基礎となるデータにおける密度と幾何のバランスをとる方法を明らかにすることで、それらの重要なパラメータを明確にし、実際にどのように選択されるかについて議論する。
カーネルベースの教師なしおよび半教師付き機械学習における密度の広範な役割を示す、関連するデータ駆動メトリクスと比較する。
計算学的には、完全重み付きグラフ上のPWSPDと、重み付き隣接グラフ上の類似点を関連付け、ほぼ最適である同値性に対する高い確率保証を提供する。
パーコレーション理論との結びつきは、有限標本設定におけるPWSPDのバイアスと分散を推定するために展開される。
理論的結果は、幅広いデータ設定に対するPWSPDの汎用性を実証する実証実験によって裏付けられている。
論文全体では、基礎となるデータは低次元多様体からサンプリングされ、その周囲の次元ではなく、この多様体の固有次元に決定的に依存することが求められている。
関連論文リスト
- A Class of Topological Pseudodistances for Fast Comparison of
Persistence Diagrams [0.3968603035422276]
拡張トポロジカル擬似距離(ETD)という擬似距離のクラスを導入する。
ETDはチューナブルな複雑さを持ち、スライク距離と古典的なワッサーシュタイン距離を高複素度極大で近似することができる。
ETDがPSよりも精度が高く、計算複雑性の点でワッサースタインとスライスされたワッサースタイン距離より優れていることを実験的に検証した。
論文 参考訳(メタデータ) (2024-02-22T12:27:35Z) - Minimizing robust density power-based divergences for general parametric
density models [3.0277213703725767]
一般パラメトリック密度に対する密度パワー分散(DPD)を最小化する手法を提案する。
提案手法は、他の密度電力ベースの$gamma$-divergencesを最小化するためにも利用できる。
論文 参考訳(メタデータ) (2023-07-11T13:33:47Z) - Proximal Symmetric Non-negative Latent Factor Analysis: A Novel Approach
to Highly-Accurate Representation of Undirected Weighted Networks [2.1797442801107056]
Undirected Weighted Network (UWN) は、ビッグデータ関連のアプリケーションで一般的に見られる。
既存のモデルは本質対称性や低データ密度のモデル化に失敗する。
近軸対称非負の潜在因子分析モデルを提案する。
論文 参考訳(メタデータ) (2023-06-06T13:03:24Z) - Solving High-Dimensional PDEs with Latent Spectral Models [74.1011309005488]
我々は,高次元PDEの効率的かつ高精度な解法に向けて,Latent Spectral Models (LSM) を提案する。
数値解析において古典スペクトル法に着想を得て,潜時空間におけるPDEを解くために,ニューラルスペクトルブロックを設計する。
LSMは、一貫した最先端を実現し、7つのベンチマークで平均11.5%の相対的な利益を得る。
論文 参考訳(メタデータ) (2023-01-30T04:58:40Z) - Data-heterogeneity-aware Mixing for Decentralized Learning [63.83913592085953]
グラフの混合重みとノード間のデータ不均一性の関係に収束の依存性を特徴付ける。
グラフが現在の勾配を混合する能力を定量化する計量法を提案する。
そこで本研究では,パラメータを周期的かつ効率的に最適化する手法を提案する。
論文 参考訳(メタデータ) (2022-04-13T15:54:35Z) - Eikonal depth: an optimal control approach to statistical depths [0.7614628596146599]
本稿では,制御理論と固有方程式に基づく,グローバルに定義された新しいタイプの統計深度を提案する。
この深さは解釈や計算が容易で、マルチモーダルな振る舞いを表現的に捉え、非ユークリッド的なデータに自然に拡張する。
論文 参考訳(メタデータ) (2022-01-14T01:57:48Z) - Post-mortem on a deep learning contest: a Simpson's paradox and the
complementary roles of scale metrics versus shape metrics [61.49826776409194]
我々は、ニューラルネットワーク(NN)モデルの一般化精度を予測するために、コンテストで公に利用可能にされたモデルのコーパスを分析する。
メトリクスが全体としてよく機能するが、データのサブパーティションではあまり機能しない。
本稿では,データに依存しない2つの新しい形状指標と,一連のNNのテスト精度の傾向を予測できるデータ依存指標を提案する。
論文 参考訳(メタデータ) (2021-06-01T19:19:49Z) - Estimation and Quantization of Expected Persistence Diagrams [0.0]
本稿では,2つの要約,EPD(Persistence Diagram)とその量子化について検討する。
EPDはR2でサポートされる測定値です。
この推定器は、パラメトリック収束率を持つ大クラスのモデルのミニマックスの観点から最適であることを示す。
論文 参考訳(メタデータ) (2021-05-11T08:12:18Z) - GELATO: Geometrically Enriched Latent Model for Offline Reinforcement
Learning [54.291331971813364]
オフライン強化学習アプローチは、近近法と不確実性認識法に分けられる。
本研究では,この2つを潜在変動モデルに組み合わせることのメリットを実証する。
提案したメトリクスは、分布サンプルのアウトの品質と、データ内のサンプルの不一致の両方を測定します。
論文 参考訳(メタデータ) (2021-02-22T19:42:40Z) - Effective Data-aware Covariance Estimator from Compressed Data [63.16042585506435]
本研究では,データ対応重み付きサンプリングベース共分散行列推定器,すなわち DACE を提案し,非バイアス共分散行列推定を行う。
我々は、DACEの優れた性能を示すために、合成データセットと実世界のデータセットの両方で広範な実験を行う。
論文 参考訳(メタデータ) (2020-10-10T10:10:28Z) - On Projection Robust Optimal Transport: Sample Complexity and Model
Misspecification [101.0377583883137]
射影ロバスト(PR)OTは、2つの測度の間のOTコストを最大化するために、射影可能な$k$次元部分空間を選択する。
私たちの最初の貢献は、PRワッサーシュタイン距離のいくつかの基本的な統計的性質を確立することである。
次に、部分空間を最適化するのではなく平均化することにより、PRW距離の代替として積分PRワッサーシュタイン距離(IPRW)を提案する。
論文 参考訳(メタデータ) (2020-06-22T14:35:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。