論文の概要: A Universal Nearest-Neighbor Estimator for Intrinsic Dimensionality
- arxiv url: http://arxiv.org/abs/2603.10493v1
- Date: Wed, 11 Mar 2026 07:40:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-12 16:22:32.831513
- Title: A Universal Nearest-Neighbor Estimator for Intrinsic Dimensionality
- Title(参考訳): 固有次元の普遍的最近傍推定器
- Authors: Eng-Jon Ong, Omer Bobrowski, Gesine Reinert, Primoz Skraba,
- Abstract要約: データの内在的次元性(ID)を推定することは、機械学習とコンピュータビジョンの基本的な問題である。
本稿では, 簡単な計算を伴い, 最先端の計算結果を得る, 最寄り距離比に基づく新しいID推定器を提案する。
- 参考スコア(独自算出の注目度): 5.803951735793419
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Estimating the intrinsic dimensionality (ID) of data is a fundamental problem in machine learning and computer vision, providing insight into the true degrees of freedom underlying high-dimensional observations. Existing methods often rely on geometric or distributional assumptions and can significantly fail when these assumptions are violated. In this paper, we introduce a novel ID estimator based on nearest-neighbor distance ratios that involves simple calculations and achieves state-of-the-art results. Most importantly, we provide a theoretical analysis proving that our estimator is \emph{universal}, namely, it converges to the true ID independently of the distribution generating the data. We present experimental results on benchmark manifolds and real-world datasets to demonstrate the performance of our estimator.
- Abstract(参考訳): データの本質的な次元性(ID)を推定することは、機械学習とコンピュータビジョンの基本的な問題であり、高次元観測の基礎となる真の自由度についての洞察を提供する。
既存の方法はしばしば幾何学的あるいは分布的な仮定に依存しており、これらの仮定が破られたときに著しく失敗することがある。
本稿では, 簡単な計算を伴い, 最先端の計算結果を得る, 最寄り距離比に基づく新しいID推定器を提案する。
最も重要なことは、我々の推定器が \emph{universal} であること、すなわち、データを生成する分布とは無関係に真のIDに収束することを証明する理論的解析を提供することである。
本研究では,評価器の性能を示すために,ベンチマーク多様体と実世界のデータセットを用いた実験結果を示す。
関連論文リスト
- Manifold Dimension Estimation: An Empirical Study [0.0]
多様体仮説は、高次元データがしばしば低次元多様体の上または近くにあることを示唆している。
この多様体の次元を推定することは、その構造を利用するのに不可欠である。
この記事では、研究者と実践者の両方に包括的な調査を提供する。
論文 参考訳(メタデータ) (2025-09-19T01:48:58Z) - A Survey of Dimension Estimation Methods [0.0]
データの実際の次元を理解することは重要である。
本調査では, 様々な次元推定手法を概観し, 利用した幾何学的情報を用いて分類する。
本研究は, 曲率, 騒音に対する各種応答の検討とともに, これらの手法の性能評価を行う。
論文 参考訳(メタデータ) (2025-07-18T13:05:42Z) - Graph-based Complexity for Causal Effect by Empirical Plug-in [56.14597641617531]
本稿では、因果効果クエリに対する経験的プラグイン推定の計算複雑性に焦点を当てる。
計算は、推定値のハイパーグラフに依存するため、データサイズにおいて、潜在的に線形な時間で効率的に行うことができることを示す。
論文 参考訳(メタデータ) (2024-11-15T07:42:01Z) - (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Intrinsic Dimensionality Estimation within Tight Localities: A
Theoretical and Experimental Analysis [0.0]
そこで本研究では,20個のサンプル点からなるタイトな局所性に対しても安定な局所ID推定手法を提案する。
実験結果から,提案手法の偏差は比較的小さいが, 偏差は比較的小さく, 試料径は最先端の推定値よりもはるかに小さいことがわかった。
論文 参考訳(メタデータ) (2022-09-29T00:00:11Z) - Intrinsic Dimension Estimation [92.87600241234344]
内在次元の新しい推定器を導入し, 有限標本, 非漸近保証を提供する。
次に、本手法を適用して、データ固有の次元に依存するGAN(Generative Adversarial Networks)に対する新しいサンプル複雑性境界を求める。
論文 参考訳(メタデータ) (2021-06-08T00:05:39Z) - OR-Net: Pointwise Relational Inference for Data Completion under Partial
Observation [51.083573770706636]
この作業はリレーショナル推論を使って不完全なデータを埋めます。
本稿では,2つの点での相対性理論をモデル化するために,全関係ネットワーク (or-net) を提案する。
論文 参考訳(メタデータ) (2021-05-02T06:05:54Z) - High-Dimensional Multi-Task Averaging and Application to Kernel Mean
Embedding [0.0]
マルチタスク平均化問題に対する改善された推定器を提案する。
我々は、この手法が平均二乗誤差の低減をもたらすことを理論的に証明する。
このアプローチの応用は、複数のカーネルの平均埋め込みの推定である。
論文 参考訳(メタデータ) (2020-11-13T07:31:30Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z) - Distribution Approximation and Statistical Estimation Guarantees of
Generative Adversarial Networks [82.61546580149427]
GAN(Generative Adversarial Networks)は教師なし学習において大きな成功を収めている。
本稿では,H'older空間における密度データ分布推定のためのGANの近似と統計的保証を提供する。
論文 参考訳(メタデータ) (2020-02-10T16:47:57Z) - Finite sample properties of parametric MMD estimation: robustness to misspecification and dependence [7.011897575776511]
推定器は、データセットの依存と外れ値の存在の両方に頑健であることを示す。
推定器の計算に用いる勾配降下アルゴリズムについて理論的研究を行う。
論文 参考訳(メタデータ) (2019-12-12T02:28:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。