論文の概要: ABID: Angle Based Intrinsic Dimensionality
- arxiv url: http://arxiv.org/abs/2006.12880v1
- Date: Tue, 23 Jun 2020 10:19:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 21:57:43.848365
- Title: ABID: Angle Based Intrinsic Dimensionality
- Title(参考訳): ABID:角度に基づく固有次元
- Authors: Erik Thordsen and Erich Schubert
- Abstract要約: 内在的な次元性は、データ表現の次元性とは対照的に、データの真の次元性を指す。
局所固有次元を推定するための最も一般的な方法は距離に基づく。
角度の理論的分布を導出し、これを用いて固有次元の推定器を構築する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The intrinsic dimensionality refers to the ``true'' dimensionality of the
data, as opposed to the dimensionality of the data representation. For example,
when attributes are highly correlated, the intrinsic dimensionality can be much
lower than the number of variables. Local intrinsic dimensionality refers to
the observation that this property can vary for different parts of the data
set; and intrinsic dimensionality can serve as a proxy for the local difficulty
of the data set.
Most popular methods for estimating the local intrinsic dimensionality are
based on distances, and the rate at which the distances to the nearest
neighbors increase, a concept known as ``expansion dimension''. In this paper
we introduce an orthogonal concept, which does not use any distances: we use
the distribution of angles between neighbor points. We derive the theoretical
distribution of angles and use this to construct an estimator for intrinsic
dimensionality.
Experimentally, we verify that this measure behaves similarly, but
complementarily, to existing measures of intrinsic dimensionality. By
introducing a new idea of intrinsic dimensionality to the research community,
we hope to contribute to a better understanding of intrinsic dimensionality and
to spur new research in this direction.
- Abstract(参考訳): 内在的な次元性は、データ表現の次元性とは対照的に、データの「真」次元性を指す。
例えば、属性が高度に相関している場合、本質的な次元性は変数の数よりもはるかに低い。
局所内在的次元性は、この性質がデータセットの異なる部分に対して異なることを示し、内在的次元性はデータセットの局所的困難のプロキシとして機能する。
局所的な内在次元を推定するための最も一般的な方法は距離と最寄りの近傍との距離が増加する速度、すなわち「膨張次元」と呼ばれる概念に基づいている。
本稿では,近接点間の角度分布を用いて,距離を一切使用しない直交概念を提案する。
角度の理論的分布を導出し、これを用いて固有次元の推定器を構築する。
実験により,本尺度が既存の本質的次元尺度と相補的に同じように振る舞うことを検証した。
我々は,本質的次元の新たな考え方を研究コミュニティに導入することにより,本質的次元の理解を深め,新たな研究の推進を期待する。
関連論文リスト
- OPDR: Order-Preserving Dimension Reduction for Semantic Embedding of Multimodal Scientific Data [0.888375168590583]
マルチモーダルな科学データ管理における最も一般的な操作の1つは、$k$の類似アイテムを探すことである。
結果として得られる埋め込みベクトルの次元は、通常数百から数千のオーダーであり、時間に敏感な科学的応用には不可分に高い。
この研究は、出力埋め込みベクトルの次元性を減らし、トップ=k$近辺の集合が低次元空間において変化しないようにすることを提案する。
論文 参考訳(メタデータ) (2024-08-15T22:30:44Z) - What is the $\textit{intrinsic}$ dimension of your binary data? -- and how to compute it quickly [0.0]
2006年のICDMの論文Tattiらは、正規化相関次元を導入してバイナリデータテーブルの(解釈可能な)次元に関する質問に答えた。
本研究では, それらの結果を再考し, 幾何学的データセットに最近導入された本質的次元の概念と対比する。
本稿では,特定のサポート値のみの計算概念に基づく新しいIDを提案する。
論文 参考訳(メタデータ) (2024-04-09T14:04:26Z) - Relative intrinsic dimensionality is intrinsic to learning [49.5738281105287]
本稿では,データ分布の固有次元の概念を導入し,データの分離性特性を正確に把握する。
この本質的な次元に対して、上の親指の規則は法則となり、高本質的な次元は高度に分離可能なデータを保証する。
本稿では,2進分類問題における学習と一般化の確率について,上界と下界の両方に相対固有次元を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T10:41:45Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Intrinsic Dimension Estimation [92.87600241234344]
内在次元の新しい推定器を導入し, 有限標本, 非漸近保証を提供する。
次に、本手法を適用して、データ固有の次元に依存するGAN(Generative Adversarial Networks)に対する新しいサンプル複雑性境界を求める。
論文 参考訳(メタデータ) (2021-06-08T00:05:39Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - Manifold Learning via Manifold Deflation [105.7418091051558]
次元削減法は、高次元データの可視化と解釈に有用な手段を提供する。
多くの一般的な手法は単純な2次元のマニフォールドでも劇的に失敗する。
本稿では,グローバルな構造を座標として組み込んだ,新しいインクリメンタルな空間推定器の埋め込み手法を提案する。
実験により,本アルゴリズムは実世界および合成データセットに新規で興味深い埋め込みを復元することを示した。
論文 参考訳(メタデータ) (2020-07-07T10:04:28Z) - A Topological Approach to Inferring the Intrinsic Dimension of Convex
Sensing Data [0.0]
本稿では,アフィン空間の未知の部分集合を未知の準フィルタ関数によって測定する,共通の測定パラダイムを考える。
本論文では,自然仮定の下でデータの次元を推定する手法を開発する。
論文 参考訳(メタデータ) (2020-07-07T05:35:23Z) - Geometry of Similarity Comparisons [51.552779977889045]
空間形式の順序容量は、その次元と曲率の符号に関係していることを示す。
さらに重要なことは、類似性グラフ上で定義された順序拡散確率変数の統計的挙動が、その基礎となる空間形式を特定するのに利用できることである。
論文 参考訳(メタデータ) (2020-06-17T13:37:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。