論文の概要: Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation
- arxiv url: http://arxiv.org/abs/2107.03903v1
- Date: Thu, 8 Jul 2021 15:35:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-09 13:46:18.910773
- Title: Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation
- Title(参考訳): データ解析におけるマニフォールド仮説:二重幾何学的確率論的手法によるマニフォールド次元推定
- Authors: Alexander Ivanov, Gleb Nosovskiy, Alexey Chekunov, Denis Fedoseev,
Vladislav Kibkalo, Mikhail Nikulin, Fedor Popelenskiy, Stepan Komkov, Ivan
Mazurenko, Aleksandr Petiushko
- Abstract要約: 本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
- 参考スコア(独自算出の注目度): 92.81218653234669
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manifold hypothesis states that data points in high-dimensional space
actually lie in close vicinity of a manifold of much lower dimension. In many
cases this hypothesis was empirically verified and used to enhance unsupervised
and semi-supervised learning. Here we present new approach to manifold
hypothesis checking and underlying manifold dimension estimation. In order to
do it we use two very different methods simultaneously - one geometric, another
probabilistic - and check whether they give the same result. Our geometrical
method is a modification for sparse data of a well-known box-counting algorithm
for Minkowski dimension calculation. The probabilistic method is new. Although
it exploits standard nearest neighborhood distance, it is different from
methods which were previously used in such situations. This method is robust,
fast and includes special preliminary data transformation. Experiments on real
datasets show that the suggested approach based on two methods combination is
powerful and effective.
- Abstract(参考訳): 多様体仮説では、高次元空間のデータポイントは実際には、より低い次元の多様体の近くに存在する。
多くの場合、この仮説は実証的に検証され、教師なし学習と半教師なし学習の強化に使われる。
ここでは、多様体仮説チェックと基礎となる多様体次元推定に対する新しいアプローチを提案する。
1つの幾何学的手法ともう1つの確率論的手法を同時に使い、それらが同じ結果を与えるかどうかを確認します。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
確率的手法は新しい。
近距離を標準としているが、このような状況で使用されていた方法とは異なる。
この手法は堅牢で高速で、特別な予備データ変換を含む。
実データセットに関する実験では、2つの手法の組み合わせに基づく提案手法が強力かつ効果的であることが示されている。
関連論文リスト
- Estimation of multiple mean vectors in high dimension [4.2466572124753]
我々は,独立標本に基づいて,共通空間上の様々な確率分布の多次元的手段を推定する。
我々のアプローチは、これらのサンプルから得られた経験的手段の凸結合による推定器の形成である。
論文 参考訳(メタデータ) (2024-03-22T08:42:41Z) - Implicit Manifold Gaussian Process Regression [49.0787777751317]
ガウス過程の回帰は、よく校正された不確実性推定を提供するために広く用いられている。
これは、データが実際に存在する暗黙の低次元多様体のため、高次元データに苦しむ。
本稿では,データ(ラベル付きおよびラベルなし)から直接暗黙構造を完全に微分可能な方法で推定できる手法を提案する。
論文 参考訳(メタデータ) (2023-10-30T09:52:48Z) - Bayesian Hyperbolic Multidimensional Scaling [2.5944208050492183]
低次元多様体が双曲型であるとき、多次元スケーリングに対するベイズ的アプローチを提案する。
ケース制御可能性近似は、より大きなデータ設定における後部分布からの効率的なサンプリングを可能にする。
提案手法は,シミュレーション,標準基準データセット,インディアン村のネットワークデータ,およびヒトの遺伝子発現データを用いて,最先端の代替手法に対して評価する。
論文 参考訳(メタデータ) (2022-10-26T23:34:30Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - New Methods for Detecting Concentric Objects With High Accuracy [0.0]
デジタルデータに幾何学的オブジェクトを適合させることは、虹彩検出、自律ナビゲーション、産業ロボット操作など、多くの分野において重要な問題である。
データに幾何学的形状を合わせるには、幾何学的(定形)アプローチと代数的(非定形)アプローチの2つの一般的なアプローチがある。
他の反復的手法の信頼性の高い初期推定として使用できる新しい推定器を開発した。
論文 参考訳(メタデータ) (2021-02-16T08:19:18Z) - Normal-bundle Bootstrap [2.741266294612776]
本稿では,与えられたデータセットの幾何学的構造を保持する新しいデータを生成する手法を提案する。
微分幾何学における多様体学習と概念のアルゴリズムにインスパイアされた本手法は,基礎となる確率測度を余分化測度に分解する。
本手法は, 密度リッジおよび関連統計量の推定に応用し, オーバーフィッティングを低減するためにデータ拡張を行う。
論文 参考訳(メタデータ) (2020-07-27T21:14:19Z) - Random extrapolation for primal-dual coordinate descent [61.55967255151027]
本稿では,データ行列の疎度と目的関数の好適な構造に適応する,ランダムに外挿した原始-双対座標降下法を提案する。
一般凸凹の場合, 主対差と目的値に対するシーケンスのほぼ確実に収束と最適サブ線形収束率を示す。
論文 参考訳(メタデータ) (2020-07-13T17:39:35Z) - Manifold Learning via Manifold Deflation [105.7418091051558]
次元削減法は、高次元データの可視化と解釈に有用な手段を提供する。
多くの一般的な手法は単純な2次元のマニフォールドでも劇的に失敗する。
本稿では,グローバルな構造を座標として組み込んだ,新しいインクリメンタルな空間推定器の埋め込み手法を提案する。
実験により,本アルゴリズムは実世界および合成データセットに新規で興味深い埋め込みを復元することを示した。
論文 参考訳(メタデータ) (2020-07-07T10:04:28Z) - Statistical Outlier Identification in Multi-robot Visual SLAM using
Expectation Maximization [18.259478519717426]
本稿では、同時局所化およびマッピング(SLAM)におけるマップ間ループ閉包外乱検出のための、新しい分散手法を提案する。
提案アルゴリズムは優れた初期化に頼らず、一度に2つ以上のマップを処理できる。
論文 参考訳(メタデータ) (2020-02-07T06:34:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。