論文の概要: Manifold-adaptive dimension estimation revisited
- arxiv url: http://arxiv.org/abs/2008.03221v2
- Date: Mon, 10 Aug 2020 10:04:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 01:01:51.797432
- Title: Manifold-adaptive dimension estimation revisited
- Title(参考訳): マニフォールド適応次元推定の再検討
- Authors: Zsigmond Benk\H{o}, Marcell Stippinger, Roberta Rehus, Attila Bencze,
D\'aniel Fab\'o, Bogl\'arka Hajnal, Lor\'and Er\H{o}ss, Andr\'as Telcs,
Zolt\'an Somogyv\'ari
- Abstract要約: 多様体適応型ファラマンド-ゼーペスヴァリ-アウディベルト次元推定器を再検討し改善する。
局所的なFSA推定値の確率密度関数を計算する。
大域的内在次元の最大公算式を導出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Data dimensionality informs us about data complexity and sets limit on the
structure of successful signal processing pipelines. In this work we revisit
and improve the manifold-adaptive Farahmand-Szepesv\'ari-Audibert (FSA)
dimension estimator, making it one of the best nearest neighbor-based dimension
estimators available. We compute the probability density function of local FSA
estimates, if the local manifold density is uniform. Based on the probability
density function, we propose to use the median of local estimates as a basic
global measure of intrinsic dimensionality, and we demonstrate the advantages
of this asymptotically unbiased estimator over the previously proposed
statistics: the mode and the mean. Additionally, from the probability density
function, we derive the maximum likelihood formula for global intrinsic
dimensionality, if i.i.d. holds. We tackle edge and finite-sample effects with
an exponential correction formula, calibrated on hypercube datasets. We compare
the performance of the corrected-median-FSA estimator with kNN estimators:
maximum likelihood (ML, Levina-Bickel) and two implementations of DANCo (R and
matlab). We show that corrected-median-FSA estimator beats the ML estimator and
it is on equal footing with DANCo for standard synthetic benchmarks according
to mean percentage error and error rate metrics. With the median-FSA algorithm,
we reveal diverse changes in the neural dynamics while resting state and during
epileptic seizures. We identify brain areas with lower-dimensional dynamics
that are possible causal sources and candidates for being seizure onset zones.
- Abstract(参考訳): データ次元は、データ複雑さと、成功した信号処理パイプラインの構造に制限を課す。
本研究では,多様体適応型ファラマンド・セペスv\'ari-audibert(fsa)次元推定器の再検討と改良を行い,最も近い近傍次元推定器の1つである。
局所多様体密度が一様であれば、局所FSA推定の確率密度関数を計算する。
確率密度関数に基づいて,局所推定の中央値を本質的次元の基本的な大域的尺度として用いることを提案し,この漸近的に偏りのない推定器の利点を示す。
さらに、確率密度関数から、i.d. が成り立つとき、大域的内在次元の最大極大式を導出する。
超キューブデータセット上で校正された指数補正式を用いてエッジおよび有限サンプル効果に取り組む。
修正中規模FSA推定器の性能をkNN推定器と比較する: 最大可能性 (ML, Levina-Bickel) と DANCo (R, matlab) の2つの実装。
補正中間値推定器がML推定器を上回り、平均誤差と誤差率の測定値に応じて標準合成ベンチマークのDANCoと等速であることを示す。
中央値FSAアルゴリズムでは、静止状態およびてんかん発作中における神経動態の変化を明らかにした。
原因となる可能性のある低次元のダイナミックスを持つ脳領域と発作発症部位の候補を同定する。
関連論文リスト
- Bayesian Estimation and Tuning-Free Rank Detection for Probability Mass Function Tensors [17.640500920466984]
本稿では,関節のPMFを推定し,そのランクを観測データから自動的に推定する新しい枠組みを提案する。
我々は、様々なモデルパラメータの後方分布を近似するために、変分推論(VI)に基づく決定論的解を導出し、さらに、変分推論(SVI)を利用して、VVIベースのアプローチのスケーラブルバージョンを開発する。
合成データと実映画レコメンデーションデータの両方を含む実験は、推定精度、自動ランク検出、計算効率の点で、VVIおよびSVIベースの手法の利点を示している。
論文 参考訳(メタデータ) (2024-10-08T20:07:49Z) - A Specialized Semismooth Newton Method for Kernel-Based Optimal
Transport [92.96250725599958]
カーネルベース最適輸送(OT)推定器は、サンプルからOT問題に対処するための代替的機能的推定手順を提供する。
SSN法は, 標準正規性条件下でのグローバル収束率$O (1/sqrtk)$, 局所二次収束率を達成できることを示す。
論文 参考訳(メタデータ) (2023-10-21T18:48:45Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Beyond EM Algorithm on Over-specified Two-Component Location-Scale
Gaussian Mixtures [29.26015093627193]
負の対数様関数の曲率を効率的に探索するために,指数位置更新法(ELU)アルゴリズムを開発した。
ELUアルゴリズムは、対数的な反復数の後、モデルの最終的な統計的半径に収束することを示した。
論文 参考訳(メタデータ) (2022-05-23T06:49:55Z) - Efficient CDF Approximations for Normalizing Flows [64.60846767084877]
正規化フローの微分同相性に基づいて、閉領域上の累積分布関数(CDF)を推定する。
一般的なフローアーキテクチャとUCIデータセットに関する実験は,従来の推定器と比較して,サンプル効率が著しく向上したことを示している。
論文 参考訳(メタデータ) (2022-02-23T06:11:49Z) - Fast Batch Nuclear-norm Maximization and Minimization for Robust Domain
Adaptation [154.2195491708548]
ランダムに選択されたデータバッチの分類出力行列の構造について検討し,予測可能性と多様性について検討した。
本稿では,目標出力行列上で核ノルムを行い,目標予測能力を向上するBatch Nuclear-norm Maximization and Minimizationを提案する。
実験により,本手法は3つの典型的なドメイン適応シナリオにおいて適応精度とロバスト性を高めることができることが示された。
論文 参考訳(メタデータ) (2021-07-13T15:08:32Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Data-driven prediction of multistable systems from sparse measurements [0.0]
我々は,半教師付き分類に基づくデータ駆動方式を開発し,マルチスタブルシステムの状態を予測する。
本稿では,事前計算したデータから直接メトリクスを学習するSPML(spursity-promoting metric-learning)の最適化を提案する。
本稿では,2つのマルチスタブルシステムに対する本手法の適用例を示す。
論文 参考訳(メタデータ) (2020-10-28T02:23:05Z) - Optimal Distributed Subsampling for Maximum Quasi-Likelihood Estimators
with Massive Data [20.79270369203348]
既存の手法は主に高い計算効率のために置換されたサブサンプリングに焦点を当てている。
まず,準類似度推定の文脈で最適なサブサンプリング確率を導出する。
我々は,分散サブサンプリングフレームワークを開発し,全データの小さなパーティションで統計を同時に計算する。
論文 参考訳(メタデータ) (2020-05-21T02:46:56Z) - Statistical Inference for Model Parameters in Stochastic Gradient
Descent [45.29532403359099]
勾配降下係数(SGD)は,その計算効率とメモリ効率から,大規模データの統計的推定に広く用いられている。
人口減少関数が強い凸であり,一定の条件を満たす場合,SGDに基づく真のモデルパラメータの統計的推測の問題について検討する。
論文 参考訳(メタデータ) (2016-10-27T07:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。