論文の概要: LIDL: Local Intrinsic Dimension Estimation Using Approximate Likelihood
- arxiv url: http://arxiv.org/abs/2206.14882v1
- Date: Wed, 29 Jun 2022 19:47:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-02 08:31:39.148300
- Title: LIDL: Local Intrinsic Dimension Estimation Using Approximate Likelihood
- Title(参考訳): LIDL:近似類似度を用いた局所固有次元推定
- Authors: Piotr Tempczyk, Rafa{\l} Michaluk,{\L}ukasz Garncarek, Przemys{\l}aw
Spurek, Jacek Tabor, Adam Goli\'nski
- Abstract要約: この問題に対する新しいアプローチを提案する: 近似的類似度(LIDL)を用いた局所固有次元推定
本手法は, 任意の密度推定法をサブルーチンとして用い, 次元の挑戦をサイドステップしようと試みる。
LIDLは,この問題の標準ベンチマークで競合する結果を得るとともに,数千次元まで拡張可能であることを示す。
- 参考スコア(独自算出の注目度): 10.35315334180936
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most of the existing methods for estimating the local intrinsic dimension of
a data distribution do not scale well to high-dimensional data. Many of them
rely on a non-parametric nearest neighbors approach which suffers from the
curse of dimensionality. We attempt to address that challenge by proposing a
novel approach to the problem: Local Intrinsic Dimension estimation using
approximate Likelihood (LIDL). Our method relies on an arbitrary density
estimation method as its subroutine and hence tries to sidestep the
dimensionality challenge by making use of the recent progress in parametric
neural methods for likelihood estimation. We carefully investigate the
empirical properties of the proposed method, compare them with our theoretical
predictions, and show that LIDL yields competitive results on the standard
benchmarks for this problem and that it scales to thousands of dimensions. What
is more, we anticipate this approach to improve further with the continuing
advances in the density estimation literature.
- Abstract(参考訳): データ分布の局所固有次元を推定する既存の手法のほとんどは、高次元データに対してうまくスケールしない。
それらの多くは、次元の呪いに苦しむ非パラメトリックな隣人アプローチに依存している。
そこで我々は,この課題に対して,局所固有次元推定を近似的類似度(LIDL)を用いて提案する手法を提案する。
提案手法は, 任意の密度推定法をサブルーチンとして用い, 近年のパラメトリック・ニューラル・メソッドの進歩を応用して, 次元的課題を回避しようとするものである。
提案手法の実証的特性を慎重に検討し,提案手法と理論的予測との比較を行い,LIDLが標準ベンチマークで競合する結果を得ることを示すとともに,数千次元まで拡張可能であることを示す。
さらに, この手法は, 密度推定文献の継続的な進歩とともに, さらなる発展を期待する。
関連論文リスト
- Data value estimation on private gradients [84.966853523107]
勾配に基づく機械学習(ML)法では、デファクト微分プライバシー技術がランダムノイズで勾配を乱している。
データバリュエーションは、トレーニングデータにMLのパフォーマンスを特性付け、DPの強制を必要とするプライバシーに配慮したアプリケーションで広く使用されている。
我々は,データ値推定の不確かさをパラドックス的に線形に評価し,評価予算を増大させるため,勾配に不規則な雑音を注入するというデフォルトのアプローチを伴わないことを示す。
提案手法は, 予測の不確実性の線形化を確実に除去するために, 慎重に相関ノイズを注入することである。
論文 参考訳(メタデータ) (2024-12-22T13:15:51Z) - Learning Distances from Data with Normalizing Flows and Score Matching [9.605001452209867]
密度に基づく距離は、メートル法学習の問題に対するエレガントな解決策を提供する。
我々は,フェルマー距離を推定する既存の手法が,低次元と高次元の両方において収束不良に悩まされていることを示す。
我々の研究は、特に高次元空間における密度に基づく距離の実践的利用の道を開いた。
論文 参考訳(メタデータ) (2024-07-12T14:30:41Z) - A Wiener Process Perspective on Local Intrinsic Dimension Estimation Methods [1.6988007266875604]
近年,深層ニューラルネットワークと生成モデリングの進歩により,局所内在性(LID)推定法が注目されている。
本稿では、Wiener プロセスの観点から、最近の最先端パラメトリック LID 推定手法について検討する。
論文 参考訳(メタデータ) (2024-06-24T20:27:13Z) - A Finite-Horizon Approach to Active Level Set Estimation [0.7366405857677227]
レベルセット推定(LSE)における空間サンプリングの文脈におけるアクティブラーニングの問題点について考察する。
1次元でLSEを行うための有限水平探索法を提案するが、最終的な推定誤差と一定数のサンプルの移動距離のバランスは最適である。
結果の最適化問題をクローズドな方法で解き、その結果のポリシーが既存のアプローチを一般化することを示す。
論文 参考訳(メタデータ) (2023-10-18T14:11:41Z) - Estimating Divergences in High Dimensions [6.172809837529207]
本研究では,高次元データにおける分散度推定のための分解可能なモデルを提案する。
これにより、高次元分布の推定密度を低次元関数の積に分解することができる。
最大極大推定器から分解可能なモデルを用いてクルバック・リーブラーの発散を推定すると,既存の発散推定法よりも優れることを示す。
論文 参考訳(メタデータ) (2021-12-08T20:37:28Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - Continuous Wasserstein-2 Barycenter Estimation without Minimax
Optimization [94.18714844247766]
ワッサーシュタイン・バリセンターは、最適輸送に基づく確率測度の重み付き平均の幾何学的概念を提供する。
本稿では,Wasserstein-2 バリセンタのサンプルアクセスを演算するスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-02T21:01:13Z) - Amortized Conditional Normalized Maximum Likelihood: Reliable Out of
Distribution Uncertainty Estimation [99.92568326314667]
本研究では,不確実性推定のための拡張性のある汎用的アプローチとして,償却条件正規化最大値(ACNML)法を提案する。
提案アルゴリズムは条件付き正規化最大度(CNML)符号化方式に基づいており、最小記述長の原理に従って最小値の最適特性を持つ。
我々は、ACNMLが、分布外入力のキャリブレーションの観点から、不確実性推定のための多くの手法と好意的に比較することを示した。
論文 参考訳(メタデータ) (2020-11-05T08:04:34Z) - Estimating Barycenters of Measures in High Dimensions [30.563217903502807]
本研究では,高次元の測度のバリセンタを推定するためのスケーラブルで汎用的なアルゴリズムを提案する。
差分性に関する軽微な仮定の下で局所収束を証明し、そのアプローチが十分に提案されていることを示す。
私たちのアプローチは、数千次元のバリセンタを推定するために使われる最初のものです。
論文 参考訳(メタデータ) (2020-07-14T15:24:41Z) - Variable Skipping for Autoregressive Range Density Estimation [84.60428050170687]
深部自己回帰モデルを用いた距離密度推定を高速化する手法である可変スキップについて述べる。
可変スキップは、10-100$timesの効率向上をもたらすことを示す。
論文 参考訳(メタデータ) (2020-07-10T19:01:40Z) - $\gamma$-ABC: Outlier-Robust Approximate Bayesian Computation Based on a
Robust Divergence Estimator [95.71091446753414]
最寄りの$gamma$-divergence推定器をデータ差分尺度として用いることを提案する。
本手法は既存の不一致対策よりも高いロバスト性を実現する。
論文 参考訳(メタデータ) (2020-06-13T06:09:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。