論文の概要: Local intrinsic dimensionality estimators based on concentration of
measure
- arxiv url: http://arxiv.org/abs/2001.11739v3
- Date: Sun, 19 Apr 2020 10:54:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-05 05:53:12.442547
- Title: Local intrinsic dimensionality estimators based on concentration of
measure
- Title(参考訳): 測度の集中度に基づく局所内在次元推定器
- Authors: Jonathan Bac, Andrei Zinovyev
- Abstract要約: 固有次元性(ID)は多次元データポイント雲の最も基本的な特徴の1つである。
多次元データポイント雲の線形分離性に基づくIDの新しい局所推定手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intrinsic dimensionality (ID) is one of the most fundamental characteristics
of multi-dimensional data point clouds. Knowing ID is crucial to choose the
appropriate machine learning approach as well as to understand its behavior and
validate it. ID can be computed globally for the whole data point distribution,
or computed locally in different regions of the data space. In this paper, we
introduce new local estimators of ID based on linear separability of
multi-dimensional data point clouds, which is one of the manifestations of
concentration of measure. We empirically study the properties of these
estimators and compare them with other recently introduced ID estimators
exploiting various effects of measure concentration. Observed differences
between estimators can be used to anticipate their behaviour in practical
applications.
- Abstract(参考訳): 固有次元性(ID)は多次元データポイント雲の最も基本的な特徴の1つである。
IDを知ることは、適切な機械学習アプローチを選択し、その振る舞いを理解し、それを検証することが重要である。
IDは、データポイント全体の分布をグローバルに計算したり、データ空間の異なる領域でローカルに計算することができる。
本稿では,測度集中の現れの一つである多次元データポイント雲の線形分離性に基づくidの局所的推定器を提案する。
我々はこれらの推定器の特性を実証的に研究し、測定濃度の様々な効果を生かした他のID推定器と比較した。
推定器間の観測された相違は、その振る舞いを実際的な応用で予測するために用いられる。
関連論文リスト
- Scaling Laws for the Value of Individual Data Points in Machine Learning [55.596413470429475]
個々のデータポイントの値のスケーリング行動を調べることによって、新しい視点を導入する。
スケーリング法則を支持するための学習理論を提供し、それが様々なモデルクラスにまたがっていることを実証的に観察する。
私たちの研究は、個々のデータポイントの値のスケーリング特性を理解し、活用するための第一歩です。
論文 参考訳(メタデータ) (2024-05-30T20:10:24Z) - Beyond the noise: intrinsic dimension estimation with optimal neighbourhood identification [43.26660964074272]
内在次元(ID)は教師なし学習と特徴選択における鍵となる概念である。
提案手法では,スイーツスポットを選択するための自動プロトコル,すなわち,IDが有意義で有用である適切な範囲の尺度を導入する。
人工および実世界のデータセットのベンチマークにより、理論的保証を導き、この手順の有用性とロバスト性を示す。
論文 参考訳(メタデータ) (2024-05-24T01:08:05Z) - DCID: Deep Canonical Information Decomposition [84.59396326810085]
本稿では,2つの1次元目標変数間で共有される信号の同定について考察する。
そこで本研究では,地中トラスラベルの存在下で使用可能な評価指標であるICMを提案する。
また、共有変数を学習するための単純かつ効果的なアプローチとして、Deep Canonical Information Decomposition (DCID)を提案する。
論文 参考訳(メタデータ) (2023-06-27T16:59:06Z) - Intrinsic Dimension for Large-Scale Geometric Learning [0.0]
データセットの次元を決定するための単純なアプローチは、属性の数に基づいています。
より洗練された手法は、より複雑な特徴関数を用いる内在次元(ID)の概念を導出する。
論文 参考訳(メタデータ) (2022-10-11T09:50:50Z) - Intrinsic Dimensionality Estimation within Tight Localities: A
Theoretical and Experimental Analysis [0.0]
そこで本研究では,20個のサンプル点からなるタイトな局所性に対しても安定な局所ID推定手法を提案する。
実験結果から,提案手法の偏差は比較的小さいが, 偏差は比較的小さく, 試料径は最先端の推定値よりもはるかに小さいことがわかった。
論文 参考訳(メタデータ) (2022-09-29T00:00:11Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Data-SUITE: Data-centric identification of in-distribution incongruous
examples [81.21462458089142]
Data-SUITEは、ID(In-distriion)データの不連続領域を特定するためのデータ中心のフレームワークである。
我々は,Data-SUITEの性能保証とカバレッジ保証を実証的に検証する。
論文 参考訳(メタデータ) (2022-02-17T18:58:31Z) - Local Intrinsic Dimensionality Signals Adversarial Perturbations [28.328973408891834]
局所次元(Local dimensionality, LID)は、各データポイントを記述するのに必要な潜伏変数の最小数を記述する局所計量である。
本稿では、摂動データポイントのLID値に対する下界と上界を導出し、特に下界は摂動の大きさと正の相関を持つことを示す。
論文 参考訳(メタデータ) (2021-09-24T08:29:50Z) - Featurized Density Ratio Estimation [82.40706152910292]
本研究では,2つの分布を推定前の共通特徴空間にマッピングするために,可逆生成モデルを活用することを提案する。
この偉業化は、学習された入力空間の密度比が任意に不正確な場合、潜在空間において密度が密接な関係をもたらす。
同時に、特徴写像の可逆性は、特徴空間で計算された比が入力空間で計算された比と同値であることを保証する。
論文 参考訳(メタデータ) (2021-07-05T18:30:26Z) - Nonparametric Density Estimation from Markov Chains [68.8204255655161]
我々はマルコフ・チェインにインスパイアされた新しい非パラメトリック密度推定器を導入し、よく知られたケルネル密度推定器を一般化する。
我々の推定器は, 通常のものに対していくつかの利点を示し, 全密度アルゴリズムの基盤として容易に利用できる。
論文 参考訳(メタデータ) (2020-09-08T18:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。