論文の概要: Measuring group-separability in geometrical space for evaluation of
pattern recognition and embedding algorithms
- arxiv url: http://arxiv.org/abs/1912.12418v1
- Date: Sat, 28 Dec 2019 07:34:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-17 12:37:48.202314
- Title: Measuring group-separability in geometrical space for evaluation of
pattern recognition and embedding algorithms
- Title(参考訳): パターン認識と埋め込みアルゴリズム評価のための幾何学空間における群分離性の測定
- Authors: A. Acevedo, S. Ciucci, MJ. Kuo, C. Duran and CV. Cannistraci
- Abstract要約: 射影分離性(PS)は、幾何学空間におけるデータサンプルの群分離性を評価するために設計されている。
5つの非線形データセットと6つの異なるDRアルゴリズムを用いて,PS尺度を6つのベースラインクラスタ妥当性指標と比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Evaluating data separation in a geometrical space is fundamental for pattern
recognition. A plethora of dimensionality reduction (DR) algorithms have been
developed in order to reveal the emergence of geometrical patterns in a low
dimensional visible representation space, in which high-dimensional samples
similarities are approximated by geometrical distances. However, statistical
measures to evaluate directly in the low dimensional geometrical space the
sample group separability attaiend by these DR algorithms are missing.
Certainly, these separability measures could be used both to compare algorithms
performance and to tune algorithms parameters. Here, we propose three
statistical measures (named as PSI-ROC, PSI-PR, and PSI-P) that have origin
from the Projection Separability (PS) rationale introduced in this study, which
is expressly designed to assess group separability of data samples in a
geometrical space. Traditional cluster validity indices (CVIs) might be applied
in this context but they show limitations because they are not specifically
tailored for DR. Our PS measures are compared to six baseline cluster validity
indices, using five non-linear datasets and six different DR algorithms. The
results provide clear evidence that statistical-based measures based on PS
rationale are more accurate than CVIs and can be adopted to control the tuning
of parameter-dependent DR algorithms.
- Abstract(参考訳): 幾何学的空間におけるデータ分離の評価は、パターン認識に欠かせない。
低次元可視表示空間における幾何学的パターンの出現を明らかにするために,高次元サンプルの類似性を幾何学的距離で近似するために,次元減少(DR)アルゴリズムが開発された。
しかし、これらのDRアルゴリズムによるサンプル群分離性は、低次元幾何学空間で直接評価する統計的尺度が欠落している。
これらの分離性尺度は、アルゴリズムのパフォーマンスの比較とアルゴリズムパラメータのチューニングの両方に使用できる。
本稿では、幾何学空間におけるデータサンプルの群分離性を評価するために考案された、プロジェクション分離性(PS)理論に由来する3つの統計測度(PSI-ROC、PSI-PR、PSI-P)を提案する。
従来のクラスタ妥当性指標(CVI)はこの文脈で適用されるかもしれないが、DRに特化していないため限界を示す。我々のPS尺度は5つの非線形データセットと6つの異なるDRアルゴリズムを用いて、6つのベースラインクラスタ妥当性指標と比較される。
その結果,ps法に基づく統計的指標はcvisよりも精度が高く,パラメータ依存型drアルゴリズムのチューニング制御に有効であることが明らかとなった。
関連論文リスト
- Sample-Efficient Geometry Reconstruction from Euclidean Distances using Non-Convex Optimization [7.114174944371803]
ユークリッド距離情報点対を埋め込む適切な点を見つける問題は、コアタスクとサブマシン学習の問題の両方として生じる。
本稿では,最小限のサンプル数を考えると,この問題を解決することを目的とする。
論文 参考訳(メタデータ) (2024-10-22T13:02:12Z) - An evaluation framework for dimensionality reduction through sectional
curvature [59.40521061783166]
本研究は,非教師付き次元減少性能指標を初めて導入することを目的としている。
その実現可能性をテストするために、この測定基準は最もよく使われる次元削減アルゴリズムの性能を評価するために用いられている。
新しいパラメータ化問題インスタンスジェネレータが関数ジェネレータの形式で構築されている。
論文 参考訳(メタデータ) (2023-03-17T11:59:33Z) - Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Intrinsic Dimensionality Estimation within Tight Localities: A
Theoretical and Experimental Analysis [0.0]
そこで本研究では,20個のサンプル点からなるタイトな局所性に対しても安定な局所ID推定手法を提案する。
実験結果から,提案手法の偏差は比較的小さいが, 偏差は比較的小さく, 試料径は最先端の推定値よりもはるかに小さいことがわかった。
論文 参考訳(メタデータ) (2022-09-29T00:00:11Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - Unsupervised Learning Discriminative MIG Detectors in Nonhomogeneous
Clutter [0.8984888893275712]
主成分分析(PCA)は、高次元データをデータ分散を最大化する低次元空間にマッピングする。
PCAの原理にインスパイアされた新しいタイプの学習識別行列情報幾何(MIG)検出器を開発した。
3つの差別的なMIG検出器が、異なる幾何学的測度に関して説明されている。
論文 参考訳(メタデータ) (2022-04-24T13:50:05Z) - Dimensionally Consistent Learning with Buckingham Pi [4.446017969073817]
支配方程式がない場合、次元解析は物理系における洞察を抽出し対称性を見つけるための堅牢な手法である。
本研究では,非次元群を検出するために,可観測データの対称構造と自己相似構造を用いる自動手法を提案する。
我々はバッキンガム・パイの定理を制約として利用する3つのデータ駆動手法を開発した。
論文 参考訳(メタデータ) (2022-02-09T17:58:00Z) - Scalable Intervention Target Estimation in Linear Models [52.60799340056917]
因果構造学習への現在のアプローチは、既知の介入目標を扱うか、仮説テストを使用して未知の介入目標を発見する。
本稿では、全ての介入対象を一貫して識別するスケーラブルで効率的なアルゴリズムを提案する。
提案アルゴリズムは、与えられた観測マルコフ同値クラスを介入マルコフ同値クラスに更新することも可能である。
論文 参考訳(メタデータ) (2021-11-15T03:16:56Z) - Improving Metric Dimensionality Reduction with Distributed Topology [68.8204255655161]
DIPOLEは、局所的、計量的項と大域的、位相的項の両方で損失関数を最小化し、初期埋め込みを補正する次元推論後処理ステップである。
DIPOLEは、UMAP、t-SNE、Isomapといった一般的な手法よりも多くの一般的なデータセットで優れています。
論文 参考訳(メタデータ) (2021-06-14T17:19:44Z) - Geometric variational inference [0.0]
変分推論 (VI) またはマルコフ・チェイン・モンテカルロ (MCMC) 技術は点推定を超えて用いられる。
本研究は,リーマン幾何学とフィッシャー情報量に基づく幾何学的変分推論(geoVI)を提案する。
変換によって誘導される座標系で表される分布は、特に単純であり、正確な変分近似を可能にする。
論文 参考訳(メタデータ) (2021-05-21T17:18:50Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。