論文の概要: Joint Geometric and Topological Analysis of Hierarchical Datasets
- arxiv url: http://arxiv.org/abs/2104.01395v1
- Date: Sat, 3 Apr 2021 13:02:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:51:32.914051
- Title: Joint Geometric and Topological Analysis of Hierarchical Datasets
- Title(参考訳): 階層的データセットの連成幾何学的・トポロジカル解析
- Authors: Lior Aloni, Omer Bobrowski, Ronen Talmon
- Abstract要約: 本稿では,複数の階層的データセットに整理された高次元データに注目する。
この研究の主な新規性は、トポロジカルデータ分析と幾何多様体学習という、2つの強力なデータ分析アプローチの組み合わせにある。
本手法は, 最新手法と比較して優れた分類結果をもたらすことを示した。
- 参考スコア(独自算出の注目度): 7.098759778181621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In a world abundant with diverse data arising from complex acquisition
techniques, there is a growing need for new data analysis methods. In this
paper we focus on high-dimensional data that are organized into several
hierarchical datasets. We assume that each dataset consists of complex samples,
and every sample has a distinct irregular structure modeled by a graph. The
main novelty in this work lies in the combination of two complementing powerful
data-analytic approaches: topological data analysis (TDA) and geometric
manifold learning. Geometry primarily contains local information, while
topology inherently provides global descriptors. Based on this combination, we
present a method for building an informative representation of hierarchical
datasets. At the finer (sample) level, we devise a new metric between samples
based on manifold learning that facilitates quantitative structural analysis.
At the coarser (dataset) level, we employ TDA to extract qualitative structural
information from the datasets. We showcase the applicability and advantages of
our method on simulated data and on a corpus of hyper-spectral images. We show
that an ensemble of hyper-spectral images exhibits a hierarchical structure
that fits well the considered setting. In addition, we show that our new method
gives rise to superior classification results compared to state-of-the-art
methods.
- Abstract(参考訳): 複雑な取得技術から生じる多様なデータに富む世界では、新たなデータ分析手法の必要性が高まっている。
本稿では,複数の階層的データセットに分類した高次元データに着目した。
各データセットは複雑なサンプルで構成されており、各サンプルはグラフによってモデル化された異なる不規則構造を持つと仮定する。
この研究の主な特徴は、トポロジカルデータ解析(TDA)と幾何多様体学習という、2つの補完的なデータ分析アプローチの組み合わせにある。
幾何学は主に局所的な情報を含むが、トポロジーは本質的にグローバルな記述子を提供する。
この組み合わせに基づいて,階層的データセットの情報表現を構築する手法を提案する。
より細かい(サンプル)レベルでは、定量的構造解析を容易にする多様体学習に基づくサンプル間の新しい計量を考案する。
粗い(データセット)レベルでは、データセットから定性的構造情報を抽出するためにTDAを使用します。
本研究では,シミュレーションデータとハイパースペクトル画像のコーパスに対して,提案手法の適用性と利点を示す。
ハイパースペクトル画像のアンサンブルは階層構造を呈し,考察した設定によく適合することを示す。
さらに,本手法は,最先端手法と比較して,より優れた分類結果をもたらすことを示す。
関連論文リスト
- ClusterGraph: a new tool for visualization and compression of multidimensional data [0.0]
本稿では,任意のクラスタリングアルゴリズムの出力に付加的なレイヤを提供する。
クラスタリングアルゴリズムから得られたクラスタのグローバルなレイアウトに関する情報を提供する。
論文 参考訳(メタデータ) (2024-11-08T09:40:54Z) - (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Entropic Optimal Transport Eigenmaps for Nonlinear Alignment and Joint Embedding of High-Dimensional Datasets [11.105392318582677]
本稿では,理論的保証付きデータセットの整列と共同埋め込みの原理的アプローチを提案する。
提案手法は,2つのデータセット間のEOT計画行列の先頭特異ベクトルを利用して,それらの共通基盤構造を抽出する。
EOT計画では,高次元状態において,潜伏変数の位置で評価されたカーネル関数を近似することにより,共有多様体構造を復元する。
論文 参考訳(メタデータ) (2024-07-01T18:48:55Z) - ComboStoc: Combinatorial Stochasticity for Diffusion Generative Models [65.82630283336051]
拡散生成モデルの既存のトレーニングスキームにより,次元と属性の組み合わせによって区切られた空間が十分に標本化されていないことを示す。
構造を完全に活用するプロセスを構築し,ComboStocという名前でこの問題に対処する。
論文 参考訳(メタデータ) (2024-05-22T15:23:10Z) - Defining Neural Network Architecture through Polytope Structures of Dataset [53.512432492636236]
本稿では, ニューラルネットワーク幅の上下境界を定義し, 問題となるデータセットのポリトープ構造から情報を得る。
本研究では,データセットのポリトープ構造を学習したニューラルネットワークから推定できる逆条件を探索するアルゴリズムを開発した。
MNIST、Fashion-MNIST、CIFAR10といった一般的なデータセットは、顔の少ない2つ以上のポリトップを用いて効率的にカプセル化できることが確立されている。
論文 参考訳(メタデータ) (2024-02-04T08:57:42Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Study of Manifold Geometry using Multiscale Non-Negative Kernel Graphs [32.40622753355266]
データの幾何学的構造を研究するための枠組みを提案する。
我々は最近導入された非負のカーネル回帰グラフを用いて、点密度、固有次元、およびデータ多様体(曲率)の線型性を推定する。
論文 参考訳(メタデータ) (2022-10-31T17:01:17Z) - A geometric framework for outlier detection in high-dimensional data [0.0]
異常検出はデータ分析において重要な課題である。
データセットのメトリック構造を利用するフレームワークを提供する。
この構造を利用することで,高次元データにおける外部観測の検出が大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-07-01T12:07:51Z) - HUMAP: Hierarchical Uniform Manifold Approximation and Projection [42.50219822975012]
HUMAPは、局所的・大域的構造の保存に柔軟であるように設計された、新しい階層的次元削減技術である。
提案手法の優位性を示す実証的証拠を現在の階層的アプローチと比較し,データセットラベリングにHUMAPを適用したケーススタディを示す。
論文 参考訳(メタデータ) (2021-06-14T19:27:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。