論文の概要: ClusterGraph: a new tool for visualization and compression of multidimensional data
- arxiv url: http://arxiv.org/abs/2411.05443v1
- Date: Fri, 08 Nov 2024 09:40:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:53:55.707597
- Title: ClusterGraph: a new tool for visualization and compression of multidimensional data
- Title(参考訳): ClusterGraph: 多次元データの可視化と圧縮のための新しいツール
- Authors: Paweł Dłotko, Davide Gurnari, Mathis Hallier, Anna Jurek-Loughrey,
- Abstract要約: 本稿では,任意のクラスタリングアルゴリズムの出力に付加的なレイヤを提供する。
クラスタリングアルゴリズムから得られたクラスタのグローバルなレイアウトに関する情報を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Understanding the global organization of complicated and high dimensional data is of primary interest for many branches of applied sciences. It is typically achieved by applying dimensionality reduction techniques mapping the considered data into lower dimensional space. This family of methods, while preserving local structures and features, often misses the global structure of the dataset. Clustering techniques are another class of methods operating on the data in the ambient space. They group together points that are similar according to a fixed similarity criteria, however unlike dimensionality reduction techniques, they do not provide information about the global organization of the data. Leveraging ideas from Topological Data Analysis, in this paper we provide an additional layer on the output of any clustering algorithm. Such data structure, ClusterGraph, provides information about the global layout of clusters, obtained from the considered clustering algorithm. Appropriate measures are provided to assess the quality and usefulness of the obtained representation. Subsequently the ClusterGraph, possibly with an appropriate structure--preserving simplification, can be visualized and used in synergy with state of the art exploratory data analysis techniques.
- Abstract(参考訳): 複雑で高次元的なデータのグローバルな構造を理解することは、応用科学の多くの分野にとって主要な関心事である。
典型的には、考慮されたデータを低次元空間にマッピングすることで達成される。
このメソッドのファミリーは、ローカルな構造と特徴を保存する一方で、データセットのグローバルな構造を見逃すことが多い。
クラスタリング技術は、環境空間のデータを扱う別のタイプのメソッドである。
彼らは、固定された類似度基準に従って類似した点をまとめるが、次元削減技術とは異なり、データのグローバルな構成に関する情報は提供しない。
トポロジカル・データ・アナリシス(Topological Data Analysis)のアイデアを活用して,任意のクラスタリングアルゴリズムの出力に付加的なレイヤを提供する。
このようなデータ構造であるClusterGraphは、考慮されたクラスタリングアルゴリズムから得られたクラスタのグローバルなレイアウトに関する情報を提供する。
得られた表現の質と有用性を評価するための適切な手段が提供される。
その後、ClusterGraphは、おそらく適切な構造を保ったまま、視覚化され、最先端の探索データ分析技術と相乗効果として使用できる。
関連論文リスト
- Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Hierarchical clustering with dot products recovers hidden tree structure [53.68551192799585]
本稿では,階層構造の回復に着目した凝集クラスタリングアルゴリズムの新しい視点を提案する。
クラスタを最大平均点積でマージし、例えば最小距離やクラスタ内分散でマージしないような、標準的なアルゴリズムの単純な変種を推奨する。
このアルゴリズムにより得られた木は、汎用確率的グラフィカルモデルの下で、データ中の生成的階層構造をボナフェイド推定することを示した。
論文 参考訳(メタデータ) (2023-05-24T11:05:12Z) - Generating Multidimensional Clusters With Support Lines [0.0]
合成データ生成のためのモジュラープロシージャであるClugenを提案する。
Clukenはオープンソースで、包括的なユニットテストとドキュメント化が可能である。
クラスタリングアルゴリズムの評価にはClugenが適していることを示す。
論文 参考訳(メタデータ) (2023-01-24T22:08:24Z) - On Learning the Structure of Clusters in Graphs [3.8073142980733]
多くの実世界のアプリケーションでは、クラスタは大きなハイレベルな構造を持つ。
これはグラフクラスタリングアルゴリズムの設計と解析においてしばしば見過ごされる。
この論文は、クラスタの構造を効率的に学習できるかどうかという自然問題に対処する。
論文 参考訳(メタデータ) (2022-12-29T15:26:19Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - Effective and Efficient Graph Learning for Multi-view Clustering [173.8313827799077]
マルチビュークラスタリングのための効率的かつ効率的なグラフ学習モデルを提案する。
本手法はテンソルシャッテンp-ノルムの最小化により異なるビューのグラフ間のビュー類似性を利用する。
提案アルゴリズムは時間経済であり,安定した結果を得るとともに,データサイズによく対応している。
論文 参考訳(メタデータ) (2021-08-15T13:14:28Z) - HUMAP: Hierarchical Uniform Manifold Approximation and Projection [42.50219822975012]
HUMAPは、局所的・大域的構造の保存に柔軟であるように設計された、新しい階層的次元削減技術である。
提案手法の優位性を示す実証的証拠を現在の階層的アプローチと比較し,データセットラベリングにHUMAPを適用したケーススタディを示す。
論文 参考訳(メタデータ) (2021-06-14T19:27:54Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - Joint Geometric and Topological Analysis of Hierarchical Datasets [7.098759778181621]
本稿では,複数の階層的データセットに整理された高次元データに注目する。
この研究の主な新規性は、トポロジカルデータ分析と幾何多様体学習という、2つの強力なデータ分析アプローチの組み合わせにある。
本手法は, 最新手法と比較して優れた分類結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-04-03T13:02:00Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。