論文の概要: $G$-Mapper: Learning a Cover in the Mapper Construction
- arxiv url: http://arxiv.org/abs/2309.06634v1
- Date: Tue, 12 Sep 2023 22:51:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 16:01:48.315063
- Title: $G$-Mapper: Learning a Cover in the Mapper Construction
- Title(参考訳): g$-mapper:マッパー建設でカバーを学ぶ
- Authors: Enrique Alvarado, Robin Belton, Emily Fischer, Kang-Ju Lee, Sourabh
Palande, Sarah Percival, Emilie Purvine
- Abstract要約: Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
本稿では,正規性に関する統計的テストに従って繰り返し被覆を分割することで,Mapperグラフの被覆を最適化するアルゴリズムを提案する。
このアルゴリズムは,アンダーソン・ダーリング試験を反復的に実施することにより,$k$-meansの最適なクラスタ数を探索する$G$-meansクラスタリングに基づいている。
- 参考スコア(独自算出の注目度): 0.7852714805965528
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Mapper algorithm is a visualization technique in topological data
analysis (TDA) that outputs a graph reflecting the structure of a given
dataset. The Mapper algorithm requires tuning several parameters in order to
generate a "nice" Mapper graph. The paper focuses on selecting the cover
parameter. We present an algorithm that optimizes the cover of a Mapper graph
by splitting a cover repeatedly according to a statistical test for normality.
Our algorithm is based on $G$-means clustering which searches for the optimal
number of clusters in $k$-means by conducting iteratively the Anderson-Darling
test. Our splitting procedure employs a Gaussian mixture model in order to
choose carefully the cover based on the distribution of a given data.
Experiments for synthetic and real-world datasets demonstrate that our
algorithm generates covers so that the Mapper graphs retain the essence of the
datasets.
- Abstract(参考訳): Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
マッパーアルゴリズムは、"nice"マッパーグラフを生成するためにいくつかのパラメータをチューニングする必要がある。
本稿はカバーパラメータの選択に焦点をあてる。
本稿では,マッパーグラフの被覆を,統計的正規性テストに従って繰り返し分割することにより最適化するアルゴリズムを提案する。
このアルゴリズムは,anderson-darlingテストを繰り返し実施することにより,k$-meansで最適なクラスタ数を探索する,$g$-meansクラスタリングに基づいている。
分割手順では,与えられたデータの分布に基づいてカバーを慎重に選択するためにガウス混合モデルを用いる。
合成および実世界のデータセットに対する実験により、我々のアルゴリズムがカバーを生成し、Mapperグラフがデータセットの本質を保持することを示す。
関連論文リスト
- A Greedy Strategy for Graph Cut [95.2841574410968]
GGCと呼ばれるグラフカットの問題を解決するための欲求戦略を提案する。
これは、各データサンプルがクラスタと見なされる状態から始まり、2つのクラスタを動的にマージする。
GGCはサンプル数に関してほぼ線形な計算複雑性を持つ。
論文 参考訳(メタデータ) (2024-12-28T05:49:42Z) - A Mapper Algorithm with implicit intervals and its optimization [0.3683202928838613]
Mapperアルゴリズムは、トポロジデータ解析において複雑な高次元データを可視化するための重要なツールである。
手動のパラメータチューニングと固定間隔、および固定オーバーラップ比の必要性は、標準的なMapperアルゴリズムの性能を損なう可能性がある。
隠れた代入行列を通して暗黙的に間隔を表す新しいフレームワークを導入する。
論文 参考訳(メタデータ) (2024-12-16T10:16:54Z) - Noncommutative Model Selection for Data Clustering and Dimension Reduction Using Relative von Neumann Entropy [0.0]
教師なし分類と次元削減のためのデータ駆動型アルゴリズムのペアを提案する。
我々の実験では、クラスタリングアルゴリズムは、非自明な幾何学とトポロジを持つデータセット上の$k$-meansクラスタリングよりも優れています。
論文 参考訳(メタデータ) (2024-11-29T18:04:11Z) - A Differentially Private Clustering Algorithm for Well-Clustered Graphs [6.523602840064548]
このようなグラフに特化された効率的な(epsilon,$delta$)-DPアルゴリズムを提供する。
我々のアルゴリズムは、ほぼバランスの取れたクラスタに対して$k$のグラフを扱う。
論文 参考訳(メタデータ) (2024-03-21T11:57:16Z) - Differentiable Mapper For Topological Optimization Of Data
Representation [33.33724208084121]
我々は,Mapperグラフに対する最初のフィルタ最適化スキームを提供するためにトポロジを組み込んだ最近提案されたフレームワークを構築した。
複数のデータセット上でMapperグラフ表現を最適化することで,提案手法の有用性を示す。
論文 参考訳(メタデータ) (2024-02-20T09:33:22Z) - A distribution-guided Mapper algorithm [0.3683202928838613]
本稿ではD-Mapperという分布誘導型Mapperアルゴリズムを提案する。
提案アルゴリズムは確率的モデルに基づく手法であり,非確率的手法の代替となる可能性がある。
数値実験により,D-Mapperは様々なシナリオにおいて従来のMapperアルゴリズムより優れていることが示された。
論文 参考訳(メタデータ) (2024-01-19T17:07:05Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - Langevin Monte Carlo for Contextual Bandits [72.00524614312002]
Langevin Monte Carlo Thompson Sampling (LMC-TS) が提案されている。
提案アルゴリズムは,文脈的帯域幅の特別な場合において,最高のトンプソンサンプリングアルゴリズムと同じサブ線形残差を達成できることを示す。
論文 参考訳(メタデータ) (2022-06-22T17:58:23Z) - Reinforcement Learning Based Query Vertex Ordering Model for Subgraph
Matching [58.39970828272366]
グラフマッチングアルゴリズムは、クエリグラフの埋め込みをデータグラフGに列挙する。
マッチング順序は、これらのバックトラックに基づくサブグラフマッチングアルゴリズムの時間効率において重要な役割を果たす。
本稿では,Reinforcement Learning (RL) と Graph Neural Networks (GNN) 技術を適用して,グラフマッチングアルゴリズムの高品質なマッチング順序を生成する。
論文 参考訳(メタデータ) (2022-01-25T00:10:03Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Adaptive Graph Auto-Encoder for General Data Clustering [90.8576971748142]
グラフベースのクラスタリングは、クラスタリング領域において重要な役割を果たす。
グラフ畳み込みニューラルネットワークに関する最近の研究は、グラフ型データにおいて驚くべき成功を収めている。
本稿では,グラフの生成的視点に応じて適応的にグラフを構成する汎用データクラスタリングのためのグラフ自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-02-20T10:11:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。