論文の概要: $G$-Mapper: Learning a Cover in the Mapper Construction
- arxiv url: http://arxiv.org/abs/2309.06634v1
- Date: Tue, 12 Sep 2023 22:51:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 16:01:48.315063
- Title: $G$-Mapper: Learning a Cover in the Mapper Construction
- Title(参考訳): g$-mapper:マッパー建設でカバーを学ぶ
- Authors: Enrique Alvarado, Robin Belton, Emily Fischer, Kang-Ju Lee, Sourabh
Palande, Sarah Percival, Emilie Purvine
- Abstract要約: Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
本稿では,正規性に関する統計的テストに従って繰り返し被覆を分割することで,Mapperグラフの被覆を最適化するアルゴリズムを提案する。
このアルゴリズムは,アンダーソン・ダーリング試験を反復的に実施することにより,$k$-meansの最適なクラスタ数を探索する$G$-meansクラスタリングに基づいている。
- 参考スコア(独自算出の注目度): 0.7852714805965528
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The Mapper algorithm is a visualization technique in topological data
analysis (TDA) that outputs a graph reflecting the structure of a given
dataset. The Mapper algorithm requires tuning several parameters in order to
generate a "nice" Mapper graph. The paper focuses on selecting the cover
parameter. We present an algorithm that optimizes the cover of a Mapper graph
by splitting a cover repeatedly according to a statistical test for normality.
Our algorithm is based on $G$-means clustering which searches for the optimal
number of clusters in $k$-means by conducting iteratively the Anderson-Darling
test. Our splitting procedure employs a Gaussian mixture model in order to
choose carefully the cover based on the distribution of a given data.
Experiments for synthetic and real-world datasets demonstrate that our
algorithm generates covers so that the Mapper graphs retain the essence of the
datasets.
- Abstract(参考訳): Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
マッパーアルゴリズムは、"nice"マッパーグラフを生成するためにいくつかのパラメータをチューニングする必要がある。
本稿はカバーパラメータの選択に焦点をあてる。
本稿では,マッパーグラフの被覆を,統計的正規性テストに従って繰り返し分割することにより最適化するアルゴリズムを提案する。
このアルゴリズムは,anderson-darlingテストを繰り返し実施することにより,k$-meansで最適なクラスタ数を探索する,$g$-meansクラスタリングに基づいている。
分割手順では,与えられたデータの分布に基づいてカバーを慎重に選択するためにガウス混合モデルを用いる。
合成および実世界のデータセットに対する実験により、我々のアルゴリズムがカバーを生成し、Mapperグラフがデータセットの本質を保持することを示す。
関連論文リスト
- A Differentially Private Clustering Algorithm for Well-Clustered Graphs [6.523602840064548]
このようなグラフに特化された効率的な(epsilon,$delta$)-DPアルゴリズムを提供する。
我々のアルゴリズムは、ほぼバランスの取れたクラスタに対して$k$のグラフを扱う。
論文 参考訳(メタデータ) (2024-03-21T11:57:16Z) - Differentiable Mapper For Topological Optimization Of Data
Representation [33.33724208084121]
我々は,Mapperグラフに対する最初のフィルタ最適化スキームを提供するためにトポロジを組み込んだ最近提案されたフレームワークを構築した。
複数のデータセット上でMapperグラフ表現を最適化することで,提案手法の有用性を示す。
論文 参考訳(メタデータ) (2024-02-20T09:33:22Z) - A distribution-guided Mapper algorithm [0.3683202928838613]
本稿ではD-Mapperという分布誘導型Mapperアルゴリズムを提案する。
提案アルゴリズムは確率的モデルに基づく手法であり,非確率的手法の代替となる可能性がある。
数値実験により,D-Mapperは様々なシナリオにおいて従来のMapperアルゴリズムより優れていることが示された。
論文 参考訳(メタデータ) (2024-01-19T17:07:05Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - Approximating a RUM from Distributions on k-Slates [88.32814292632675]
与えられた分布を平均で最もよく近似するRUMを求める一般化時間アルゴリズムを求める。
我々の理論的結果は、実世界のデータセットに効果的でスケール可能なものを得るという、実践的な結果も得られます。
論文 参考訳(メタデータ) (2023-05-22T17:43:34Z) - Reinforcement Learning Based Query Vertex Ordering Model for Subgraph
Matching [58.39970828272366]
グラフマッチングアルゴリズムは、クエリグラフの埋め込みをデータグラフGに列挙する。
マッチング順序は、これらのバックトラックに基づくサブグラフマッチングアルゴリズムの時間効率において重要な役割を果たす。
本稿では,Reinforcement Learning (RL) と Graph Neural Networks (GNN) 技術を適用して,グラフマッチングアルゴリズムの高品質なマッチング順序を生成する。
論文 参考訳(メタデータ) (2022-01-25T00:10:03Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Pseudoinverse Graph Convolutional Networks: Fast Filters Tailored for
Large Eigengaps of Dense Graphs and Hypergraphs [0.0]
Graph Convolutional Networks (GCNs) は、グラフベースのデータセットで半教師付き分類を行うツールとして成功している。
本稿では,三部フィルタ空間が高密度グラフを対象とする新しいGCN変種を提案する。
論文 参考訳(メタデータ) (2020-08-03T08:48:41Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z) - Adaptive Graph Auto-Encoder for General Data Clustering [90.8576971748142]
グラフベースのクラスタリングは、クラスタリング領域において重要な役割を果たす。
グラフ畳み込みニューラルネットワークに関する最近の研究は、グラフ型データにおいて驚くべき成功を収めている。
本稿では,グラフの生成的視点に応じて適応的にグラフを構成する汎用データクラスタリングのためのグラフ自動エンコーダを提案する。
論文 参考訳(メタデータ) (2020-02-20T10:11:28Z) - ShapeVis: High-dimensional Data Visualization at Scale [10.007129417823858]
トポロジカルデータ解析にインスパイアされたポイントクラウドデータのためのスケーラブルな可視化技術であるShapeVisを紹介する。
本手法は,圧縮された図形表現において,データの基底となる幾何学的および位相的構造をキャプチャする。
論文 参考訳(メタデータ) (2020-01-15T07:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。