論文の概要: A distribution-guided Mapper algorithm
- arxiv url: http://arxiv.org/abs/2401.12237v2
- Date: Wed, 14 Aug 2024 08:37:37 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-15 18:16:52.868787
- Title: A distribution-guided Mapper algorithm
- Title(参考訳): 分布誘導型Mapperアルゴリズム
- Authors: Yuyang Tao, Shufei Ge,
- Abstract要約: 本稿ではD-Mapperという分布誘導型Mapperアルゴリズムを提案する。
提案アルゴリズムは確率的モデルに基づく手法であり,非確率的手法の代替となる可能性がある。
数値実験により,D-Mapperは様々なシナリオにおいて従来のMapperアルゴリズムより優れていることが示された。
- 参考スコア(独自算出の注目度): 0.3683202928838613
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivation: The Mapper algorithm is an essential tool to explore shape of data in topology data analysis. With a dataset as an input, the Mapper algorithm outputs a graph representing the topological features of the whole dataset. This graph is often regarded as an approximation of a reeb graph of data. The classic Mapper algorithm uses fixed interval lengths and overlapping ratios, which might fail to reveal subtle features of data, especially when the underlying structure is complex. Results: In this work, we introduce a distribution guided Mapper algorithm named D-Mapper, that utilizes the property of the probability model and data intrinsic characteristics to generate density guided covers and provides enhanced topological features. Our proposed algorithm is a probabilistic model-based approach, which could serve as an alternative to non-prababilistic ones. Moreover, we introduce a metric accounting for both the quality of overlap clustering and extended persistence homology to measure the performance of Mapper type algorithm. Our numerical experiments indicate that the D-Mapper outperforms the classical Mapper algorithm in various scenarios. We also apply the D-Mapper to a SARS-COV-2 coronavirus RNA sequences dataset to explore the topological structure of different virus variants. The results indicate that the D-Mapper algorithm can reveal both vertical and horizontal evolution processes of the viruses. Availability: Our package is available at https://github.com/ShufeiGe/D-Mapper.
- Abstract(参考訳): モチベーション: Mapperアルゴリズムは、トポロジデータ解析におけるデータの形状を探索するための重要なツールである。
Mapperアルゴリズムはデータセットを入力として、データセット全体のトポロジ的特徴を表すグラフを出力する。
このグラフは、しばしばデータのリーブグラフの近似と見なされる。
古典的なMapperアルゴリズムは、固定間隔の長さと重なり合う比率を使い、特に基礎構造が複雑である場合、データの微妙な特徴を明らかにするのに失敗する可能性がある。
結果: 本研究では, 確率モデルの特性とデータ固有の特性を利用して, 密度誘導被覆を生成し, トポロジ特性を向上した分布案内型MapperアルゴリズムD-Mapperを導入する。
提案アルゴリズムは確率的モデルに基づく手法であり,非確率的手法の代替となる可能性がある。
さらに,重なり合うクラスタリングの品質と拡張持続性ホモロジーの両方を指標として,Mapper型アルゴリズムの性能を計測する手法を提案する。
数値実験により,D-Mapperは様々なシナリオにおいて従来のMapperアルゴリズムより優れていることが示された。
また、D-MapperをSARS-COV-2ウイルスRNA配列データセットに適用し、異なるウイルス変異体のトポロジー構造を探索する。
その結果,D-Mapperアルゴリズムはウイルスの垂直および水平の進化過程を明らかにすることができることがわかった。
可用性: 私たちのパッケージはhttps://github.com/ShufeiGe/D-Mapper.comから入手可能です。
関連論文リスト
- Differentiable Mapper For Topological Optimization Of Data
Representation [33.33724208084121]
我々は,Mapperグラフに対する最初のフィルタ最適化スキームを提供するためにトポロジを組み込んだ最近提案されたフレームワークを構築した。
複数のデータセット上でMapperグラフ表現を最適化することで,提案手法の有用性を示す。
論文 参考訳(メタデータ) (2024-02-20T09:33:22Z) - Deep Manifold Graph Auto-Encoder for Attributed Graph Embedding [51.75091298017941]
本稿では,属性付きグラフデータに対する新しいDeep Manifold (Variational) Graph Auto-Encoder (DMVGAE/DMGAE)を提案する。
提案手法は,最先端のベースラインアルゴリズムを,一般的なデータセット間でのダウンストリームタスクの差を大きく越える。
論文 参考訳(メタデータ) (2024-01-12T17:57:07Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - $G$-Mapper: Learning a Cover in the Mapper Construction [0.7852714805965528]
Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
本稿では,正規性に関する統計的テストに従って繰り返し被覆を分割することで,Mapperグラフの被覆を最適化するアルゴリズムを提案する。
我々のアルゴリズムは,アンダーソン・ダーリング試験を反復的に適用することにより,$k$-meansの最適なクラスタ数を探索する$G$-meansクラスタリングに基づいている。
論文 参考訳(メタデータ) (2023-09-12T22:51:16Z) - Asynchronously Trained Distributed Topographic Maps [0.0]
分散トレーニングによって特徴マップを生成するために,N$の自律ユニットを用いたアルゴリズムを提案する。
単位の自律性は、分散探索とカスケード駆動の重み更新スキームを組み合わせることで、時間と空間のスパース相互作用によって達成される。
論文 参考訳(メタデータ) (2023-01-20T01:15:56Z) - Tree Mover's Distance: Bridging Graph Metrics and Stability of Graph
Neural Networks [54.225220638606814]
本稿では,属性グラフの擬似測度,ツリー・モーバー距離(TMD)を提案し,その一般化との関係について検討する。
まず、TMDはグラフ分類に関連する特性をキャプチャし、単純なTMD-SVMは標準のGNNと競合することを示す。
第2に、分散シフトの下でのGNNの一般化とTMDを関連付け、そのようなシフト下での性能低下とよく相関していることを示す。
論文 参考訳(メタデータ) (2022-10-04T21:03:52Z) - Bayesian Structure Learning with Generative Flow Networks [85.84396514570373]
ベイズ構造学習では、データから有向非巡回グラフ(DAG)上の分布を推定することに興味がある。
近年,ジェネレーティブ・フロー・ネットワーク(GFlowNets)と呼ばれる確率モデルのクラスが,ジェネレーティブ・モデリングの一般的なフレームワークとして紹介されている。
DAG-GFlowNetと呼ばれる本手法は,DAGよりも後方の正確な近似を提供する。
論文 参考訳(メタデータ) (2022-02-28T15:53:10Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z) - Hotspot identification for Mapper graphs [2.330913682033217]
Mapperアルゴリズムは、ループやフレア、クラスタといった構造的に興味深い特徴をキャプチャする高次元データのグラフベースの表現を構築するために使用することができる。
精度医学などの多くの応用において、Mapper グラフは未知のコンパクトな局所化部分領域を識別するために使われてきた。
本稿では,Mapperグラフにおけるホットスポット検出のための新しいアルゴリズムを提案し,ホットスポット検出プロセスの自動化を可能にする。
論文 参考訳(メタデータ) (2020-12-03T12:22:25Z) - Block-Approximated Exponential Random Graphs [77.4792558024487]
指数乱グラフ(ERG)の分野における重要な課題は、大きなグラフ上の非自明なERGの適合である。
本稿では,非自明なERGに対する近似フレームワークを提案する。
我々の手法は、数百万のノードからなるスパースグラフにスケーラブルである。
論文 参考訳(メタデータ) (2020-02-14T11:42:16Z) - ShapeVis: High-dimensional Data Visualization at Scale [10.007129417823858]
トポロジカルデータ解析にインスパイアされたポイントクラウドデータのためのスケーラブルな可視化技術であるShapeVisを紹介する。
本手法は,圧縮された図形表現において,データの基底となる幾何学的および位相的構造をキャプチャする。
論文 参考訳(メタデータ) (2020-01-15T07:59:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。