論文の概要: A Mapper Algorithm with implicit intervals and its optimization
- arxiv url: http://arxiv.org/abs/2412.11631v1
- Date: Mon, 16 Dec 2024 10:16:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-17 14:01:18.587752
- Title: A Mapper Algorithm with implicit intervals and its optimization
- Title(参考訳): 暗黙間隔を持つMapperアルゴリズムとその最適化
- Authors: Yuyang Tao, Shufei Ge,
- Abstract要約: Mapperアルゴリズムは、トポロジデータ解析において複雑な高次元データを可視化するための重要なツールである。
手動のパラメータチューニングと固定間隔、および固定オーバーラップ比の必要性は、標準的なMapperアルゴリズムの性能を損なう可能性がある。
隠れた代入行列を通して暗黙的に間隔を表す新しいフレームワークを導入する。
- 参考スコア(独自算出の注目度): 0.3683202928838613
- License:
- Abstract: The Mapper algorithm is an essential tool for visualizing complex, high dimensional data in topology data analysis (TDA) and has been widely used in biomedical research. It outputs a combinatorial graph whose structure implies the shape of the data. However,the need for manual parameter tuning and fixed intervals, along with fixed overlapping ratios may impede the performance of the standard Mapper algorithm. Variants of the standard Mapper algorithms have been developed to address these limitations, yet most of them still require manual tuning of parameters. Additionally, many of these variants, including the standard version found in the literature, were built within a deterministic framework and overlooked the uncertainty inherent in the data. To relax these limitations, in this work, we introduce a novel framework that implicitly represents intervals through a hidden assignment matrix, enabling automatic parameter optimization via stochastic gradient descent. In this work, we develop a soft Mapper framework based on a Gaussian mixture model(GMM) for flexible and implicit interval construction. We further illustrate the robustness of the soft Mapper algorithm by introducing the Mapper graph mode as a point estimation for the output graph. Moreover, a stochastic gradient descent algorithm with a specific topological loss function is proposed for optimizing parameters in the model. Both simulation and application studies demonstrate its effectiveness in capturing the underlying topological structures. In addition, the application to an RNA expression dataset obtained from the Mount Sinai/JJ Peters VA Medical Center Brain Bank (MSBB) successfully identifies a distinct subgroup of Alzheimer's Disease.
- Abstract(参考訳): Mapperアルゴリズムは、トポロジデータ解析(TDA)において複雑な高次元データを可視化するための必須ツールであり、生物医学研究で広く利用されている。
構造がデータの形状を意味する組合せグラフを出力する。
しかし、手動のパラメータチューニングや固定間隔、固定重なり合う比率の必要性は、標準的なMapperアルゴリズムの性能を損なう可能性がある。
標準的なMapperアルゴリズムの変数はこれらの制限に対処するために開発されているが、そのほとんどは手動でパラメータをチューニングする必要がある。
さらに、文献に見られる標準版を含むこれらの変種の多くは決定論的な枠組みの中で構築され、データに固有の不確実性を見落としていた。
これらの制約を緩和するため,本研究では,隠れ代入行列を通じて区間を暗黙的に表現する新しいフレームワークを導入し,確率勾配勾配による自動パラメータ最適化を実現する。
本研究では,ガウス混合モデル(GMM)に基づくフレキシブルかつ暗黙的な間隔構成のためのソフトマッパーフレームワークを開発する。
さらに、出力グラフの点推定としてMapperグラフモードを導入することで、ソフトなMapperアルゴリズムのロバスト性について述べる。
さらに, モデル内のパラメータを最適化するために, 特定の位相損失関数を持つ確率勾配降下アルゴリズムを提案する。
シミュレーションと応用研究は、基礎となるトポロジ構造を捕捉する効果を実証している。
さらに、Mount Sinai/JJ Peters VA Medical Center Brain Bank (MSBB) から得られたRNA発現データセットの適用により、アルツハイマー病の別のサブグループを特定できる。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - Differentiable Mapper For Topological Optimization Of Data
Representation [33.33724208084121]
我々は,Mapperグラフに対する最初のフィルタ最適化スキームを提供するためにトポロジを組み込んだ最近提案されたフレームワークを構築した。
複数のデータセット上でMapperグラフ表現を最適化することで,提案手法の有用性を示す。
論文 参考訳(メタデータ) (2024-02-20T09:33:22Z) - A distribution-guided Mapper algorithm [0.3683202928838613]
本稿ではD-Mapperという分布誘導型Mapperアルゴリズムを提案する。
提案アルゴリズムは確率的モデルに基づく手法であり,非確率的手法の代替となる可能性がある。
数値実験により,D-Mapperは様々なシナリオにおいて従来のMapperアルゴリズムより優れていることが示された。
論文 参考訳(メタデータ) (2024-01-19T17:07:05Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - $G$-Mapper: Learning a Cover in the Mapper Construction [0.7852714805965528]
Mapperアルゴリズムは、与えられたデータセットの構造を反映したグラフを出力するトポロジカルデータ解析(TDA)の可視化技術である。
本稿では,正規性に関する統計的テストに従って繰り返し被覆を分割することで,Mapperグラフの被覆を最適化するアルゴリズムを提案する。
我々のアルゴリズムは,アンダーソン・ダーリング試験を反復的に適用することにより,$k$-meansの最適なクラスタ数を探索する$G$-meansクラスタリングに基づいている。
論文 参考訳(メタデータ) (2023-09-12T22:51:16Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Spike-and-Slab Generalized Additive Models and Scalable Algorithms for
High-Dimensional Data [0.0]
本稿では,高次元データに対応するため,階層型一般化加法モデル(GAM)を提案する。
曲線の適切な縮退と滑らか化関数線型空間と非線形空間の分離に対する平滑化ペナルティを考察する。
2つの決定論的アルゴリズム、EM-Coordinate Descent と EM-Iterative Weighted Least Squares は異なるユーティリティ向けに開発された。
論文 参考訳(メタデータ) (2021-10-27T14:11:13Z) - Unfolding Projection-free SDP Relaxation of Binary Graph Classifier via
GDPA Linearization [59.87663954467815]
アルゴリズムの展開は、モデルベースのアルゴリズムの各イテレーションをニューラルネットワーク層として実装することにより、解釈可能で類似のニューラルネットワークアーキテクチャを生成する。
本稿では、Gershgorin disc perfect alignment (GDPA)と呼ばれる最近の線形代数定理を利用して、二進グラフの半定値プログラミング緩和(SDR)のためのプロジェクションフリーアルゴリズムをアンロールする。
実験結果から,我々の未学習ネットワークは純粋モデルベースグラフ分類器よりも優れ,純粋データ駆動ネットワークに匹敵する性能を示したが,パラメータははるかに少なかった。
論文 参考訳(メタデータ) (2021-09-10T07:01:15Z) - T-LoHo: A Bayesian Regularization Model for Structured Sparsity and
Smoothness on Graphs [0.0]
グラフ構造化データでは、構造化されたスパーシリティと滑らかさが団結する傾向にある。
グラフィカルな関係を持つ高次元パラメータに先立って提案する。
構造された空間と滑らかさを同時に検出するために使用します。
論文 参考訳(メタデータ) (2021-07-06T10:10:03Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。