論文の概要: Dory: Overcoming Barriers to Computing Persistent Homology
- arxiv url: http://arxiv.org/abs/2103.05608v2
- Date: Thu, 11 Mar 2021 17:23:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-12 16:16:00.796101
- Title: Dory: Overcoming Barriers to Computing Persistent Homology
- Title(参考訳): Dory: 永続的ホモロジーコンピューティングの障壁を克服する
- Authors: Manu Aggarwal and Vipul Periwal
- Abstract要約: 大規模データセットの持続的ホモロジーを計算できる効率的でスケーラブルなアルゴリズムであるdoryを提案する。
応用として、ヒトゲノムのPHを高分解能で計算し、ゲノムワイドHi-Cデータセットで明らかにする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Persistent homology (PH) is an approach to topological data analysis (TDA)
that computes multi-scale topologically invariant properties of
high-dimensional data that are robust to noise. While PH has revealed useful
patterns across various applications, computational requirements have limited
applications to small data sets of a few thousand points. We present Dory, an
efficient and scalable algorithm that can compute the persistent homology of
large data sets. Dory uses significantly less memory than published algorithms
and also provides significant reductions in the computation time compared to
most algorithms. It scales to process data sets with millions of points. As an
application, we compute the PH of the human genome at high resolution as
revealed by a genome-wide Hi-C data set. Results show that the topology of the
human genome changes significantly upon treatment with auxin, a molecule that
degrades cohesin, corroborating the hypothesis that cohesin plays a crucial
role in loop formation in DNA.
- Abstract(参考訳): 永続ホモロジー (Persistent homology, PH) は、ノイズに強い高次元データの多次元位相不変性を計算するトポロジカルデータ分析 (TDA) のアプローチである。
PHは様々なアプリケーションで有用なパターンを明らかにしているが、計算要求は数千点の小さなデータセットに限られている。
大規模データセットの持続的ホモロジーを計算できる効率的でスケーラブルなアルゴリズムであるdoryを提案する。
doryは公開アルゴリズムよりもメモリ使用量が少なく、計算時間もほとんどのアルゴリズムに比べて大幅に削減できる。
数百万ポイントのデータセットを処理するためにスケールする。
応用として、ヒトゲノムのPHを高分解能で計算し、ゲノムワイドHi-Cデータセットで明らかにする。
結果は、コヘシンを分解する分子であるオーキシンによる治療によってヒトゲノムのトポロジが有意に変化し、コヘシンがDNAのループ形成において重要な役割を果たしているという仮説を裏付ける。
関連論文リスト
- A Scalable k-Medoids Clustering via Whale Optimization Algorithm [0.0]
We introduced WOA-kMedoids, a novel unsupervised clustering method which with the Whale Optimization Algorithm (WOA)。
セントロイド選択を最適化することにより、WOA-kMedoidsは観測数に関してk-メドロイドアルゴリズムの計算複雑性を2次からほぼ直線に減らす。
UCRアーカイブから25種類の時系列データセットを用いたWOA-kMedoidsの性能評価を行った。
論文 参考訳(メタデータ) (2024-08-30T03:43:37Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - PLPCA: Persistent Laplacian Enhanced-PCA for Microarray Data Analysis [5.992724190105578]
永続ラプラシアン強化主成分分析(PLPCA)を提案する。
PLPCAは、パーシステンシャルスペクトルグラフ理論を用いた初期の正規化PCA法の利点を生かしている。
グラフラプラシアンとは対照的に、永続ラプラシアンは濾過によるマルチスケール解析を可能にし、高次単純錯体を包含する。
論文 参考訳(メタデータ) (2023-06-09T22:48:14Z) - Linearized Wasserstein dimensionality reduction with approximation
guarantees [65.16758672591365]
LOT Wassmap は、ワーッサーシュタイン空間の低次元構造を明らかにするための計算可能なアルゴリズムである。
我々は,LOT Wassmapが正しい埋め込みを実現し,サンプルサイズの増加とともに品質が向上することを示す。
また、LOT Wassmapがペア距離計算に依存するアルゴリズムと比較して計算コストを大幅に削減することを示す。
論文 参考訳(メタデータ) (2023-02-14T22:12:16Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Inference of Regulatory Networks Through Temporally Sparse Data [5.495223636885796]
ゲノム工学の大きな目標は、遺伝子制御ネットワーク(GRN)の複雑な動的挙動を適切に捉えることである。
本稿では,ベイズ最適化とカーネルベースの手法を用いて,GRNのスケーラブルかつ効率的なトポロジ推定法を開発した。
論文 参考訳(メタデータ) (2022-07-21T22:48:12Z) - Tight basis cycle representatives for persistent homology of large data
sets [0.0]
永続ホモロジー(PH)はトポロジカルデータ解析の一般的なツールであり、様々な分野の研究に応用されている。
理論上は強力だが、PHは大規模データセットへの適用を妨げる高い計算コストに悩まされている。
大規模データセットにおける非自明なロバストな特徴に関する厳密な代表的境界を計算するための戦略とアルゴリズムを提供する。
論文 参考訳(メタデータ) (2022-06-06T22:00:42Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Multidimensional Scaling for Gene Sequence Data with Autoencoders [0.0]
本稿では、数百万の遺伝子配列を含むデータセットに容易にスケールできるオートエンコーダに基づく次元還元モデルを提案する。
提案モデルは現実世界の菌類遺伝子配列データセットを用いてDAMDSに対して評価される。
論文 参考訳(メタデータ) (2021-04-19T02:14:17Z) - Deep Representational Similarity Learning for analyzing neural
signatures in task-based fMRI dataset [81.02949933048332]
本稿では、表現類似度分析(RSA)の深部拡張であるDRSL(Deep Representational similarity Learning)を開発する。
DRSLは、多数の被験者を持つfMRIデータセットにおける様々な認知タスク間の類似性を分析するのに適している。
論文 参考訳(メタデータ) (2020-09-28T18:30:14Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。