論文の概要: Topological Machine Learning for Mixed Numeric and Categorical Data
- arxiv url: http://arxiv.org/abs/2003.04584v2
- Date: Fri, 12 Jun 2020 15:28:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 21:48:00.108977
- Title: Topological Machine Learning for Mixed Numeric and Categorical Data
- Title(参考訳): 混合数値とカテゴリーデータのトポロジ的機械学習
- Authors: Chengyuan Wu, Carol Anne Hargreaves
- Abstract要約: トポロジカルデータ分析は、高次元データの研究において優れた機械学習の新しい分野である。
混合数値と分類属性を持つ混合データオブジェクトは、現実世界のアプリケーションではユビキタスである。
混合データ分類のための新しいトポロジカル機械学習手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Topological data analysis is a relatively new branch of machine learning that
excels in studying high dimensional data, and is theoretically known to be
robust against noise. Meanwhile, data objects with mixed numeric and
categorical attributes are ubiquitous in real-world applications. However,
topological methods are usually applied to point cloud data, and to the best of
our knowledge there is no available framework for the classification of mixed
data using topological methods. In this paper, we propose a novel topological
machine learning method for mixed data classification. In the proposed method,
we use theory from topological data analysis such as persistent homology,
persistence diagrams and Wasserstein distance to study mixed data. The
performance of the proposed method is demonstrated by experiments on a
real-world heart disease dataset. Experimental results show that our
topological method outperforms several state-of-the-art algorithms in the
prediction of heart disease.
- Abstract(参考訳): トポロジカルデータ分析は、高次元データの研究において優れている比較的新しい機械学習の分野であり、理論的にはノイズに対して堅牢であることが知られている。
一方、数値と分類属性を混合したデータオブジェクトは、現実世界のアプリケーションではユビキタスである。
しかし、トポロジカルな手法は通常、点クラウドデータに適用され、私たちの知る限り、トポロジカルな手法を用いて混合データの分類を行うためのフレームワークは存在しない。
本稿では,混合データ分類のための新しいトポロジカル機械学習手法を提案する。
提案手法では, 持続的ホモロジー, 持続性図, ワッサースタイン距離などの位相的データ解析理論を用いて混合データの研究を行う。
提案手法の性能は実世界の心臓病データセットを用いて実験的に検証した。
実験の結果, トポロジカル手法は心臓疾患の予測においていくつかの最先端アルゴリズムより優れていた。
関連論文リスト
- Topograph: An efficient Graph-Based Framework for Strictly Topology Preserving Image Segmentation [78.54656076915565]
位相的正しさは多くの画像分割タスクにおいて重要な役割を果たす。
ほとんどのネットワークは、Diceのようなピクセル単位の損失関数を使って、トポロジカルな精度を無視して訓練されている。
トポロジ的に正確な画像セグメンテーションのための新しいグラフベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-05T16:20:14Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Synthetic Data Generation and Deep Learning for the Topological Analysis
of 3D Data [0.0]
この研究は、深層学習を用いて、3Dでスパースで無秩序な点雲のシーンのトポロジーを推定する。
この実験結果は、洗練された合成データ生成の助けを借りて、ニューラルネットワークがセグメンテーションに基づくトポロジ的データ解析を行うことができるという仮説を支持する。
論文 参考訳(メタデータ) (2023-09-29T04:37:35Z) - Topological Learning in Multi-Class Data Sets [0.3050152425444477]
フィードフォワードディープニューラルネットワーク(DNN)の学習におけるトポロジカル複雑度の影響について検討する。
我々は,複数の構築およびオープンソースデータセットに対するトポロジ的分類アルゴリズムの評価を行った。
論文 参考訳(メタデータ) (2023-01-23T21:54:25Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - On topological data analysis for structural dynamics: an introduction to
persistent homology [0.0]
トポロジカル・データ分析(トポロジカル・データ・アナリティクス)は、長さのスケールでデータの形状を定量化する手法である。
永続ホモロジー(Persistent homology)は、長さのスケールでデータの形状を定量化する手法である。
論文 参考訳(メタデータ) (2022-09-12T10:39:38Z) - RandomSCM: interpretable ensembles of sparse classifiers tailored for
omics data [59.4141628321618]
決定規則の結合や解離に基づくアンサンブル学習アルゴリズムを提案する。
モデルの解釈可能性により、高次元データのバイオマーカー発見やパターン発見に有用である。
論文 参考訳(メタデータ) (2022-08-11T13:55:04Z) - A Topological Approach for Semi-Supervised Learning [0.0]
トポロジカルデータ分析(TDA)に基づく半教師付き学習手法を提案する。
特に,2つの異なるトポロジ的アプローチに従って,2つの半教師付き学習手法を開発した。
本研究で開発された手法は,手作業でラベル付けしたデータのみを学習したモデルと,従来の半教師付き学習手法を用いて学習したモデルとを比較検討した。
論文 参考訳(メタデータ) (2022-05-19T15:23:39Z) - Predictive Geological Mapping with Convolution Neural Network Using
Statistical Data Augmentation on a 3D Model [0.0]
本研究では,3次元地質・磁気感受性モデルを用いたデータ拡張ワークフローを構築した。
Gated Shape Convolutional Neural Networkアルゴリズムは、地質図を作成するために生成された合成データセットに基づいて訓練された。
合成データセットの一部と周辺地域のデータを用いて行った検証結果から, この手法が海底地質の区分に適していることが示唆された。
論文 参考訳(メタデータ) (2021-10-27T13:56:40Z) - Learning Neural Causal Models with Active Interventions [83.44636110899742]
本稿では,データ生成プロセスの根底にある因果構造を素早く識別する能動的介入ターゲット機構を提案する。
本手法は,ランダムな介入ターゲティングと比較して,要求される対話回数を大幅に削減する。
シミュレーションデータから実世界のデータまで,複数のベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-06T13:10:37Z) - Trajectories, bifurcations and pseudotime in large clinical datasets:
applications to myocardial infarction and diabetes data [94.37521840642141]
混合データ型と欠落値を特徴とする大規模臨床データセット分析のための半教師付き方法論を提案する。
この手法は、次元の減少、データの可視化、クラスタリング、特徴の選択と、部分的に順序付けられた観測列における測地距離(擬時)の定量化のタスクを同時に扱うことのできる弾性主グラフの適用に基づいている。
論文 参考訳(メタデータ) (2020-07-07T21:04:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。