論文の概要: Fuzzy c-Means Clustering for Persistence Diagrams
- arxiv url: http://arxiv.org/abs/2006.02796v5
- Date: Mon, 15 Feb 2021 13:00:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 09:25:48.167128
- Title: Fuzzy c-Means Clustering for Persistence Diagrams
- Title(参考訳): 持続性図のためのファジィc-meansクラスタリング
- Authors: Thomas Davies, Jack Aspinall, Bryan Wilder, Long Tran-Thanh
- Abstract要約: ユビキタスなFuzzy c-Means(FCM)クラスタリングアルゴリズムを永続化ダイアグラムの空間に拡張する。
提案アルゴリズムは, トポロジ的事前知識を使わずに, データのトポロジ的構造を捉える。
材料科学において、変換格子構造データセットを初めて分類する。
- 参考スコア(独自算出の注目度): 42.1666496315913
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Persistence diagrams concisely represent the topology of a point cloud whilst
having strong theoretical guarantees, but the question of how to best integrate
this information into machine learning workflows remains open. In this paper we
extend the ubiquitous Fuzzy c-Means (FCM) clustering algorithm to the space of
persistence diagrams, enabling unsupervised learning that automatically
captures the topological structure of data without the topological prior
knowledge or additional processing of persistence diagrams that many other
techniques require. We give theoretical convergence guarantees that correspond
to the Euclidean case, and empirically demonstrate the capability of our
algorithm to capture topological information via the fuzzy RAND index. We end
with experiments on two datasets that utilise both the topological and fuzzy
nature of our algorithm: pre-trained model selection in machine learning and
lattices structures from materials science. As pre-trained models can perform
well on multiple tasks, selecting the best model is a naturally fuzzy problem;
we show that fuzzy clustering persistence diagrams allows for model selection
using the topology of decision boundaries. In materials science, we classify
transformed lattice structure datasets for the first time, whilst the
probabilistic membership values let us rank candidate lattices in a scenario
where further investigation requires expensive laboratory time and expertise.
- Abstract(参考訳): 永続化ダイアグラムは、強力な理論的保証を持つ一方で、ポイントクラウドのトポロジを簡潔に表現するが、この情報を機械学習ワークフローにどのように最もうまく統合するかという問題は、まだオープンである。
本稿では,ユビキタスなFuzzy c-Means(FCM)クラスタリングアルゴリズムを永続化ダイアグラムの空間に拡張し,他の多くのテクニックが必要とするトポロジ的事前知識や永続化ダイアグラムの追加処理を必要とせずに,データのトポロジ的構造を自動的にキャプチャする教師なし学習を可能にする。
我々はユークリッドの場合に対応する理論的収束保証を与え、ファジィ RAND インデックスを介して位相情報をキャプチャするアルゴリズムの能力を実証的に実証する。
最終的に、アルゴリズムのトポロジカルな性質とファジィな性質を利用する2つのデータセットの実験を行い、機械学習における事前学習モデル選択と材料科学からの格子構造について検討する。
事前学習されたモデルが複数のタスクでうまく機能するため、最良のモデルを選択することは自然にファジィな問題であり、ファジィクラスタリングの永続図は決定境界のトポロジを用いてモデル選択を可能にすることを示す。
材料科学では, 変換格子構造データセットを初めて分類し, 確率的メンバーシップ値を用いて, さらなる調査が高価な実験時間と専門知識を必要とする場合に, 候補格子をランク付けする。
関連論文リスト
- Homological Convolutional Neural Networks [4.615338063719135]
本稿では,トポロジ的に制約されたネットワーク表現を通じて,データ構造構造を利用した新しいディープラーニングアーキテクチャを提案する。
5つの古典的な機械学習モデルと3つのディープラーニングモデルに対して、18のベンチマークデータセットでモデルをテストします。
論文 参考訳(メタデータ) (2023-08-26T08:48:51Z) - Topological Quality of Subsets via Persistence Matching Diagrams [0.196629787330046]
我々は、トポロジカルデータ解析技術を用いて、そのデータセットに関するサブセットの品質を測定する。
特に,本手法では,選択したサブセットが教師付き学習モデルの貧弱な性能をもたらす可能性がある理由を説明することができる。
論文 参考訳(メタデータ) (2023-06-04T17:08:41Z) - Masked prediction tasks: a parameter identifiability view [49.533046139235466]
マスク付きトークンの予測に広く用いられている自己教師型学習手法に着目する。
いくつかの予測タスクは識別可能性をもたらすが、他のタスクはそうではない。
論文 参考訳(メタデータ) (2022-02-18T17:09:32Z) - Topologically Regularized Data Embeddings [22.222311627054875]
本稿では,新たにトポロジ的損失の集合を導入し,その利用法を,データ埋め込みを自然に特定したモデルを表現するために,トポロジカルに正規化する方法として提案する。
このアプローチの有用性と汎用性を強調した合成データおよび実データの実験を含む。
論文 参考訳(メタデータ) (2021-10-18T11:25:47Z) - Topological Data Analysis (TDA) Techniques Enhance Hand Pose
Classification from ECoG Neural Recordings [0.0]
時系列データのトポロジ的記述を導入し、手ポーズ分類を強化する。
4ラベルの分類問題に対して,可利用データに制限のあるAC精度で頑健な結果が得られた。
論文 参考訳(メタデータ) (2021-10-09T22:04:43Z) - Rank-R FNN: A Tensor-Based Learning Model for High-Order Data
Classification [69.26747803963907]
Rank-R Feedforward Neural Network (FNN)は、そのパラメータにCanonical/Polyadic分解を課すテンソルベースの非線形学習モデルである。
まず、入力をマルチリニアアレイとして扱い、ベクトル化の必要性を回避し、すべてのデータ次元に沿って構造情報を十分に活用することができる。
Rank-R FNNの普遍的な近似と学習性の特性を確立し、実世界のハイパースペクトルデータセットのパフォーマンスを検証する。
論文 参考訳(メタデータ) (2021-04-11T16:37:32Z) - A Topological Framework for Deep Learning [0.7310043452300736]
機械学習における分類問題は、非常に穏やかな条件下では常に解決可能であることを示す。
特に,ソフトマックス分類ネットワークは,有限列の位相移動によって入力位相空間に作用し,その分類処理を実現する。
論文 参考訳(メタデータ) (2020-08-31T15:56:42Z) - A Trainable Optimal Transport Embedding for Feature Aggregation and its
Relationship to Attention [96.77554122595578]
固定サイズのパラメータ化表現を導入し、与えられた入力セットから、そのセットとトレーニング可能な参照の間の最適な輸送計画に従って要素を埋め込み、集約する。
我々のアプローチは大規模なデータセットにスケールし、参照のエンドツーエンドのトレーニングを可能にすると同時に、計算コストの少ない単純な教師なし学習メカニズムも提供する。
論文 参考訳(メタデータ) (2020-06-22T08:35:58Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Learning Bijective Feature Maps for Linear ICA [73.85904548374575]
画像データに適した既存の確率的深層生成モデル (DGM) は, 非線形ICAタスクでは不十分であることを示す。
そこで本研究では,2次元特徴写像と線形ICAモデルを組み合わせることで,高次元データに対する解釈可能な潜在構造を学習するDGMを提案する。
画像上のフローベースモデルや線形ICA、変分オートエンコーダよりも、高速に収束し、訓練が容易なモデルを作成し、教師なしの潜在因子発見を実現する。
論文 参考訳(メタデータ) (2020-02-18T17:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。