論文の概要: Classification based on Topological Data Analysis
- arxiv url: http://arxiv.org/abs/2102.03709v1
- Date: Sun, 7 Feb 2021 03:47:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-09 22:10:25.653876
- Title: Classification based on Topological Data Analysis
- Title(参考訳): トポロジカルデータ分析に基づく分類
- Authors: Rolando Kindelan and Jos\'e Fr\'ias and Mauricio Cerda and Nancy
Hitschfeld
- Abstract要約: トポロジカルデータ分析(TDA)は、データセットに隠されたトポロジカル情報を見つけることを目的とした創発的な分野である。
本稿では,TDAをマルチクラス分類問題に直接適用するアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 1.6668132748773563
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Topological Data Analysis (TDA) is an emergent field that aims to discover
topological information hidden in a dataset. TDA tools have been commonly used
to create filters and topological descriptors to improve Machine Learning (ML)
methods. This paper proposes an algorithm that applies TDA directly to
multi-class classification problems, even imbalanced datasets, without any
further ML stage. The proposed algorithm built a filtered simplicial complex on
the dataset. Persistent homology is then applied to guide choosing a
sub-complex where unlabeled points obtain the label with most votes from
labeled neighboring points. To assess the proposed method, 8 datasets were
selected with several degrees of class entanglement, variability on the samples
per class, and dimensionality. On average, the proposed TDABC method was
capable of overcoming baseline classifiers (wk-NN and k-NN) in each of the
computed metrics, especially on classifying entangled and minority classes.
- Abstract(参考訳): トポロジカルデータ分析(TDA)は、データセットに隠されたトポロジカル情報を発見することを目的とした緊急フィールドです。
TDAツールは、機械学習(ML)メソッドを改善するためのフィルタとトポロジカルディスクリプタを作成するために一般的に使用されています。
本論文では,マルチクラス分類問題や不均衡データセットに直接TDAを適用するアルゴリズムを提案する。
提案するアルゴリズムは、データセット上にフィルタされた単純化複合体を構築した。
永続ホモロジーは、ラベルのない点がラベル付き隣接点から最も票の多いラベルを得る部分複合体を選択するガイドに適用される。
提案手法を評価するために, クラス絡み合いの度合い, クラス毎のサンプルの変動性, 次元の8つのデータセットを選定した。
提案手法は平均して,各計算値,特に絡み合ったクラスとマイノリティクラスにおいて,ベースライン分類器(wk-NNとk-NN)を克服する。
関連論文リスト
- A Closer Look at Deep Learning on Tabular Data [52.50778536274327]
タブラルデータは、機械学習の様々な領域で広く使われている。
Deep Neural Network(DNN)ベースの手法は、ツリーベースに匹敵する有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-07-01T04:24:07Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - A Topological Data Analysis Based Classifier [1.6668132748773563]
本稿では,多クラス分類問題に直接トポロジカルデータ解析を適用するアルゴリズムを提案する。
提案アルゴリズムは,データセット上にフィルタされた単純複合体を構築する。
提案手法は平均してKNNと重み付きKNNよりも優れていた。
論文 参考訳(メタデータ) (2021-11-09T15:54:16Z) - Class Introspection: A Novel Technique for Detecting Unlabeled
Subclasses by Leveraging Classifier Explainability Methods [0.0]
潜在構造はデータセットの分析を行う上で重要なステップである。
インスタンス説明手法を利用することで、既存の分類器を拡張して潜在クラスを検出することができる。
本稿では,分類器を自動解析するパイプラインと,この手法による結果を対話的に探索するWebアプリケーションについても述べる。
論文 参考訳(メタデータ) (2021-07-04T14:58:29Z) - Binary Classification from Multiple Unlabeled Datasets via Surrogate Set
Classification [94.55805516167369]
我々は m 個の U 集合を $mge2$ で二進分類する新しい手法を提案する。
我々のキーとなる考え方は、サロゲート集合分類(SSC)と呼ばれる補助的分類タスクを考えることである。
論文 参考訳(メタデータ) (2021-02-01T07:36:38Z) - A Method for Handling Multi-class Imbalanced Data by Geometry based
Information Sampling and Class Prioritized Synthetic Data Generation (GICaPS) [15.433936272310952]
本稿では,多ラベル分類問題における不均衡データ処理の問題について考察する。
特徴ベクトル間の幾何学的関係を利用する2つの新しい手法が提案されている。
提案手法の有効性は,汎用的なマルチクラス認識問題を解くことによって解析する。
論文 参考訳(メタデータ) (2020-10-11T04:04:26Z) - Domain Adaptation with Auxiliary Target Domain-Oriented Classifier [115.39091109079622]
ドメイン適応は、知識をラベルリッチだが異質なドメインからラベルケアドメインに転送することを目的としている。
最も一般的なSSLテクニックの1つは、ラベルのない各データに擬似ラベルを割り当てる擬似ラベル付けである。
我々はAuxiliary Target Domain-Oriented (ATDOC) と呼ばれる新しい擬似ラベリングフレームワークを提案する。
ATDOCは、ターゲットデータのみのための補助分類器を導入してバイアスを軽減し、擬似ラベルの品質を向上させる。
論文 参考訳(メタデータ) (2020-07-08T15:01:35Z) - Global Multiclass Classification and Dataset Construction via
Heterogeneous Local Experts [37.27708297562079]
得られたデータセットの信頼性を確保しながら、ラベルの数を最小化する方法を示す。
MNISTとCIFAR-10データセットを用いた実験では、アグリゲーション方式の良好な精度が示されている。
論文 参考訳(メタデータ) (2020-05-21T18:07:42Z) - Saliency-based Weighted Multi-label Linear Discriminant Analysis [101.12909759844946]
複数ラベルの分類課題を解決するために,LDA(Linear Discriminant Analysis)の新たな変種を提案する。
提案手法は,個々の試料の重量を定義する確率モデルに基づく。
サリエンシに基づく重み付きマルチラベル LDA アプローチは,様々なマルチラベル分類問題の性能改善につながることが示されている。
論文 参考訳(メタデータ) (2020-04-08T19:40:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。