論文の概要: Performance Evaluation of t-SNE and MDS Dimensionality Reduction
Techniques with KNN, ENN and SVM Classifiers
- arxiv url: http://arxiv.org/abs/2007.13487v1
- Date: Sat, 20 Jun 2020 08:13:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-18 22:19:21.659434
- Title: Performance Evaluation of t-SNE and MDS Dimensionality Reduction
Techniques with KNN, ENN and SVM Classifiers
- Title(参考訳): KNN, ENN, SVM分類器を用いたt-SNEおよびMDS次元化手法の性能評価
- Authors: Shadman Sakib, Md. Abu Bakr Siddique, Md. Abdur Rahman
- Abstract要約: t-distributed Neighbor Embedding (t-SNE) と Multidimensional Scaling (MDS) は9つの異なるデータセットに適用される。
t-SNEアルゴリズムとMDSアルゴリズムを適用することで、各データセットは不要な特徴を排除して元の次元の半分に変換される。
- 参考スコア(独自算出の注目度): 1.8262547855491456
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The central goal of this paper is to establish two commonly available
dimensionality reduction (DR) methods i.e. t-distributed Stochastic Neighbor
Embedding (t-SNE) and Multidimensional Scaling (MDS) in Matlab and to observe
their application in several datasets. These DR techniques are applied to nine
different datasets namely CNAE9, Segmentation, Seeds, Pima Indians diabetes,
Parkinsons, Movement Libras, Mammographic Masses, Knowledge, and Ionosphere
acquired from UCI machine learning repository. By applying t-SNE and MDS
algorithms, each dataset is transformed to the half of its original dimension
by eliminating unnecessary features from the datasets. Subsequently, these
datasets with reduced dimensions are fed into three supervised classification
algorithms for classification. These classification algorithms are K Nearest
Neighbors (KNN), Extended Nearest Neighbors (ENN), and Support Vector Machine
(SVM). Again, all these algorithms are implemented in Matlab. The training and
test data ratios are maintained as ninety percent: ten percent for each
dataset. Upon accuracy observation, the efficiency for every dimensionality
technique with availed classification algorithms is analyzed and the
performance of each classifier is evaluated.
- Abstract(参考訳): 本研究の中心的な目的は, t-distributed Stochastic Neighbor Embedding (t-SNE) と Multidimensional Scaling (MDS) の2つの方法を確立し, それらの応用を複数のデータセットで観測することである。
これらのDR技術は、CNAE9、Segmentation、Seeds、Pima Indians diabetes、Parkinsons、Motion Libras、Mammographic Masses、Knowledge、Ionosphereといった9つの異なるデータセットに適用される。
t-SNEアルゴリズムとMDSアルゴリズムを適用することで、データセットから不要な特徴を排除することにより、各データセットは元の次元の半分に変換される。
その後、縮小次元のデータセットを分類のための3つの教師付き分類アルゴリズムに供給する。
これらの分類アルゴリズムは、K Nearest Neighbors (KNN)、Extended Nearest Neighbors (ENN)、Support Vector Machine (SVM)である。
これらのアルゴリズムはすべてMatlabで実装されている。
トレーニングとテストのデータ比率は、データセット毎に90%、すなわち10%で維持される。
精度観察により、汎用分類アルゴリズムを用いた次元技術毎の効率を解析し、各分類器の性能を評価する。
関連論文リスト
- A Novel Adaptive Fine-Tuning Algorithm for Multimodal Models: Self-Optimizing Classification and Selection of High-Quality Datasets in Remote Sensing [46.603157010223505]
マルチモーダル大モデルに対する適応的な微調整アルゴリズムを提案する。
我々は、GeoChatマルチモーダルリモートセンシングデータセットの3分の1を使用して、2台の3090 GPU上でモデルをトレーニングする。
このモデルはUCMercedおよびAID評価データセットで89.86と77.19のスコアを得た。
論文 参考訳(メタデータ) (2024-09-20T09:19:46Z) - Multilayer Graph Approach to Deep Subspace Clustering [0.0]
自己表現型モデル学習表現行列に基づくディープサブスペースクラスタリング(DSC)ネットワークは、完全に接続されたネットワークで実装されることが多い。
本稿では,入力データを含むエンコーダネットワークの全層から学習した表現から,選択した線形部分空間クラスタリングアルゴリズムを用いて表現を学習する。
ベースラインモデルとして2つのDSCネットワークを持つ4つのよく知られたデータセットに対して,提案手法を検証した。
論文 参考訳(メタデータ) (2024-01-30T14:09:41Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - Why Approximate Matrix Square Root Outperforms Accurate SVD in Global
Covariance Pooling? [59.820507600960745]
本稿では,前方通過のSVDと後方伝播のPad'e近似を用いて勾配を計算する新しいGCPメタ層を提案する。
提案するメタレイヤは,さまざまなCNNモデルに統合され,大規模および微細なデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-05-06T08:03:45Z) - Classification based on Topological Data Analysis [1.6668132748773563]
トポロジカルデータ分析(TDA)は、データセットに隠されたトポロジカル情報を見つけることを目的とした創発的な分野である。
本稿では,TDAをマルチクラス分類問題に直接適用するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-02-07T03:47:28Z) - TSGCNet: Discriminative Geometric Feature Learning with Two-Stream
GraphConvolutional Network for 3D Dental Model Segmentation [141.2690520327948]
2流グラフ畳み込みネットワーク(TSGCNet)を提案し、異なる幾何学的特性から多視点情報を学ぶ。
3次元口腔内スキャナーで得られた歯科モデルのリアルタイムデータセットを用いてTSGCNetの評価を行った。
論文 参考訳(メタデータ) (2020-12-26T08:02:56Z) - Supervised dimensionality reduction by a Linear Discriminant Analysis on
pre-trained CNN features [0.0]
我々は、事前訓練された深部畳み込みニューラルネットワーク(CNN)の異なる層で得られた特徴に対する線形判別分析(LDA)の適用について検討する。
CNNの機能に適用されたLDAは、類似したデータに対応するクラスのセントロイドが、異なるデータに対応するクラスよりも近いことを発見した。
論文 参考訳(メタデータ) (2020-06-22T10:31:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。