論文の概要: Classification with Nearest Disjoint Centroids
- arxiv url: http://arxiv.org/abs/2109.10436v1
- Date: Tue, 21 Sep 2021 21:16:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-23 13:54:57.843460
- Title: Classification with Nearest Disjoint Centroids
- Title(参考訳): 近距離解離セントロイドの分類
- Authors: Nicolas Fraiman, Zichao Li
- Abstract要約: 最寄りのセントロイドに基づく新しい分類法を開発し,これを最寄りのディジョイント・セントロイド分類器と呼ぶ。
本手法は次の2つの側面において最寄りのセントロイド分類器と異なる: (1) 中心ロイドはすべての特徴の代わりに特徴の解離部分集合に基づいて定義され、(2) 距離はユークリッドノルムの代わりに次元正規化ノルムによって誘導される。
- 参考スコア(独自算出の注目度): 6.332832782461923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we develop a new classification method based on nearest
centroid, and it is called the nearest disjoint centroid classifier. Our method
differs from the nearest centroid classifier in the following two aspects: (1)
the centroids are defined based on disjoint subsets of features instead of all
the features, and (2) the distance is induced by the dimensionality-normalized
norm instead of the Euclidean norm. We provide a few theoretical results
regarding our method. In addition, we propose a simple algorithm based on
adapted k-means clustering that can find the disjoint subsets of features used
in our method, and extend the algorithm to perform feature selection. We
evaluate and compare the performance of our method to other closely related
classifiers on both simulated data and real-world gene expression datasets. The
results demonstrate that our method is able to outperform other competing
classifiers by having smaller misclassification rates and/or using fewer
features in various settings and situations.
- Abstract(参考訳): 本稿では,近距離セントロイドに基づく新しい分類法を開発し,最も近距離セントロイド分類器と呼ぶ。
本手法は次の2つの側面において最寄りのセントロイド分類器と異なる: 1) 中心ロイドはすべての特徴の代わりに特徴の解離部分集合に基づいて定義され、(2) 距離はユークリッドノルムの代わりに次元正規化ノルムによって誘導される。
提案手法に関する理論的結果をいくつか提示する。
さらに,本手法で使用する特徴の分離部分集合を探索し,特徴選択を行うアルゴリズムを拡張した,適応型k-meansクラスタリングに基づく単純なアルゴリズムを提案する。
シミュレーションデータと実世界の遺伝子発現データセットを用いて,本手法の性能を他の密接な分類器と比較した。
提案手法は, 誤分類率を小さくし, 各種設定や状況において少ない特徴を使用すれば, 競合する分類器よりも優れていることを示す。
関連論文リスト
- Supervised Pattern Recognition Involving Skewed Feature Densities [49.48516314472825]
一致する類似度指数に基づくユークリッド距離の分類ポテンシャルと相似性指数を比較する。
隣接する2つの群の密度間の交点を分類する精度を考慮する。
論文 参考訳(メタデータ) (2024-09-02T12:45:18Z) - Canonical Variates in Wasserstein Metric Space [16.668946904062032]
We use the Wasserstein metric to measure distances between distributions, then used by distance-based classification algorithm。
我々の研究の中心は、分類精度を高めるために、ワッサーシュタイン計量空間内の次元の減少である。
本稿では,クラス間変動からクラス内変動への商として定義されたフィッシャー比を最大化する原理に基づく新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-05-24T17:59:21Z) - Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Feature Selection using Sparse Adaptive Bottleneck Centroid-Encoder [1.2487990897680423]
2つ以上のクラスで識別される特徴を決定するために,新しい非線形モデル SABCE (Sparse Adaptive Bottleneckid-Encoder) を導入する。
このアルゴリズムは、高次元生物学的、画像、音声、加速度センサデータなど、様々な実世界のデータセットに適用される。
論文 参考訳(メタデータ) (2023-06-07T21:37:21Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Retrieval-Augmented Classification with Decoupled Representation [31.662843145399044]
そこで本研究では,KNN(Kk$-nearest-neighbor)に基づく拡張分類検索手法を提案する。
分類と検索の共有表現がパフォーマンスを損なうことや,トレーニングの不安定化につながることが判明した。
本手法は,幅広い分類データセットを用いて評価する。
論文 参考訳(メタデータ) (2023-03-23T06:33:06Z) - An enhanced method of initial cluster center selection for K-means
algorithm [0.0]
K-meansアルゴリズムの初期クラスタ選択を改善するための新しい手法を提案する。
Convex Hullアルゴリズムは、最初の2つのセントロイドの計算を容易にし、残りの2つは、以前選択された中心からの距離に応じて選択される。
We obtained only 7.33%, 7.90%, and 0% clustering error in Iris, Letter, and Ruspini data。
論文 参考訳(メタデータ) (2022-10-18T00:58:50Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - Multivariate feature ranking of gene expression data [62.997667081978825]
ペアワイズ相関とペアワイズ整合性に基づく2つの新しい多変量特徴ランキング手法を提案する。
提案手法は, クラスタリング変動, チ・スクエアド, 相関, 情報ゲイン, ReliefF および Significance の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-03T17:19:53Z) - Clustering with Penalty for Joint Occurrence of Objects: Computational
Aspects [0.0]
Hol'y, Sokol および vCern'y クラスタ・オブジェクトのメソッドは、与えられた多くの集合におけるそれらの出現率に基づいている。
この考え方は、同じクラスタ内の同じクラスタから複数のオブジェクトが発生することを最小限にすることを目的としている。
本稿では,本手法の計算的側面について考察する。
論文 参考訳(メタデータ) (2021-02-02T10:39:27Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。