論文の概要: KNN and K-means in Gini Prametric Spaces
- arxiv url: http://arxiv.org/abs/2501.18028v1
- Date: Wed, 29 Jan 2025 22:35:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-31 15:14:38.737672
- Title: KNN and K-means in Gini Prametric Spaces
- Title(参考訳): ギニプラメトリック空間におけるKNNとK平均
- Authors: Cassandra Mussard, Arthur Charpentier, Stéphane Mussard,
- Abstract要約: 本稿では、Gini prametric space の概念に基づく K-means と K-nearest の隣り合うアルゴリズムの革新的拡張を紹介する。
Giniベースの測度には、値ベースの情報とランクベースの情報の両方が含まれており、ノイズや外れ値に対する堅牢性を改善している。
- 参考スコア(独自算出の注目度): 10.07016279786904
- License:
- Abstract: This paper introduces innovative enhancements to the K-means and K-nearest neighbors (KNN) algorithms based on the concept of Gini prametric spaces. Unlike traditional distance metrics, Gini-based measures incorporate both value-based and rank-based information, improving robustness to noise and outliers. The main contributions of this work include: proposing a Gini-based measure that captures both rank information and value distances; presenting a Gini K-means algorithm that is proven to converge and demonstrates resilience to noisy data; and introducing a Gini KNN method that performs competitively with state-of-the-art approaches such as Hassanat's distance in noisy environments. Experimental evaluations on 14 datasets from the UCI repository demonstrate the superior performance and efficiency of Gini-based algorithms in clustering and classification tasks. This work opens new avenues for leveraging rank-based measures in machine learning and statistical analysis.
- Abstract(参考訳): 本稿では,Gini prametric space の概念に基づく K-means および K-nearest neighbors (KNN) アルゴリズムの革新的拡張を紹介する。
従来の距離測度とは異なり、Giniベースの測度には、値ベースの情報とランクベースの情報の両方が含まれており、ノイズや外れ値に対する堅牢性が改善されている。
この研究の主な貢献は、ランク情報と値距離の両方をキャプチャするGiniベースの測度の提案、収束してノイズの多いデータに対するレジリエンスを示すGini K-meansアルゴリズムの提案、ノイズの多い環境におけるHassanatの距離のような最先端のアプローチと競合するGini KNN手法の導入である。
UCIレポジトリからの14のデータセットに対する実験的評価は、クラスタリングと分類タスクにおいて、Giniベースのアルゴリズムの性能と効率が優れていることを示している。
この研究は、機械学習と統計分析におけるランクに基づく尺度を活用するための新しい道を開く。
関連論文リスト
- An Approach Towards Learning K-means-friendly Deep Latent Representation [0.6798775532273751]
クラスタリングは、データマイニングにおける長年の問題領域である。
ディープニューラルネットワークの出現により、この問題に対する一般的なアプローチは、データを比較的低次元の潜在空間にマッピングすることである。
良く知られたセントロイドベースのクラスタリングアルゴリズムはK平均である。
論文 参考訳(メタデータ) (2024-11-29T06:28:38Z) - K-GBS3FCM -- KNN Graph-Based Safe Semi-Supervised Fuzzy C-Means [0.0]
本稿では,KNNグラフを用いた半教師付きファジィc-meansアルゴリズム(K-GBS3FCM)を提案する。
K-Nearest Neighbors (KNN)アルゴリズムを用いてラベル付きおよびラベルなしデータの近傍関係を動的に評価する。
ラベル付きデータの影響を正規化パラメータと平均安全性度によって調整する機構を提案する。
論文 参考訳(メタデータ) (2024-11-22T04:48:58Z) - K-Means Clustering With Incomplete Data with the Use of Mahalanobis Distances [0.0]
我々は従来のユークリッド距離の代わりにマハラノビス距離を組み込む統一K平均アルゴリズムを開発した。
我々のアルゴリズムはスタンドアローンの計算とK平均の両方を一貫して上回ることを示す。
これらの結果は、IRISデータセットと楕円型クラスタでランダムに生成されたデータの両方にわたって保持される。
論文 参考訳(メタデータ) (2024-10-31T00:05:09Z) - MIK: Modified Isolation Kernel for Biological Sequence Visualization, Classification, and Clustering [3.9146761527401424]
本研究は,ガウスカーネルの代替として,改良分離カーネル (MIK) と呼ばれる新しいアプローチを提案する。
MIKは適応密度推定を用いて局所構造をより正確に捉え、ロバストネス対策を統合する。
局所的および大域的な構造の保存を改善し、組込み空間におけるクラスタとサブクラスタのより良い可視化を可能にする。
論文 参考訳(メタデータ) (2024-10-21T06:57:09Z) - Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Interactive Segmentation as Gaussian Process Classification [58.44673380545409]
クリックベースのインタラクティブセグメンテーション(IS)は、ユーザインタラクション下で対象オブジェクトを抽出することを目的としている。
現在のディープラーニング(DL)ベースの手法のほとんどは、主にセマンティックセグメンテーションの一般的なパイプラインに従っている。
本稿では,各画像上でガウス過程(GP)に基づく画素単位のバイナリ分類モデルとしてISタスクを定式化することを提案する。
論文 参考訳(メタデータ) (2023-02-28T14:01:01Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Noise-robust Graph Learning by Estimating and Leveraging Pairwise
Interactions [123.07967420310796]
本稿では,グラフ上のノイズノード分類のためのペアワイズフレームワークを提案することにより,そのギャップを埋める。
PI-GNNは、ノイズの多いノードクラスラベルからのポイントワイズ学習に加えて、PIを一次学習プロキシとして依存している。
提案するフレームワークPI-GNNは,(1)PIラベルを適応的に推定する信頼度を考慮したPI推定モデル,(2)PIラベルを推定する疎結合トレーニング手法の2つの新しい構成要素に寄与する。
論文 参考訳(メタデータ) (2021-06-14T14:23:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。