論文の概要: K-GBS3FCM -- KNN Graph-Based Safe Semi-Supervised Fuzzy C-Means
- arxiv url: http://arxiv.org/abs/2411.14728v1
- Date: Fri, 22 Nov 2024 04:48:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 18:36:36.842000
- Title: K-GBS3FCM -- KNN Graph-Based Safe Semi-Supervised Fuzzy C-Means
- Title(参考訳): K-GBS3FCM -- KNNグラフベースの半監督型ファジィC平均
- Authors: Gabriel Santos, Rita Julia, Marcelo Nascimento,
- Abstract要約: 本稿では,KNNグラフを用いた半教師付きファジィc-meansアルゴリズム(K-GBS3FCM)を提案する。
K-Nearest Neighbors (KNN)アルゴリズムを用いてラベル付きおよびラベルなしデータの近傍関係を動的に評価する。
ラベル付きデータの影響を正規化パラメータと平均安全性度によって調整する機構を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Clustering data using prior domain knowledge, starting from a partially labeled set, has recently been widely investigated. Often referred to as semi-supervised clustering, this approach leverages labeled data to enhance clustering accuracy. To maximize algorithm performance, it is crucial to ensure the safety of this prior knowledge. Methods addressing this concern are termed safe semi-supervised clustering (S3C) algorithms. This paper introduces the KNN graph-based safety-aware semi-supervised fuzzy c-means algorithm (K-GBS3FCM), which dynamically assesses neighborhood relationships between labeled and unlabeled data using the K-Nearest Neighbors (KNN) algorithm. This approach aims to optimize the use of labeled data while minimizing the adverse effects of incorrect labels. Additionally, it is proposed a mechanism that adjusts the influence of labeled data on unlabeled ones through regularization parameters and the average safety degree. Experimental results on multiple benchmark datasets demonstrate that the graph-based approach effectively leverages prior knowledge to enhance clustering accuracy. The proposed method was significantly superior in 64% of the 56 test configurations, obtaining higher levels of clustering accuracy when compared to other semi-supervised and traditional unsupervised methods. This research highlights the potential of integrating graph-based approaches, such as KNN, with established techniques to develop advanced clustering algorithms, offering significant applications in fields that rely on both labeled and unlabeled data for more effective clustering.
- Abstract(参考訳): 部分的にラベル付けされた集合から始まる事前のドメイン知識を用いたデータのクラスタリングは、最近広く研究されている。
半教師付きクラスタリングと呼ばれることが多いが、このアプローチはクラスタリングの精度を高めるためにラベル付きデータを活用する。
アルゴリズムの性能を最大化するためには、この事前知識の安全性を確保することが不可欠である。
この問題に対処する手法は、安全な半教師付きクラスタリング(S3C)アルゴリズムと呼ばれる。
本稿では,K-Nearest Neighbors(KNN)アルゴリズムを用いて,ラベル付きデータとラベルなしデータの近傍関係を動的に評価する,KNNグラフに基づく半教師付きファジィc-meansアルゴリズム(K-GBS3FCM)を提案する。
提案手法は,不正ラベルの悪影響を最小限に抑えつつ,ラベル付きデータの使用を最適化することを目的としている。
また,ラベル付きデータの影響を正規化パラメータと平均安全性度によって調整する機構を提案する。
複数のベンチマークデータセットの実験結果は、グラフベースのアプローチが事前知識を効果的に活用し、クラスタリングの精度を高めることを実証している。
提案手法は56の試験構成の64%で有意に優れており, 従来の半教師なし手法に比べてクラスタリング精度が高かった。
この研究は、KNNのようなグラフベースのアプローチと高度なクラスタリングアルゴリズムを開発するための確立された技術を統合する可能性を強調し、より効果的なクラスタリングのためにラベル付きデータとラベルなしデータの両方に依存する分野において重要な応用を提供する。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - Outlier Detection with Cluster Catch Digraphs [1.6440434996206625]
本稿では,クラスタ・キャッシュ・ダイグラフ(CCD)に基づく異常検出アルゴリズムを新たに導入する。
そこで我々は,Uniformity-based CCD with Mutual Catch Graph (U-MCCD), The Uniformity- and Neighbor-based CCD with Mutual Catch Graph (UN-MCCD), and their shape-adaptive variants (SU-MCCD and SUN-MCCD)を提案する。
以上の結果から,これらのアルゴリズムは,外乱検出の精度と適応性を大幅に向上させることが示唆された。
論文 参考訳(メタデータ) (2024-09-17T23:08:53Z) - Fuzzy K-Means Clustering without Cluster Centroids [21.256564324236333]
ファジィK平均クラスタリングは教師なしデータ分析において重要な手法である。
本稿では,クラスタセントロイドへの依存を完全に排除する,ファジィテクストK-Meansクラスタリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-04-07T12:25:03Z) - DBGSA: A Novel Data Adaptive Bregman Clustering Algorithm [2.0232038310495435]
本稿では,データセットの初期選択とロバスト性に非常に敏感なクラスタリングアルゴリズムを提案する。
4つのシミュレーションデータセットと6つの実データセットで大規模な実験を行う。
その結果,アルゴリズムの精度は平均63.8%向上した。
論文 参考訳(メタデータ) (2023-07-25T16:37:09Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Influence of Swarm Intelligence in Data Clustering Mechanisms [0.0]
自然にインスパイアされたSwarmベースのアルゴリズムは、データの欠如と一貫性のない大規模なデータセットに対処するために、データクラスタリングに使用される。
本稿では、これらの新しいアプローチの性能を概観し、問題のある状況に最適な方法の比較を行う。
論文 参考訳(メタデータ) (2023-05-07T08:40:50Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Predictive K-means with local models [0.028675177318965035]
予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
論文 参考訳(メタデータ) (2020-12-16T10:49:36Z) - Bayesian Optimization with Machine Learning Algorithms Towards Anomaly
Detection [66.05992706105224]
本稿では,ベイズ最適化手法を用いた効果的な異常検出フレームワークを提案する。
ISCX 2012データセットを用いて検討したアルゴリズムの性能を評価する。
実験結果から, 精度, 精度, 低コストアラームレート, リコールの観点から, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2020-08-05T19:29:35Z) - Semi-Supervised Learning with Meta-Gradient [123.26748223837802]
半教師付き学習における簡単なメタ学習アルゴリズムを提案する。
その結果,提案アルゴリズムは最先端の手法に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2020-07-08T08:48:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。