論文の概要: Generation of Granular-Balls for Clustering Based on the Principle of Justifiable Granularity
- arxiv url: http://arxiv.org/abs/2405.06904v1
- Date: Sat, 11 May 2024 04:21:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-14 19:32:15.733369
- Title: Generation of Granular-Balls for Clustering Based on the Principle of Justifiable Granularity
- Title(参考訳): 最適粒度原理に基づくクラスタリング用グラニュラーボールの生成
- Authors: Zhen Zhang, Zihang Jia, Witold Pedrycz,
- Abstract要約: 本稿では,クラスタリングタスクのための新しいGB生成手法を紹介する。
GB のカバレッジと特異性を定義し,GB 品質を評価するための包括的尺度を導入する。
従来のGB生成手法と比較して、新しい手法は生成したGBの全体的な品質を最大化する。
- 参考スコア(独自算出の注目度): 51.58924743533048
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient and robust data clustering remains a challenging task in the field of data analysis. Recent efforts have explored the integration of granular-ball (GB) computing with clustering algorithms to address this challenge, yielding promising results. However, existing methods for generating GBs often rely on single indicators to measure GB quality and employ threshold-based or greedy strategies, potentially leading to GBs that do not accurately capture the underlying data distribution. To address these limitations, this article introduces a novel GB generation method. The originality of this method lies in leveraging the principle of justifiable granularity to measure the quality of a GB for clustering tasks. To be precise, we define the coverage and specificity of a GB and introduce a comprehensive measure for assessing GB quality. Utilizing this quality measure, the method incorporates a binary tree pruning-based strategy and an anomaly detection method to determine the best combination of sub-GBs for each GB and identify abnormal GBs, respectively. Compared to previous GB generation methods, the new method maximizes the overall quality of generated GBs while ensuring alignment with the data distribution, thereby enhancing the rationality of the generated GBs. Experimental results obtained from both synthetic and publicly available datasets underscore the effectiveness of the proposed GB generation method, showcasing improvements in clustering accuracy and normalized mutual information.
- Abstract(参考訳): 効率的で堅牢なデータクラスタリングは、データ分析の分野で依然として難しい課題である。
最近の取り組みでは、この課題に対処するために、グラニュラーボール(GB)コンピューティングとクラスタリングアルゴリズムの統合を検討し、有望な結果を得た。
しかし、GBを生成する既存の方法は、GBの品質を測定し、しきい値に基づく、あるいは欲張りの戦略を採用するために単一の指標に依存することが多いため、基礎となるデータ分布を正確に捉えないGBに繋がる可能性がある。
これらの制約に対処するため,本論文では新しいGB生成手法を提案する。
この手法の独創性は、クラスタリングタスクにおけるGBの品質を測定するために、正当化可能な粒度の原理を活用することである。
正確には、GBのカバレッジと特異性を定義し、GBの品質を評価するための総合的な尺度を導入する。
本手法は,2分木伐採戦略と異常検出手法を併用し,各GBのサブGBの最適な組み合わせと異常GBの識別を行う。
従来のGB生成手法と比較して,データ分布の整合性を確保しつつ,生成したGBの全体的な品質を最大化し,生成したGBの合理性を高める。
合成および公開データセットから得られた実験結果は,提案したGB生成手法の有効性を裏付けるものであり,クラスタリング精度の向上と正規化された相互情報を示している。
関連論文リスト
- GBCT: An Efficient and Adaptive Granular-Ball Clustering Algorithm for Complex Data [49.56145012222276]
粒状球クラスタリング(GBCT)と呼ばれる新しいクラスタリングアルゴリズムを提案する。
GBCTは、従来の点関係ではなく、グラニュラーボールの関係に従ってクラスタを形成する。
グラニュラーボールは様々な複雑なデータに適合するので、GBCTは従来のクラスタリング法よりも非球面データセットにおいてはるかに優れている。
論文 参考訳(メタデータ) (2024-10-17T07:32:05Z) - ADRS-CNet: An adaptive dimensionality reduction selection and classification network for DNA storage clustering algorithms [8.295062627879938]
PCA、UMAP、t-SNEといった手法は、高次元の特徴を低次元空間に投影するために一般的に用いられる。
本稿では,入力DNA配列の特徴を分類する多層パーセプトロンモデルを訓練し,最適次元削減法を適応的に選択する。
論文 参考訳(メタデータ) (2024-08-22T22:26:41Z) - A robust three-way classifier with shadowed granular-balls based on justifiable granularity [53.39844791923145]
我々は、不確実なデータのために、影付きGBの頑健な3方向分類器を構築した。
本モデルでは,不確実なデータ管理を実証し,分類リスクを効果的に軽減する。
論文 参考訳(メタデータ) (2024-07-03T08:54:45Z) - GCC: Generative Calibration Clustering [55.44944397168619]
本稿では,特徴学習と拡張をクラスタリングに組み込む新しいGCC法を提案する。
まず,実検体と実検体間の固有関係を識別する識別的特徴アライメント機構を開発する。
第二に、より信頼性の高いクラスタ割り当てを生成するための自己教師付きメトリック学習を設計する。
論文 参考訳(メタデータ) (2024-04-14T01:51:11Z) - Boost clustering with Gaussian Boson Sampling: a full quantum approach [0.09437521840642138]
ガウスボソンサンプリング(GBS)に基づく新しいクラスタリング手法を提案する。
2つの有名な古典的クラスタリングアルゴリズムを用いて、我々のアプローチをベンチマークする。
その結果,提案手法は,選択した3つの指標のうち2つにおいて,従来の2つのアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2023-07-25T09:05:24Z) - GBG++: A Fast and Stable Granular Ball Generation Method for
Classification [18.611701583873504]
グラニュラーボールコンピューティングは効率的で堅牢でスケーラブルな学習方法である。
既存のGBG法の安定性と効率をさらに改善する必要がある。
まず, 高速かつ安定なGBG (GBG++) 手法を提案する。
論文 参考訳(メタデータ) (2023-05-29T04:00:19Z) - Improving Generative Adversarial Networks with Local Coordinate Coding [150.24880482480455]
GAN(Generative Adversarial Network)は、事前定義された事前分布から現実的なデータを生成することに成功している。
実際には、意味情報はデータから学んだ潜在的な分布によって表現される。
ローカル座標符号化(LCC)を用いたLCCGANモデルを提案する。
論文 参考訳(メタデータ) (2020-07-28T09:17:50Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。