論文の概要: Enhancing Cluster Quality of Numerical Datasets with Domain Ontology
- arxiv url: http://arxiv.org/abs/2304.00653v1
- Date: Sun, 2 Apr 2023 23:40:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-04 17:04:01.892314
- Title: Enhancing Cluster Quality of Numerical Datasets with Domain Ontology
- Title(参考訳): 領域オントロジーによる数値データセットのクラスタ品質向上
- Authors: Sudath Rohitha Heiyanthuduwage, Md Anisur Rahman and Md Zahidul Islam
- Abstract要約: オントロジーベースのクラスタリングは、データセットから高品質または低品質のクラスタを生成することができる。
数値データセットにおける属性の次元性を低減するために,ドメインオントロジーに基づくクラスタリング手法を提案する。
提案手法の実験結果から,クラスタの品質は,ドメインオントロジーの下位レベルから上位レベルへと徐々に向上することが示唆された。
- 参考スコア(独自算出の注目度): 2.790947019327459
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ontology-based clustering has gained attention in recent years due to the
potential benefits of ontology. Current ontology-based clustering approaches
have mainly been applied to reduce the dimensionality of attributes in text
document clustering. Reduction in dimensionality of attributes using ontology
helps to produce high quality clusters for a dataset. However, ontology-based
approaches in clustering numerical datasets have not been gained enough
attention. Moreover, some literature mentions that ontology-based clustering
can produce either high quality or low-quality clusters from a dataset.
Therefore, in this paper we present a clustering approach that is based on
domain ontology to reduce the dimensionality of attributes in a numerical
dataset using domain ontology and to produce high quality clusters. For every
dataset, we produce three datasets using domain ontology. We then cluster these
datasets using a genetic algorithm-based clustering technique called
GenClust++. The clusters of each dataset are evaluated in terms of Sum of
Squared-Error (SSE). We use six numerical datasets to evaluate the performance
of our ontology-based approach. The experimental results of our approach
indicate that cluster quality gradually improves from lower to the higher
levels of a domain ontology.
- Abstract(参考訳): オントロジベースのクラスタリングは近年、オントロジの潜在的な利点のために注目を集めている。
現在のオントロジベースのクラスタリングアプローチは、主にテキスト文書のクラスタリングにおける属性の次元性を減らすために適用されている。
オントロジーを用いた属性の次元の削減は、データセットの高品質なクラスタ作成に役立つ。
しかし、クラスタリング数値データセットにおけるオントロジーに基づくアプローチは十分に注目されていない。
さらに、オントロジーに基づくクラスタリングは、データセットから高品質または低品質のクラスタを生成することができる、という文献もある。
そこで,本稿では,ドメインオントロジーを用いた数値データセットにおける属性の次元性を低減し,高品質なクラスタを作成するために,ドメインオントロジーに基づくクラスタリング手法を提案する。
データセット毎にドメインオントロジーを使って3つのデータセットを生成します。
次に、GenClust++と呼ばれる遺伝的アルゴリズムに基づくクラスタリング手法を用いて、これらのデータセットをクラスタ化する。
各データセットのクラスタは、SSE(Sum of Squared-Error)の観点から評価される。
オントロジーに基づく手法の性能評価には,6つの数値データセットを用いる。
提案手法の実験結果から,クラスタの品質は,ドメインオントロジーの下位レベルから上位レベルへと徐々に向上することが示唆された。
関連論文リスト
- ClusterGraph: a new tool for visualization and compression of multidimensional data [0.0]
本稿では,任意のクラスタリングアルゴリズムの出力に付加的なレイヤを提供する。
クラスタリングアルゴリズムから得られたクラスタのグローバルなレイアウトに関する情報を提供する。
論文 参考訳(メタデータ) (2024-11-08T09:40:54Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Using Decision Trees for Interpretable Supervised Clustering [0.0]
教師付きクラスタリングは、高い確率密度でラベル付きデータのクラスタを形成することを目的としている。
特に、特定のクラスのデータのクラスタを見つけ、包括的なルールのセットでクラスタを記述することに興味があります。
論文 参考訳(メタデータ) (2023-07-16T17:12:45Z) - Deep Clustering: A Comprehensive Survey [53.387957674512585]
クラスタリング分析は、機械学習とデータマイニングにおいて必須の役割を果たす。
ディープ・クラスタリングは、ディープ・ニューラルネットワークを使ってクラスタリングフレンドリーな表現を学習することができるが、幅広いクラスタリングタスクに広く適用されている。
ディープクラスタリングに関する既存の調査は、主にシングルビューフィールドとネットワークアーキテクチャに焦点を当てており、クラスタリングの複雑なアプリケーションシナリオを無視している。
論文 参考訳(メタデータ) (2022-10-09T02:31:32Z) - Clustering Optimisation Method for Highly Connected Biological Data [0.0]
接続クラスタリング評価のための単純な指標が,生物データの最適セグメンテーションにつながることを示す。
この作業の斬新さは、混雑したデータをクラスタリングするための単純な最適化方法の作成にある。
論文 参考訳(メタデータ) (2022-08-08T17:33:32Z) - Enhancing cluster analysis via topological manifold learning [0.3823356975862006]
クラスタ化前にデータセットのトポロジ構造を推定することで,クラスタ検出を大幅に向上させることができることを示す。
位相構造を推定するための多様体学習法UMAPと密度に基づくクラスタリング法DBSCANを組み合わせた。
論文 参考訳(メタデータ) (2022-07-01T15:53:39Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - Attention-driven Graph Clustering Network [49.040136530379094]
我々は、注意駆動グラフクラスタリングネットワーク(AGCN)という新しいディープクラスタリング手法を提案する。
AGCNは、ノード属性特徴とトポロジグラフ特徴を動的に融合するために、不均一な融合モジュールを利用する。
AGCNは、教師なしの方法で特徴学習とクラスタ割り当てを共同で行うことができる。
論文 参考訳(メタデータ) (2021-08-12T02:30:38Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。