論文の概要: A New Index for Clustering Evaluation Based on Density Estimation
- arxiv url: http://arxiv.org/abs/2207.01294v1
- Date: Mon, 4 Jul 2022 09:54:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 00:21:51.729340
- Title: A New Index for Clustering Evaluation Based on Density Estimation
- Title(参考訳): 密度推定に基づくクラスタリング評価のための新しい指標
- Authors: Gangli Liu
- Abstract要約: クラスタリングの内部評価のための新しい指標が導入された。
インデックスは2つのサブインデックスの混合として定義される。
新しいインデックスの性能をテストする実験を行う。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A new index for internal evaluation of clustering is introduced. The index is
defined as a mixture of two sub-indices. The first sub-index $ I_a $ is called
the Ambiguous Index; the second sub-index $ I_s $ is called the Similarity
Index. Calculation of the two sub-indices is based on density estimation to
each cluster of a partition of the data. An experiment is conducted to test the
performance of the new index, and compared with three popular internal
clustering evaluation indices -- Calinski-Harabasz index, Silhouette
coefficient, and Davies-Bouldin index, on a set of 145 datasets. The result
shows the new index improves the three popular indices by 59\%, 34\%, and 74\%,
correspondingly.
- Abstract(参考訳): クラスタリングの内部評価のための新しい指標を導入する。
インデックスは2つのサブインデックスの混合として定義される。
最初のサブインデックス $ I_a $ は Ambiguous Index と呼ばれ、2番目のサブインデックス $ I_s $ は similarity Index と呼ばれる。
2つのサブインデックスの計算は、データのパーティションの各クラスタに対する密度推定に基づいている。
新しいインデックスのパフォーマンスをテストする実験を行い、145のデータセットのセット上で、calinski-harabasz index、silhouette coefficient、davies-bouldin indexという3つの一般的な内部クラスタリング評価指標と比較した。
その結果,新しい指標は,3つの人気指標を59\%,34\%,74\%,それぞれ改善することが示された。
関連論文リスト
- A Bayesian cluster validity index [0.0]
クラスタ妥当性指標(CVI)は、データセット内のクラスタの最適な数を特定するように設計されている。
既存の指標に基づくベイズクラスタ妥当性指数(BCVI)を導入する。
私たちのBCVIは、ユーザの専門知識が価値のある状況において明確なアドバンテージを提供しています。
論文 参考訳(メタデータ) (2024-02-03T14:23:36Z) - A correlation-based fuzzy cluster validity index with secondary options
detector [0.0]
本稿では,Wiroonsri-Preedasawakul(WP)インデックスとして知られる相関に基づくファジィクラスタの妥当性指標を提案する。
我々は,Xie-Beni,Pakhira-Bandyopadhyay-Maulik,Tang,Wu-Li,Generalized C,Kwon2などの既存指標と比較した。
論文 参考訳(メタデータ) (2023-08-28T16:40:34Z) - On Exploring Node-feature and Graph-structure Diversities for Node Drop
Graph Pooling [86.65151066870739]
現在のノードドロッププーリング法は、ノードの特徴やグラフ構造の観点からグラフの多様性を無視し、結果としてグラフレベル以下の表現をもたらす。
そこで本稿では,textiti.fltextbfIpscore と textbfDropscore の2つの操作を持つ textbfMulti スコア空間からなる MID を新たに提案する。
具体的には、多次元スコア空間は、複数の基準を通してノードの重要さを描いており、フリップスコアは異種ノードの維持を奨励している。
論文 参考訳(メタデータ) (2023-06-22T08:02:01Z) - How to Index Item IDs for Recommendation Foundation Models [49.425959632372425]
Recommendation foundation modelは、リコメンデーションタスクを自然言語タスクに変換することで、リコメンデーションのために大きな言語モデル(LLM)を利用する。
過剰に長いテキストや幻覚的なレコメンデーションを生成するのを避けるために、LCM互換のアイテムIDを作成することが不可欠である。
本稿では,シーケンシャルインデックス,協調インデックス,セマンティックインデックス(コンテンツベース)インデックス,ハイブリッドインデックスの4つを提案する。
論文 参考訳(メタデータ) (2023-05-11T05:02:37Z) - A novel cluster internal evaluation index based on hyper-balls [11.048887848164268]
クラスタ分析において、品質を評価し、最適なクラスタ数を決定することが重要である。
本稿では,データセットの多粒度特徴付けを行い,ハイパーボールを得る。
ハイパーボール(HCVI)に基づくクラスタ内部評価指標を定義する。
論文 参考訳(メタデータ) (2022-12-30T02:56:40Z) - End-to-End Learning to Index and Search in Large Output Spaces [95.16066833532396]
Extreme Multi-label Classification (XMC) は現実世界の問題を解決するための一般的なフレームワークである。
本稿では,木系インデックスを特殊重み付きグラフベースインデックスに緩和する新しい手法を提案する。
ELIASは、数百万のラベルを持つ大規模極端分類ベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-10-16T01:34:17Z) - NFL: Robust Learned Index via Distribution Transformation [14.812854942243503]
本稿では、学習インデックスを構築する前に、鍵にテキスト分布変換を適用することで近似問題に取り組む。
2段階の正規化フローベース学習インデックスフレームワーク (NFL) が提案され、最初に元の複雑な鍵分布をほぼ一様に変換し、次に変換された鍵を利用する学習インデックスを構築する。
変換キーの特性に基づいて、ロバストなアフターフロー学習指標(AFLI)を提案する。
論文 参考訳(メタデータ) (2022-05-24T06:03:19Z) - LSI: A Learned Secondary Index Structure [24.324528705706104]
本研究では,未分類データのインデックス化に学習指標を使用する最初の試みであるLearnered secondary Index(LSI)を紹介する。
LSIは最先端のセカンダリインデックスに匹敵するルックアップ性能を実現し,空間効率を最大6倍に向上することを示す。
論文 参考訳(メタデータ) (2022-05-11T20:49:44Z) - A Pluggable Learned Index Method via Sampling and Gap Insertion [48.900186573181735]
データベースインデックスは、データ検索を促進し、現実世界のシステムにおける幅広いアプリケーションに役立つ。
近年,隠れて有用なデータ分布を学習するために,learning indexという新しいインデックスが提案されている。
学習指標の学習効率と学習効率を高めるための2つの一般的なテクニックとプラグイン可能なテクニックを研究します。
論文 参考訳(メタデータ) (2021-01-04T07:17:23Z) - The Case for Learned Spatial Indexes [62.88514422115702]
我々は、空間範囲の問合せに答えるために、最先端の学習した多次元インデックス構造(すなわちFlood)から提案した手法を用いる。
i) パーティション内の機械学習検索は、1次元でフィルタリングを使用する場合の2進探索よりも11.79%速く、39.51%高速であることを示す。
また、2次元でフィルタする最も近い競合相手の1.23倍から1.83倍の速さで機械学習インデックスを精査する。
論文 参考訳(メタデータ) (2020-08-24T12:09:55Z) - PointGroup: Dual-Set Point Grouping for 3D Instance Segmentation [111.7241018610573]
私たちは、インスタンスセグメンテーションのための新しいエンドツーエンドボトムアップアーキテクチャであるPointGroupを紹介します。
我々は2分岐ネットワークを設計し、ポイントの特徴を抽出し、セマンティックラベルとオフセットを予測し、各ポイントをそれぞれのインスタンスセントロイドに向けてシフトさせる。
クラスタリングコンポーネントは、元のおよびオフセットシフトされた点座標セットの両方を利用するために、その相補的な強度を利用する。
ScanNet v2 と S3DIS の2つの挑戦的データセットに対する広範な実験を行い、ScanNet v2 と S3DIS が最も高い性能を達成し、63.6% と 64.0% の2つを以前のベストが達成した54.9% と54.4% と比較した。
論文 参考訳(メタデータ) (2020-04-03T16:26:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。