論文の概要: Predictive K-means with local models
- arxiv url: http://arxiv.org/abs/2012.09630v1
- Date: Wed, 16 Dec 2020 10:49:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-03 02:53:15.056389
- Title: Predictive K-means with local models
- Title(参考訳): 局所モデルを用いた予測k平均
- Authors: Vincent Lemaire, Oumaima Alaoui Ismaili, Antoine Cornu\'ejols,
Dominique Gay
- Abstract要約: 予測クラスタリングは、2つの世界のベストを獲得しようとします。
この手法を用いて2つの新しいアルゴリズムを提案し、予測性能に競争力があることを様々なデータセットで示す。
- 参考スコア(独自算出の注目度): 0.028675177318965035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Supervised classification can be effective for prediction but sometimes weak
on interpretability or explainability (XAI). Clustering, on the other hand,
tends to isolate categories or profiles that can be meaningful but there is no
guarantee that they are useful for labels prediction. Predictive clustering
seeks to obtain the best of the two worlds. Starting from labeled data, it
looks for clusters that are as pure as possible with regards to the class
labels. One technique consists in tweaking a clustering algorithm so that data
points sharing the same label tend to aggregate together. With distance-based
algorithms, such as k-means, a solution is to modify the distance used by the
algorithm so that it incorporates information about the labels of the data
points. In this paper, we propose another method which relies on a change of
representation guided by class densities and then carries out clustering in
this new representation space. We present two new algorithms using this
technique and show on a variety of data sets that they are competitive for
prediction performance with pure supervised classifiers while offering
interpretability of the clusters discovered.
- Abstract(参考訳): 教師付き分類は予測に有効であるが、解釈可能性や説明可能性(XAI)に弱い場合もある。
一方、クラスタリングは意味のあるカテゴリやプロファイルを分離する傾向がありますが、ラベルの予測に有用である保証はありません。
予測的クラスタリングは2つの世界の最高のものを得ようとしている。
ラベル付きデータから始めて、クラスラベルに関して可能な限り純粋なクラスタを探す。
1つのテクニックはクラスタリングアルゴリズムを微調整することで、同じラベルを共有するデータポイントが集約される傾向がある。
k-meansのような距離ベースのアルゴリズムでは、アルゴリズムが使用する距離を変更して、データポイントのラベルに関する情報を取り込むことが解決策となる。
本稿では,クラス密度に導かれる表現の変化に頼り,新たな表現空間でクラスタリングを行う別の手法を提案する。
本稿では,この手法を用いた2つの新しいアルゴリズムを提案し,クラスタの解釈可能性を提供しながら,純粋教師付き分類器による予測性能に競争力があることを示す。
関連論文リスト
- Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - A new approach for evaluating internal cluster validation indices [0.0]
クラスタ検証は、最高の性能のアルゴリズムを選択するために必要である。
追加情報(外部情報)を使わずに、この目的のためにいくつかの指標が提案された。
評価手法は, 地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・地中・
論文 参考訳(メタデータ) (2023-08-02T06:55:33Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - ck-means, a novel unsupervised learning method that combines fuzzy and
crispy clustering methods to extract intersecting data [1.827510863075184]
本稿では,2つの特徴以上の共通点を共有するデータをクラスタリングする手法を提案する。
この手法の主な考え方は、ファジィ C-Means (FCM) アルゴリズムを用いてファジィクラスタを生成することである。
このアルゴリズムはまた、シルエット指数(SI)によって与えられるクラスタの一貫性に従って、FCMとk平均アルゴリズムのための最適なクラスタ数を見つけることができる。
論文 参考訳(メタデータ) (2022-06-17T19:29:50Z) - Self-supervised Contrastive Attributed Graph Clustering [110.52694943592974]
我々は,自己教師型コントラストグラフクラスタリング(SCAGC)という,新たな属性グラフクラスタリングネットワークを提案する。
SCAGCでは,不正確なクラスタリングラベルを活用することで,ノード表現学習のための自己教師付きコントラスト損失を設計する。
OOSノードでは、SCAGCはクラスタリングラベルを直接計算できる。
論文 参考訳(メタデータ) (2021-10-15T03:25:28Z) - K-Splits: Improved K-Means Clustering Algorithm to Automatically Detect
the Number of Clusters [0.12313056815753944]
本稿では,k-meansに基づく改良された階層型アルゴリズムであるk-splitsを紹介する。
提案手法の主な利点は,精度と速度である。
論文 参考訳(メタデータ) (2021-10-09T23:02:57Z) - Forest Fire Clustering: Cluster-oriented Label Propagation Clustering
and Monte Carlo Verification Inspired by Forest Fire Dynamics [4.645676097881571]
本稿では,ロバストクラスタを見つけるだけでなく,各データポイントのラベルに対する信頼性スコアを提供する新しい手法を提案する。
具体的には,森林火災後のモデルにラベル伝播クラスタリングを再構成した。
論文 参考訳(メタデータ) (2021-03-22T13:02:37Z) - Structured Graph Learning for Clustering and Semi-supervised
Classification [74.35376212789132]
データの局所構造とグローバル構造の両方を保存するためのグラフ学習フレームワークを提案する。
本手法は, サンプルの自己表現性を利用して, 局所構造を尊重するために, 大域的構造と適応的隣接アプローチを捉える。
我々のモデルは、ある条件下でのカーネルk平均法とk平均法の組合せと等価である。
論文 参考訳(メタデータ) (2020-08-31T08:41:20Z) - LSD-C: Linearly Separable Deep Clusters [145.89790963544314]
ラベルなしデータセットのクラスタを識別する新しい手法であるLSD-Cを提案する。
本手法は,最近の半教師付き学習の実践からインスピレーションを得て,クラスタリングアルゴリズムと自己教師付き事前学習と強力なデータ拡張を組み合わせることを提案する。
CIFAR 10/100, STL 10, MNIST, および文書分類データセットReuters 10Kなど, 一般的な公開画像ベンチマークにおいて, 当社のアプローチが競合より大幅に優れていたことを示す。
論文 参考訳(メタデータ) (2020-06-17T17:58:10Z) - Enhancement of Short Text Clustering by Iterative Classification [0.0]
反復分類は、外乱のないクラスターを得るために外乱除去を適用する。
クラスタ分布に基づいて非アウトレーヤを用いて分類アルゴリズムを訓練する。
これを何回か繰り返すことで、より改良されたテキストのクラスタリングが得られる。
論文 参考訳(メタデータ) (2020-01-31T02:12:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。