論文の概要: A novel initialisation based on hospital-resident assignment for the
k-modes algorithm
- arxiv url: http://arxiv.org/abs/2002.02701v1
- Date: Fri, 7 Feb 2020 10:20:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-03 04:17:07.078949
- Title: A novel initialisation based on hospital-resident assignment for the
k-modes algorithm
- Title(参考訳): k-modesアルゴリズムのための病院住民割当てに基づく新しい初期化
- Authors: Henry Wilde, Vincent Knight, Jonathan Gillard
- Abstract要約: 本稿では,k-modesアルゴリズムの初期解を選択する新しい方法を提案する。
これは、数学的公正性の概念と、文献から共通の初期化ができないデータの活用を可能にする。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a new way of selecting an initial solution for the
k-modes algorithm that allows for a notion of mathematical fairness and a
leverage of the data that the common initialisations from literature do not.
The method, which utilises the Hospital-Resident Assignment Problem to find the
set of initial cluster centroids, is compared with the current initialisations
on both benchmark datasets and a body of newly generated artificial datasets.
Based on this analysis, the proposed method is shown to outperform the other
initialisations in the majority of cases, especially when the number of
clusters is optimised. In addition, we find that our method outperforms the
leading established method specifically for low-density data.
- Abstract(参考訳): 本稿では,kモードアルゴリズムの初期解を選択する新しい方法を提案する。これは,数学的公平性の概念と,文献からの共通初期化が得られないデータの活用を可能にするものである。
本手法は,初期クラスタセンタロイドのセットを見つけるために,病院における代入問題を利用する手法であり,ベンチマークデータセットと新たに生成された人工データセットの両方の現在の初期化と比較する。
この分析に基づいて,提案手法は,特にクラスタ数を最適化した場合において,ほとんどのケースで他の初期化よりも優れることを示した。
また,本手法は,低密度データに特有な既定手法よりも優れていることがわかった。
関連論文リスト
- A Weighted K-Center Algorithm for Data Subset Selection [70.49696246526199]
サブセット選択は、トレーニングデータの小さな部分を特定する上で重要な役割を果たす、基本的な問題である。
我々は,k中心および不確かさサンプリング目的関数の重み付け和に基づいて,サブセットを計算する新しい係数3近似アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-12-17T04:41:07Z) - $k$-Median Clustering via Metric Embedding: Towards Better
Initialization with Differential Privacy [31.963659189956367]
一般計量空間における$k$-median問題に対する新しいHSTスキームを開発する。
そこで本研究では,新しい探索アルゴリズムを提案する。
私たちのアプローチは、$k$-means問題にも拡張できます。
論文 参考訳(メタデータ) (2022-06-26T14:58:36Z) - Gradient Based Clustering [72.15857783681658]
本稿では,クラスタリングの品質を計測するコスト関数の勾配を用いて,距離に基づくクラスタリングの一般的な手法を提案する。
アプローチは反復的な2段階の手順(クラスタ割り当てとクラスタセンターのアップデートの代替)であり、幅広い機能に適用できる。
論文 参考訳(メタデータ) (2022-02-01T19:31:15Z) - Estimating leverage scores via rank revealing methods and randomization [50.591267188664666]
任意のランクの正方形密度あるいはスパース行列の統計レバレッジスコアを推定するアルゴリズムについて検討した。
提案手法は,高密度およびスパースなランダム化次元性還元変換の合成と階調明細化法を組み合わせることに基づく。
論文 参考訳(メタデータ) (2021-05-23T19:21:55Z) - Data-driven Weight Initialization with Sylvester Solvers [72.11163104763071]
本稿では,ディープニューラルネットワークのパラメータを初期化するためのデータ駆動方式を提案する。
提案手法は,特にショットや微調整の設定において有効であることを示す。
論文 参考訳(メタデータ) (2021-05-02T07:33:16Z) - A Deep Learning Object Detection Method for an Efficient Clusters
Initialization [6.365889364810239]
クラスタリングは、銀行顧客のプロファイリング、文書検索、画像セグメンテーション、Eコマースレコメンデーションエンジンなど、多くのアプリケーションで使用されている。
既存のクラスタリング技術には、初期化パラメータに対する安定性の信頼性という大きな制限がある。
本稿では,計算オーバーヘッドとリソースオーバーヘッドの少ない最適クラスタリングパラメータを提供するソリューションを提案する。
論文 参考訳(メタデータ) (2021-04-28T08:34:25Z) - Scalable Initialization Methods for Large-Scale Clustering [0.0]
K平均クラスタリングのための2つの新しい手法を提案する。
提案手法はスケーラブルであり、並列で実行できる。
実験の結果,提案手法は最先端技術と良好に比較できることがわかった。
論文 参考訳(メタデータ) (2020-07-23T11:29:53Z) - Optimal Randomized First-Order Methods for Least-Squares Problems [56.05635751529922]
このアルゴリズムのクラスは、最小二乗問題に対する最も高速な解法のうち、いくつかのランダム化手法を含んでいる。
我々は2つの古典的埋め込み、すなわちガウス射影とアダマール変換のサブサンプリングに焦点を当てる。
得られたアルゴリズムは条件数に依存しない最小二乗問題の解法として最も複雑である。
論文 参考訳(メタデータ) (2020-02-21T17:45:32Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。