論文の概要: Clustering with Penalty for Joint Occurrence of Objects: Computational
Aspects
- arxiv url: http://arxiv.org/abs/2102.01424v1
- Date: Tue, 2 Feb 2021 10:39:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-03 16:58:58.615676
- Title: Clustering with Penalty for Joint Occurrence of Objects: Computational
Aspects
- Title(参考訳): オブジェクトの共同発生に対するペナルティによるクラスタリング:計算的側面
- Authors: Ond\v{r}ej Sokol and Vladim\'ir Hol\'y
- Abstract要約: Hol'y, Sokol および vCern'y クラスタ・オブジェクトのメソッドは、与えられた多くの集合におけるそれらの出現率に基づいている。
この考え方は、同じクラスタ内の同じクラスタから複数のオブジェクトが発生することを最小限にすることを目的としている。
本稿では,本手法の計算的側面について考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The method of Hol\'y, Sokol and \v{C}ern\'y (Applied Soft Computing, 2017,
Vol. 60, p. 752-762) clusters objects based on their incidence in a large
number of given sets. The idea is to minimize the occurrence of multiple
objects from the same cluster in the same set. In the current paper, we study
computational aspects of the method. First, we prove that the problem of
finding the optimal clustering is NP-hard. Second, to numerically find a
suitable clustering, we propose to use the genetic algorithm augmented by a
renumbering procedure, a fast task-specific local search heuristic and an
initial solution based on a simplified model. Third, in a simulation study, we
demonstrate that our improvements of the standard genetic algorithm
significantly enhance its computational performance.
- Abstract(参考訳): Hol\'y, Sokol, \v{C}ern\'y (Applied Soft Computing, 2017 Vol) のメソッド。
60, p. 752-762) クラスタオブジェクトは、与えられた多数のセットの入射量に基づく。
アイデアは、同じセット内の同じクラスタから複数のオブジェクトの発生を最小限に抑えることです。
本稿では,本手法の計算的側面について考察する。
まず、最適クラスタリングの問題はNPハードであることが証明される。
第二に、最適なクラスタリングを数値的に見つけるために、再数値化手順、高速なタスク固有の局所探索ヒューリスティック、単純化されたモデルに基づく初期解を用いた遺伝的アルゴリズムを提案する。
第3に, シミュレーション研究により, 標準遺伝的アルゴリズムの改良により, 計算性能が著しく向上することを示す。
関連論文リスト
- From Large to Small Datasets: Size Generalization for Clustering
Algorithm Selection [12.993073967843292]
我々は,未知の地下構造クラスタリングを用いて,半教師付き環境で問題を研究する。
本稿では,クラスタリングアルゴリズムの精度向上のためのサイズ一般化の概念を提案する。
データセット全体においてどのアルゴリズムが最適かを特定するために、データの5%をサブサンプルとして使用しています。
論文 参考訳(メタデータ) (2024-02-22T06:53:35Z) - Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [79.46465138631592]
観測されたラベルを用いてクラスタを復元する効率的なアルゴリズムを考案する。
本稿では,期待値と高い確率でこれらの下位境界との性能を一致させる最初のアルゴリズムであるIACを提案する。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Lattice-Based Methods Surpass Sum-of-Squares in Clustering [98.46302040220395]
クラスタリングは教師なし学習における基本的なプリミティブである。
最近の研究は、低次手法のクラスに対する低い境界を確立している。
意外なことに、この特定のクラスタリングモデルのtextitdoesは、統計的-計算的ギャップを示さない。
論文 参考訳(メタデータ) (2021-12-07T18:50:17Z) - An Exact Algorithm for Semi-supervised Minimum Sum-of-Squares Clustering [0.5801044612920815]
半教師付きMSSCのための分岐結合アルゴリズムを提案する。
背景知識はペアワイズ・マスタリンクと結びつかない制約として組み込まれている。
提案したグローバル最適化アルゴリズムは,実世界のインスタンスを最大800個のデータポイントまで効率的に解決する。
論文 参考訳(メタデータ) (2021-11-30T17:08:53Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Differentially Private Clustering: Tight Approximation Ratios [57.89473217052714]
基本的なクラスタリング問題に対して,効率的な微分プライベートアルゴリズムを提案する。
この結果から,SampleとAggregateのプライバシーフレームワークのアルゴリズムの改善が示唆された。
1-Clusterアルゴリズムで使用されるツールの1つは、ClosestPairのより高速な量子アルゴリズムを適度な次元で得るために利用できる。
論文 参考訳(メタデータ) (2020-08-18T16:22:06Z) - Certifying clusters from sum-of-norms clustering [13.747619681451875]
本稿では,近似解から正しいクラスタ割り当てを同定し,証明するクラスタリングテストを提案する。
提案手法では, クラスタ割り当てが, 十分に多くの繰り返しを経て, 原始二重経路追従アルゴリズムによって保証されることが保証されていることを示す。
論文 参考訳(メタデータ) (2020-06-19T20:26:26Z) - Probabilistic Partitive Partitioning (PPP) [0.0]
クラスタリングアルゴリズムは一般に2つの一般的な問題に直面している。
彼らは異なる初期条件で異なる設定に収束する。
クラスタの数は、事前に任意に決めなければならない。
論文 参考訳(メタデータ) (2020-03-09T19:18:35Z) - Bi-objective Optimization of Biclustering with Binary Data [0.0]
クラスタリングは、いくつかの類似性基準に従って、データオブジェクトをクラスタと呼ばれるサブセットに分割する。
本稿では,クラスタの重複を許容する準クラスタリングについて論じる。
ビクラスタリングは、オブジェクトとフィーチャーを同時にグループ化し、特定のオブジェクトのグループに特別な機能のグループがあるようにします。
論文 参考訳(メタデータ) (2020-02-09T21:49:26Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。