論文の概要: ThetA -- fast and robust clustering via a distance parameter
- arxiv url: http://arxiv.org/abs/2102.07028v1
- Date: Sat, 13 Feb 2021 23:16:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 16:10:25.482853
- Title: ThetA -- fast and robust clustering via a distance parameter
- Title(参考訳): ThetA -- 距離パラメータによる高速かつ堅牢なクラスタリング
- Authors: Eleftherios Garyfallidis, Shreyas Fadnavis, Jong Sung Park, Bramsh
Qamar Chandio, Javier Guaje, Serge Koudoro, Nasim Anousheh
- Abstract要約: クラスタリングは機械学習の根本的な問題であり、遠隔ベースのアプローチが数十年にわたってこの分野を支配してきた。
Theta-based Algorithms (ThetA) と呼ばれる新しい距離しきい値法を提案する。
- 参考スコア(独自算出の注目度): 3.0020405188885815
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Clustering is a fundamental problem in machine learning where distance-based
approaches have dominated the field for many decades. This set of problems is
often tackled by partitioning the data into K clusters where the number of
clusters is chosen apriori. While significant progress has been made on these
lines over the years, it is well established that as the number of clusters or
dimensions increase, current approaches dwell in local minima resulting in
suboptimal solutions. In this work, we propose a new set of distance threshold
methods called Theta-based Algorithms (ThetA). Via experimental comparisons and
complexity analyses we show that our proposed approach outperforms existing
approaches in: a) clustering accuracy and b) time complexity. Additionally, we
show that for a large class of problems, learning the optimal threshold is
straightforward in comparison to learning K. Moreover, we show how ThetA can
infer the sparsity of datasets in higher dimensions.
- Abstract(参考訳): クラスタリングは機械学習の根本的な問題であり、遠隔ベースのアプローチが数十年にわたってこの分野を支配してきた。
この一連の問題は、クラスタ数を選択したkクラスタにデータを分割することで、しばしば取り組まれる。
長年にわたってこれらのラインに大きな進歩を遂げてきましたが、クラスターや寸法の数が増えるにつれて、現在のアプローチは局所的なミニマに留まり、最適以下の解決策をもたらすことがよく知られています。
本研究では, Theta-based Algorithms (ThetA) と呼ばれる新しい距離しきい値法を提案する。
実験的な比較と複雑性分析により,提案手法が既存のアプローチよりも,a)クラスタリング精度,b)時間複雑性よりも優れていることを示す。
さらに,多くの問題に対して,学習Kと比較して最適なしきい値の学習が簡単なことを示し,さらに,高次元のデータセットの空間性をThetAがいかに推測できるかを示す。
関連論文リスト
- Mostly Beneficial Clustering: Aggregating Data for Operational Decision
Making [3.9825334703672812]
本稿では,クラスタ構造を利用したShrunken-SAA手法を提案する。
問題の数が増えるにつれて、問題間で与えられたクラスタ構造を活用することで、さらなるメリットが得られます。
提案手法は, 軽度条件下での一般的なコスト関数に拡張することができる。
論文 参考訳(メタデータ) (2023-11-29T02:53:32Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Research on Efficient Fuzzy Clustering Method Based on Local Fuzzy
Granular balls [67.33923111887933]
本稿では,データをグラニュラーボールを用いてファジィにイテレーションし,その位置にある2つのグラニュラーボールのみをデータのメンバーシップ度として検討する。
ファジィグラニュラーボールセットは、異なるデータシナリオに直面して、より多くの処理方法を使用することができる。
論文 参考訳(メタデータ) (2023-03-07T01:52:55Z) - Neural Capacitated Clustering [6.155158115218501]
本稿では,クラスタセンターへのポイントの割り当て確率を予測するニューラルネットワークを学習する,容量クラスタリング問題(CCP)の新しい手法を提案する。
人工データと2つの実世界のデータセットに関する実験では、我々のアプローチは文学の最先端の数学的および解法よりも優れています。
論文 参考訳(メタデータ) (2023-02-10T09:33:44Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - A sampling-based approach for efficient clustering in large datasets [0.8952229340927184]
本稿では,多数のクラスタを持つ高次元データに対して,簡便かつ効率的なクラスタリング手法を提案する。
私たちのコントリビューションは、データポイントとクラスタの完全な比較を必要としないため、k-meansよりもはるかに効率的です。
論文 参考訳(メタデータ) (2021-12-29T19:15:20Z) - Differentially-Private Clustering of Easy Instances [67.04951703461657]
異なるプライベートクラスタリングでは、個々のデータポイントに関する情報を公開せずに、$k$のクラスタセンターを特定することが目標だ。
我々は、データが"簡単"である場合にユーティリティを提供する実装可能な差分プライベートクラスタリングアルゴリズムを提供する。
我々は、非プライベートクラスタリングアルゴリズムを簡単なインスタンスに適用し、結果をプライベートに組み合わせることのできるフレームワークを提案する。
論文 参考訳(メタデータ) (2021-12-29T08:13:56Z) - Exact and Approximate Hierarchical Clustering Using A* [51.187990314731344]
クラスタリングのA*探索に基づく新しいアプローチを紹介します。
A*と新しいエンフォレリスデータ構造を組み合わせることで、禁止的に大きな検索空間を克服します。
実験により,本手法は粒子物理利用事例や他のクラスタリングベンチマークにおいて,ベースラインよりもかなり高品質な結果が得られることを示した。
論文 参考訳(メタデータ) (2021-04-14T18:15:27Z) - (k, l)-Medians Clustering of Trajectories Using Continuous Dynamic Time
Warping [57.316437798033974]
本研究では,トラジェクトリの集中型クラスタリングの問題について考察する。
我々はDTWの連続バージョンを距離測定として使用することを提案し、これをCDTW(Continuous dynamic time warping)と呼ぶ。
一連の軌道から中心を計算し、その後反復的に改善する実践的な方法を示す。
論文 参考訳(メタデータ) (2020-12-01T13:17:27Z) - Spectral Clustering with Smooth Tiny Clusters [14.483043753721256]
本稿では,データのスムーズさを初めて考慮した新しいクラスタリングアルゴリズムを提案する。
私たちのキーとなるアイデアは、スムーズなグラフを構成する小さなクラスタをクラスタ化することです。
本稿では,マルチスケールな状況に着目するが,データのスムーズさの考え方はどのクラスタリングアルゴリズムにも確実に拡張できる。
論文 参考訳(メタデータ) (2020-09-10T05:21:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。