論文の概要: Towards fast DBSCAN via Spectrum-Preserving Data Compression
- arxiv url: http://arxiv.org/abs/2411.11421v1
- Date: Mon, 18 Nov 2024 09:46:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-19 14:32:57.841649
- Title: Towards fast DBSCAN via Spectrum-Preserving Data Compression
- Title(参考訳): スペクトル保存データ圧縮による高速DBSCANの実現に向けて
- Authors: Yongyu Wang,
- Abstract要約: 本稿では,スペクトルデータ圧縮を用いてDBSCANを大幅に高速化する新しい手法を提案する。
提案手法は,本質的なクラスタリング特性を保ちながら,データセットのサイズを5倍に縮小する。
USPSのような実世界のデータセットの実験では、クラスタリング性能を維持しながら、この劇的なデータサイズ削減を実現する方法の能力を実証している。
- 参考スコア(独自算出の注目度): 2.1937382384136637
- License:
- Abstract: This paper introduces a novel method to significantly accelerate DBSCAN by employing spectral data compression. The proposed approach reduces the size of the data set by a factor of five while preserving the essential clustering characteristics through an innovative spectral compression technique. This enables DBSCAN to run substantially faster without any loss of accuracy. Experiments on real-world data sets, such as USPS, demonstrate the method's capability to achieve this dramatic reduction in data size while maintaining clustering performance.
- Abstract(参考訳): 本稿では,スペクトルデータ圧縮を用いてDBSCANを大幅に高速化する新しい手法を提案する。
提案手法は、革新的なスペクトル圧縮技術により、本質的なクラスタリング特性を保ちながら、データセットのサイズを5倍に縮小する。
これにより、DBSCANは精度を損なうことなく、大幅に高速に動作することができる。
USPSのような実世界のデータセットの実験では、クラスタリング性能を維持しながら、この劇的なデータサイズ削減を実現する方法の能力を実証している。
関連論文リスト
- Scalable Density-based Clustering with Random Projections [9.028773906859541]
本稿では,コサイン距離の高い高次元密度クラスタリングアルゴリズムであるsDBSCANを提案する。
実証的には、sDBSCANは、現実世界の百万点データセット上の他の多くのクラスタリングアルゴリズムよりもはるかに高速で精度が高い。
論文 参考訳(メタデータ) (2024-02-24T01:45:51Z) - Data Structures for Density Estimation [66.36971978162461]
p$のサブリニア数($n$)が与えられた場合、主な結果は$k$のサブリニアで$v_i$を識別する最初のデータ構造になります。
また、Acharyaなどのアルゴリズムの改良版も提供します。
論文 参考訳(メタデータ) (2023-06-20T06:13:56Z) - Lossy Compression of Large-Scale Radio Interferometric Data [0.0]
本研究は,ベースライン依存型損失圧縮技術を用いて,可視データ量を削減することを提案する。
MeerKAT と European Very Long Baseline Interferometry Network を基準望遠鏡として,提案手法の性能評価・比較を行っている。
論文 参考訳(メタデータ) (2023-04-14T10:50:24Z) - Learned Accelerator Framework for Angular-Distance-Based
High-Dimensional DBSCAN [7.949962335466427]
DBSCANのような従来の密度ベースのクラスタリング技術は、高次元データ上での劣化性能を持つ。
本稿では,従来のDBSCANとサンプリングに基づくDBSCANの変種を高速化する汎用的な学習アクセラレータフレームワークであるLAFを提案する。
評価の結果, LAF強化DBSCAN法は, 効率と品質の両面で, 最先端のDBSCAN法よりも優れていた。
論文 参考訳(メタデータ) (2023-02-06T21:49:03Z) - DR-DSGD: A Distributionally Robust Decentralized Learning Algorithm over
Graphs [54.08445874064361]
本稿では,分散環境下での正規化された分散ロバストな学習問題を解くことを提案する。
Kullback-Liebler正規化関数をロバストなmin-max最適化問題に追加することにより、学習問題を修正されたロバストな問題に還元することができる。
提案アルゴリズムは, 最低分布検定精度を最大10%向上できることを示す。
論文 参考訳(メタデータ) (2022-08-29T18:01:42Z) - Automating DBSCAN via Deep Reinforcement Learning [73.82740568765279]
本稿では,DBSCANの自動パラメータ検索フレームワークであるDRL-DBSCANを提案する。
このフレームワークは、クラスタリング環境をマルコフ決定プロセスとして知覚することで、パラメータ探索方向を調整する過程をモデル化する。
このフレームワークはDBSCANクラスタリングの精度を最大で26%、25%改善している。
論文 参考訳(メタデータ) (2022-08-09T04:40:11Z) - High Performance Out-of-sample Embedding Techniques for Multidimensional
Scaling [0.5156484100374058]
我々は,大規模なデータに対するMDSアルゴリズムを拡張するために,サンプル外埋め込み(OSE)ソリューションを提案する。
我々は2つのOSE技術を提案する。1つは最適化アプローチに基づくもので、もう1つはニューラルネットワークモデルに基づくものである。
論文 参考訳(メタデータ) (2021-11-07T12:36:33Z) - Visual Cluster Separation Using High-Dimensional Sharpened
Dimensionality Reduction [65.80631307271705]
高次元シャープ化DR(HD-SDR)は、合成データセットと実世界のデータセットの両方で試験される。
提案手法は,高品質(品質指標による測定)を達成し,大規模高次元データを用いて計算的に精度よくスケールする。
具体的な応用を説明するため,近年の天文カタログにHD-SDRを適用した。
論文 参考訳(メタデータ) (2021-10-01T11:13:51Z) - How to distribute data across tasks for meta-learning? [59.608652082495624]
タスクごとのデータポイントの最適な数は予算に依存しますが、それは大きな予算のためのユニークな一定の値に収束します。
この結果から,データ収集の簡便かつ効率的な手順が示唆された。
論文 参考訳(メタデータ) (2021-03-15T15:38:47Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Faster DBSCAN via subsampled similarity queries [42.93847281082316]
DBSCANは密度に基づくクラスタリングアルゴリズムとして人気がある。
本稿では,サブサンプルである$epsilon$-neighborhoodグラフに基づいてクラスタをクラスタ化するSNG-DBSCANを提案する。
論文 参考訳(メタデータ) (2020-06-11T18:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。