論文の概要: On Matrix Factorizations in Subspace Clustering
- arxiv url: http://arxiv.org/abs/2106.12016v1
- Date: Tue, 22 Jun 2021 18:42:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-24 15:23:53.052374
- Title: On Matrix Factorizations in Subspace Clustering
- Title(参考訳): サブスペースクラスタリングにおける行列分解について
- Authors: Reeshad Arian, Keaton Hamm
- Abstract要約: 本稿ではCUR分解を用いたサブスペースクラスタリングアルゴリズムについて検討する。
これらのアルゴリズムにおける様々なハイパーパラメータが2つの実世界のベンチマークデータセットのクラスタリング性能に与える影響について検討する。
- 参考スコア(独自算出の注目度): 0.913755431537592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This article explores subspace clustering algorithms using CUR
decompositions, and examines the effect of various hyperparameters in these
algorithms on clustering performance on two real-world benchmark datasets, the
Hopkins155 motion segmentation dataset and the Yale face dataset. Extensive
experiments are done for a variety of sampling methods and oversampling
parameters for these datasets, and some guidelines for parameter choices are
given for practical applications.
- Abstract(参考訳): 本稿では,cur分解を用いたサブスペースクラスタリングアルゴリズムについて検討し,これらのアルゴリズムにおける様々なハイパーパラメータが,実世界のベンチマークデータセットであるホプキンス155モーションセグメンテーションデータセットとイェール顔データセットのクラスタリング性能に与える影響について検討する。
これらのデータセットに対する様々なサンプリング手法とオーバーサンプリングパラメータに対して大規模な実験を行い、実用的な応用のためにパラメータ選択のためのガイドラインを提示する。
関連論文リスト
- Transfer Learning in $\ell_1$ Regularized Regression: Hyperparameter Selection Strategy based on Sharp Asymptotic Analysis [3.5374094795720854]
転送学習技術は、複数の関連するデータセットからの情報を活用し、ターゲットデータセットに対する予測品質を向上させることを目的としている。
トランス・ラッソ(Trans-Lasso)とプレトレーニング・ラッソ(Pretraining Lasso)である。
レプリカ法を用いて解析することにより,高次元環境下でのアルゴリズムの徹底的,精密な研究を行う。
微調整段階に転送される2種類の情報の1つを無視することは、一般化性能にはほとんど影響しない。
論文 参考訳(メタデータ) (2024-09-26T10:20:59Z) - Interpetable Target-Feature Aggregation for Multi-Task Learning based on Bias-Variance Analysis [53.38518232934096]
マルチタスク学習(MTL)は、タスク間の共有知識を活用し、一般化とパフォーマンスを改善するために設計された強力な機械学習パラダイムである。
本稿では,タスククラスタリングと特徴変換の交点におけるMTL手法を提案する。
両段階において、鍵となる側面は減った目標と特徴の解釈可能性を維持することである。
論文 参考訳(メタデータ) (2024-06-12T08:30:16Z) - Enabling clustering algorithms to detect clusters of varying densities
through scale-invariant data preprocessing [5.116665993717368]
本稿では,「サブサンプルのアンサンブル上の平均ランク」と呼ばれる,ランク変換の変種を用いた事前処理により,クラスタリングアルゴリズムがデータの表現に頑健であることを示す。
最も広く使われている3つのクラスタリングアルゴリズムを用いて得られた実験結果から、ARES変換後のクラスタリングがより良く、より一貫性のある結果をもたらすことを示す。
論文 参考訳(メタデータ) (2024-01-21T04:51:15Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Human Motion Detection Using Sharpened Dimensionality Reduction and
Clustering [1.1172382217477126]
本研究では,高次元データの2次元投影を容易にラベル付けするためのクラスタリング手法を提案する。
我々は、SDRのパイプラインと、さまざまな合成および実世界のデータセット上でクラスタリング方法をテストする。
我々は、クラスタリングSDRの結果が、クラスタリングプレーンDRよりも優れたラベル付け結果をもたらすことを結論し、k-meansがSDRの推奨クラスタリング方法であることを示す。
論文 参考訳(メタデータ) (2022-02-23T18:18:25Z) - Flattening Multiparameter Hierarchical Clustering Functors [1.52292571922932]
マルチパラメータ階層クラスタリングのフラット化手法を提案する。
次に,データからクラスタリングパラメータを学習するためのベイズ更新アルゴリズムを提案する。
このアルゴリズムの平坦化手順による構成が整合性を満たすことを実証する。
論文 参考訳(メタデータ) (2021-04-30T03:10:20Z) - Fuzzy clustering algorithms with distance metric learning and entropy
regularization [0.0]
本稿では,ユークリッド,シティブロック,マハラノビス距離とエントロピー正規化に基づくファジィクラスタリングアルゴリズムを提案する。
合成および実データセットに関するいくつかの実験は、ノイズの多い画像テクスチャセグメンテーションへの応用を含む、これらの適応クラスタリング手法の有用性を実証している。
論文 参考訳(メタデータ) (2021-02-18T18:19:04Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z) - Clustering Binary Data by Application of Combinatorial Optimization
Heuristics [52.77024349608834]
本稿では,2値データのクラスタリング手法について検討し,まず,クラスタのコンパクトさを計測するアグリゲーション基準を定義した。
近隣地域と人口動態最適化メタヒューリスティックスを用いた5つの新しいオリジナル手法が導入された。
準モンテカルロ実験によって生成された16のデータテーブルから、L1の相似性と階層的クラスタリング、k-means(メドイドやPAM)の1つのアグリゲーションの比較を行う。
論文 参考訳(メタデータ) (2020-01-06T23:33:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。