論文の概要: EGGS: Eigen-Gap Guided Search Making Subspace Clustering Easy
- arxiv url: http://arxiv.org/abs/2107.12183v2
- Date: Tue, 27 Jul 2021 01:38:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-28 11:27:04.950261
- Title: EGGS: Eigen-Gap Guided Search Making Subspace Clustering Easy
- Title(参考訳): EGGS: サブスペースクラスタリングを容易にするEigen-Gap Guided Search
- Authors: Jicong Fan, Yiheng Tu, Zhao Zhang, Mingbo Zhao
- Abstract要約: サブスペースクラスタリングのための固有ギャップ誘導探索法を提案する。
理論的、数値的には、より大きい相対固有ギャップを持つラプラシア行列は、しばしばより高いクラスタリング精度と安定性をもたらすことを示す。
本手法は実アプリケーションにおいて高い柔軟性と利便性を有し,計算コストも低い。
- 参考スコア(独自算出の注目度): 20.547648917833698
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The performance of spectral clustering heavily relies on the quality of
affinity matrix. A variety of affinity-matrix-construction methods have been
proposed but they have hyper-parameters to determine beforehand, which requires
strong experience and lead to difficulty in real applications especially when
the inter-cluster similarity is high or/and the dataset is large. On the other
hand, we often have to determine to use a linear model or a nonlinear model,
which still depends on experience. To solve these two problems, in this paper,
we present an eigen-gap guided search method for subspace clustering. The main
idea is to find the most reliable affinity matrix among a set of candidates
constructed by linear and kernel regressions, where the reliability is
quantified by the \textit{relative-eigen-gap} of graph Laplacian defined in
this paper. We show, theoretically and numerically, that the Laplacian matrix
with a larger relative-eigen-gap often yields a higher clustering accuracy and
stability. Our method is able to automatically search the best model and
hyper-parameters in a pre-defined space. The search space is very easy to
determine and can be arbitrarily large, though a relatively compact search
space can reduce the highly unnecessary computation. Our method has high
flexibility and convenience in real applications, and also has low
computational cost because the affinity matrix is not computed by iterative
optimization. We extend the method to large-scale datasets such as MNIST, on
which the time cost is less than 90s and the clustering accuracy is
state-of-the-art. Extensive experiments of natural image clustering show that
our method is more stable, accurate, and efficient than baseline methods.
- Abstract(参考訳): スペクトルクラスタリングの性能は親和性マトリックスの品質に大きく依存する。
様々な親和性-行列-構成法が提案されているが、前もって決定するハイパーパラメータがあり、特にクラスタ間類似度が高い場合やデータセットが大きい場合、特に実際のアプリケーションでは困難となる。
一方、経験に依存している線形モデルや非線形モデルを使うかどうかを判断する必要があることが多い。
本稿では,これら2つの問題を解決するために,部分空間クラスタリングのための固有ガップ誘導探索法を提案する。
主アイデアは、線形回帰と核回帰によって構築された候補群の中で最も信頼性の高い親和性行列を見出すことであり、ここでは、この論文で定義されたグラフラプラシアンの \textit{relative-eigen-gap} によって信頼性を定量化する。
理論的および数値的に、相対固有ギャップが大きいラプラシアン行列は、クラスタリングの精度と安定性が高くなることが示されている。
本手法は,事前定義された空間における最良モデルとハイパーパラメータを自動的に探索することができる。
探索空間は非常に容易に決定でき、任意に大きいが、比較的コンパクトな探索空間は、非常に不要な計算を減らすことができる。
提案手法は実アプリケーションにおいて高い柔軟性と利便性を有し,また,アフィニティ行列が反復最適化によって計算されないため,計算コストも低い。
本手法をmnistなどの大規模データセットに拡張し,時間コストが90秒未満でクラスタリング精度が最先端であることを示す。
自然画像クラスタリングの広範な実験により,本手法はベースライン法よりも安定で精度が高く,効率的であることが判明した。
関連論文リスト
- l1-norm regularized l1-norm best-fit lines [3.0963566281269594]
簡単な比率とソート手法を用いた新しいフィッティング法を提案する。
提案アルゴリズムは、O$(n2 m log n)$の最悪の時間複雑性を示し、ある場合にはスパース部分空間に対する大域的最適性を達成する。
論文 参考訳(メタデータ) (2024-02-26T16:30:58Z) - Synergistic eigenanalysis of covariance and Hessian matrices for enhanced binary classification [72.77513633290056]
本稿では, 学習モデルを用いて評価したヘッセン行列をトレーニングセットで評価した共分散行列の固有解析と, 深層学習モデルで評価したヘッセン行列を組み合わせた新しい手法を提案する。
本手法は複雑なパターンと関係を抽出し,分類性能を向上する。
論文 参考訳(メタデータ) (2024-02-14T16:10:42Z) - Manifold Learning with Sparse Regularised Optimal Transport [0.17205106391379024]
実世界のデータセットはノイズの多い観測とサンプリングを受けており、基礎となる多様体に関する情報を蒸留することが大きな課題である。
本稿では,2次正規化を用いた最適輸送の対称版を利用する多様体学習法を提案する。
得られたカーネルは連続的な極限においてLaplace型演算子と整合性を証明し、ヘテロスケダスティックノイズに対する堅牢性を確立し、これらの結果をシミュレーションで示す。
論文 参考訳(メタデータ) (2023-07-19T08:05:46Z) - Clustering based on Mixtures of Sparse Gaussian Processes [6.939768185086753]
低次元の組込み空間を使ってデータをクラスタする方法は、マシンラーニングにおいて依然として難しい問題である。
本稿では,クラスタリングと次元還元の両立を目的とした共同定式化を提案する。
我々のアルゴリズムはスパースガウス過程の混合に基づいており、スパースガウス過程混合クラスタリング(SGP-MIC)と呼ばれる。
論文 参考訳(メタデータ) (2023-03-23T20:44:36Z) - Asymmetric Scalable Cross-modal Hashing [51.309905690367835]
クロスモーダルハッシュは、大規模なマルチメディア検索問題を解決する方法として成功している。
これらの問題に対処する新しい非対称スケーラブルクロスモーダルハッシュ(ASCMH)を提案する。
我々のASCMHは、最先端のクロスモーダルハッシュ法よりも精度と効率の点で優れています。
論文 参考訳(メタデータ) (2022-07-26T04:38:47Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Optimal Variable Clustering for High-Dimensional Matrix Valued Data [3.1138411427556445]
本稿では,行列形式で配置された特徴に対して,新しい潜在変数モデルを提案する。
軽度条件下では,高次元設定でクラスタリングの整合性が得られる。
この重みを使用すれば、アルゴリズムが最小値の速度最適化であることが保証されるという意味で、最適な重みを識別する。
論文 参考訳(メタデータ) (2021-12-24T02:13:04Z) - Solving weakly supervised regression problem using low-rank manifold
regularization [77.34726150561087]
我々は弱い教師付き回帰問題を解く。
weakly"の下では、いくつかのトレーニングポイントではラベルが知られ、未知のものもあれば、無作為なノイズの存在やリソースの欠如などの理由によって不確かであることが分かっています。
数値的な節ではモンテカルロモデルを用いて提案手法を人工と実のデータセットに適用した。
論文 参考訳(メタデータ) (2021-04-13T23:21:01Z) - Kernel k-Means, By All Means: Algorithms and Strong Consistency [21.013169939337583]
Kernel $k$クラスタリングは、非線形データの教師なし学習のための強力なツールである。
本稿では,最適化された局所解に対処するための一般的な手法を応用した結果を一般化する。
我々のアルゴリズムは、この非線形分離問題をよりよく解くために、Magricalization-minimization (MM) を利用している。
論文 参考訳(メタデータ) (2020-11-12T16:07:18Z) - Multi-View Spectral Clustering with High-Order Optimal Neighborhood
Laplacian Matrix [57.11971786407279]
マルチビュースペクトルクラスタリングは、データ間の固有のクラスタ構造を効果的に明らかにすることができる。
本稿では,高次最適近傍ラプラシア行列を学習するマルチビュースペクトルクラスタリングアルゴリズムを提案する。
提案アルゴリズムは, 1次ベースと高次ベースの両方の線形結合の近傍を探索し, 最適ラプラシア行列を生成する。
論文 参考訳(メタデータ) (2020-08-31T12:28:40Z) - Multi-Objective Matrix Normalization for Fine-grained Visual Recognition [153.49014114484424]
双線形プールは細粒度視覚認識(FGVC)において大きな成功を収める
近年,行列パワー正規化は双線形特徴量において2次情報を安定化させることができることが示されている。
両線形表現を同時に正規化できる効率的な多目的行列正規化法(MOMN)を提案する。
論文 参考訳(メタデータ) (2020-03-30T08:40:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。