論文の概要: Uniform tensor clustering by jointly exploring sample affinities of
various orders
- arxiv url: http://arxiv.org/abs/2302.01569v1
- Date: Fri, 3 Feb 2023 06:43:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-06 17:15:00.768427
- Title: Uniform tensor clustering by jointly exploring sample affinities of
various orders
- Title(参考訳): 様々な順序のサンプル親和性を共同で探索する一様テンソルクラスタリング
- Authors: Hongmin Cai, Fei Qi, Junyu Li, Yu Hu, Yue Zhang, Yiu-ming Cheung, and
Bin Hu
- Abstract要約: 複数サンプルの親和性を利用してサンプル近接を特徴付ける統一テンソルクラスタリング法(UTC)を提案する。
UTCは、高次元データを処理する際に異なる順序親和性を利用することによりクラスタリングを強化することが確認される。
- 参考スコア(独自算出の注目度): 37.11798745294855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conventional clustering methods based on pairwise affinity usually suffer
from the concentration effect while processing huge dimensional features yet
low sample sizes data, resulting in inaccuracy to encode the sample proximity
and suboptimal performance in clustering. To address this issue, we propose a
unified tensor clustering method (UTC) that characterizes sample proximity
using multiple samples' affinity, thereby supplementing rich spatial sample
distributions to boost clustering. Specifically, we find that the triadic
tensor affinity can be constructed via the Khari-Rao product of two affinity
matrices. Furthermore, our early work shows that the fourth-order tensor
affinity is defined by the Kronecker product. Therefore, we utilize
arithmetical products, Khatri-Rao and Kronecker products, to mathematically
integrate different orders of affinity into a unified tensor clustering
framework. Thus, the UTC jointly learns a joint low-dimensional embedding to
combine various orders. Finally, a numerical scheme is designed to solve the
problem. Experiments on synthetic datasets and real-world datasets demonstrate
that 1) the usage of high-order tensor affinity could provide a supplementary
characterization of sample proximity to the popular affinity matrix; 2) the
proposed method of UTC is affirmed to enhance clustering by exploiting
different order affinities when processing high-dimensional data.
- Abstract(参考訳): ペアワイズアフィニティに基づく従来のクラスタリング手法では,大規模な特徴量を持つがサンプルサイズの低いデータを処理する場合,集中効果に支障をきたすことが多い。
この問題に対処するために,複数サンプルの親和性を用いてサンプル近接を特徴付ける統一テンソルクラスタリング法 (UTC) を提案する。
具体的には、2つの親和行列のハリ・ラオ積を通して三進テンソル親和性を構築することができる。
さらに、初期の研究は、4階テンソル親和性がクロネッカー積によって定義されることを示している。
そこで我々は算術積khatri-rao と kronecker product を用いて,異なる親和性次数を統一テンソルクラスタリングフレームワークに数学的に統合する。
したがって、UTCは様々な順序を組み合わせるために共同で低次元埋め込みを学習する。
最後に,この問題を解決するために数値スキームを考案する。
合成データセットと実世界のデータセットの実験
1) 高次テンソル親和性の使用は,一般的な親和性マトリックスに近接する試料の補足的特徴を与えることができる。
2) 提案手法は, 高次元データを処理する際に異なる次数親和性を生かしてクラスタリングを強化する。
関連論文リスト
- Multi-View Clustering via Semi-non-negative Tensor Factorization [120.87318230985653]
半負のテンソル因子分解(Semi-NTF)に基づく新しいマルチビュークラスタリングを開発する。
本モデルは、ビュー間の関係を直接考慮し、ビュー間の補完情報を利用する。
さらに,提案手法の最適化アルゴリズムを提案し,そのアルゴリズムが常に定常KKT点に収束することを数学的に証明する。
論文 参考訳(メタデータ) (2023-03-29T14:54:19Z) - Multiway clustering of 3-order tensor via affinity matrix [0.0]
親和性行列(MCAM)を用いた3階テンソルのマルチウェイクラスタリング法を提案する。
テンソルスライスと各スライスに関する情報の拡散の類似性の概念に基づいて、我々は高度なクラスタリング法を適用した親和性/相似性行列を構築した。
MCAMは、他の既知の合成アルゴリズムや実際のデータセットと比較して、競合的な結果が得られる。
論文 参考訳(メタデータ) (2023-03-14T10:02:52Z) - Semi-Supervised Subspace Clustering via Tensor Low-Rank Representation [64.49871502193477]
本稿では,初期監視情報を同時に拡張し,識別親和性行列を構築することのできる,新しい半教師付きサブスペースクラスタリング手法を提案する。
6つの一般的なベンチマークデータセットの総合的な実験結果から,本手法が最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-05-21T01:47:17Z) - Improving Spectral Clustering Using Spectrum-Preserving Node Reduction [1.52292571922932]
我々は、スペクトル保存ノード還元を用いて固有分解を加速し、データセットの簡潔な表現を生成する。
実験の結果,最先端手法と比較してクラスタリング性能が劇的に向上した。
論文 参考訳(メタデータ) (2021-10-24T01:43:12Z) - Clustering Ensemble Meets Low-rank Tensor Approximation [50.21581880045667]
本稿では,複数のクラスタリングを組み合わせ,個々のクラスタリングよりも優れたパフォーマンスを実現するクラスタリングアンサンブルの問題について検討する。
本稿では,この問題をグローバルな視点から解くために,新しい低ランクテンソル近似法を提案する。
7つのベンチマークデータセットを用いた実験の結果,提案手法は12の最先端手法と比較して,クラスタリング性能のブレークスルーを達成した。
論文 参考訳(メタデータ) (2020-12-16T13:01:37Z) - Doubly Stochastic Subspace Clustering [9.815735805354905]
多くの最先端サブスペースクラスタリング法は、まずデータポイント間の親和性行列を構築し、その親和性にスペクトルクラスタリングを適用することによって、2段階のプロセスに従う。
本研究では、データの自己表現表現と、スペクトルクラスタリングによく正規化された親和性行列の両方を学習する。
実験により,コンピュータビジョンにおける多くの共通データセットに対して,最先端のサブスペースクラスタリング性能が得られた。
論文 参考訳(メタデータ) (2020-11-30T14:56:54Z) - A Novel Granular-Based Bi-Clustering Method of Deep Mining the
Co-Expressed Genes [76.84066556597342]
ビクラスタリング法は、サンプル(遺伝子)のサブセットが試験条件下で協調的に制御されるバイクラスタをマイニングするために用いられる。
残念ながら、従来の二クラスタ法はそのような二クラスタを発見するのに完全には効果がない。
本稿では,グラニュラーコンピューティングの理論を取り入れた新しい2クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-05-12T02:04:40Z) - Multi-View Spectral Clustering Tailored Tensor Low-Rank Representation [105.33409035876691]
本稿では,テンソル低ランクモデルに基づくマルチビュースペクトルクラスタリング(MVSC)の問題について検討する。
MVSCに適合する新しい構造テンソル低ランクノルムを設計する。
提案手法は最先端の手法よりもかなり優れていることを示す。
論文 参考訳(メタデータ) (2020-04-30T11:52:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。