論文の概要: Distributional Reduction: Unifying Dimensionality Reduction and
Clustering with Gromov-Wasserstein Projection
- arxiv url: http://arxiv.org/abs/2402.02239v1
- Date: Sat, 3 Feb 2024 19:00:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-06 21:28:32.702410
- Title: Distributional Reduction: Unifying Dimensionality Reduction and
Clustering with Gromov-Wasserstein Projection
- Title(参考訳): 分布低減:Gromov-Wasserstein射影による次元化とクラスタリング
- Authors: Hugues Van Assel, C\'edric Vincent-Cuaz, Nicolas Courty, R\'emi
Flamary, Pascal Frossard, Titouan Vayer
- Abstract要約: 教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
伝統的に、これは次元還元法を用いて解釈可能な空間にデータを投影したり、意味のあるクラスタにポイントを整理する。
私たちは新しい視点 – 流通の視点 – を提供しています。
我々はクラスタリングと次元還元を分散還元と呼ばれる単一のフレームワークに統合する。
- 参考スコア(独自算出の注目度): 50.51460159104604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised learning aims to capture the underlying structure of potentially
large and high-dimensional datasets. Traditionally, this involves using
dimensionality reduction methods to project data onto interpretable spaces or
organizing points into meaningful clusters. In practice, these methods are used
sequentially, without guaranteeing that the clustering aligns well with the
conducted dimensionality reduction. In this work, we offer a fresh perspective:
that of distributions. Leveraging tools from optimal transport, particularly
the Gromov-Wasserstein distance, we unify clustering and dimensionality
reduction into a single framework called distributional reduction. This allows
us to jointly address clustering and dimensionality reduction with a single
optimization problem. Through comprehensive experiments, we highlight the
versatility and interpretability of our method and show that it outperforms
existing approaches across a variety of image and genomics datasets.
- Abstract(参考訳): 教師なし学習は、潜在的に大きな高次元データセットの構造を捉えることを目的としている。
伝統的に、これは次元還元法を用いて解釈可能な空間にデータを投影したり、意味のあるクラスタにポイントを整理する。
実際には、これらの手法は、クラスタリングが実行された次元削減とうまく一致することを保証することなく、順次使用される。
この仕事において、私たちは新しい視点、すなわち分布の観点を提示します。
最適な輸送、特にグロモフ・ワッサーシュタイン距離からツールを活用することで、クラスタリングと次元還元を分散還元と呼ばれる単一のフレームワークに統合する。
これにより、単一の最適化問題でクラスタリングと次元縮小を共同で解決できる。
総合的な実験により,本手法の汎用性と解釈性を強調し,様々な画像およびゲノミクスデータセットにまたがる既存手法よりも優れていることを示す。
関連論文リスト
- Fast and Scalable Semi-Supervised Learning for Multi-View Subspace Clustering [13.638434337947302]
FSSMSCは、既存のアプローチで一般的に見られる高い計算複雑性に対する新しいソリューションである。
この手法は、各データポイントを選択されたランドマークの疎線型結合として表現し、すべてのビューにまたがるコンセンサスアンカーグラフを生成する。
FSSMSCの有効性と効率は、様々なスケールの複数のベンチマークデータセットに対する広範な実験を通して検証される。
論文 参考訳(メタデータ) (2024-08-11T06:54:00Z) - Interpolating between Clustering and Dimensionality Reduction with
Gromov-Wasserstein [13.656958543737211]
入力と埋め込みサンプルの対応性は、半緩和されたGromov-Wasserstein最適輸送問題によって計算される。
埋め込みの次元が制約されない場合、OTプランが競合するハードクラスタリングを提供することを示す。
論文 参考訳(メタデータ) (2023-10-05T09:04:53Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Towards Understanding and Mitigating Dimensional Collapse in Heterogeneous Federated Learning [112.69497636932955]
フェデレートラーニングは、プライバシを考慮したデータ共有を必要とせずに、さまざまなクライアントでモデルをトレーニングすることを目的としている。
本研究では,データの不均一性がグローバル集約モデルの表現に与える影響について検討する。
フェデレーション学習における次元的崩壊を効果的に緩和する新しい手法である sc FedDecorr を提案する。
論文 参考訳(メタデータ) (2022-10-01T09:04:17Z) - Adaptively-weighted Integral Space for Fast Multiview Clustering [54.177846260063966]
線形複雑度に近い高速マルチビュークラスタリングのための適応重み付き積分空間(AIMC)を提案する。
特に、ビュー生成モデルは、潜在積分空間からのビュー観測を再構成するために設計されている。
いくつかの実世界のデータセットで実施された実験は、提案したAIMC法の優位性を確認した。
論文 参考訳(メタデータ) (2022-08-25T05:47:39Z) - CCP: Correlated Clustering and Projection for Dimensionality Reduction [5.992724190105578]
Correlated Clustering and Projectionは、マトリックスを解決する必要のない、新しいデータドメイン戦略を提供する。
CCPは、高次元の機能を相関クラスタに分割し、各クラスタの相関した機能を1次元の表現に分割する。
提案手法は、さまざまな機械学習アルゴリズムに関連するベンチマークデータセットを用いて検証される。
論文 参考訳(メタデータ) (2022-06-08T23:14:44Z) - Inferring Manifolds From Noisy Data Using Gaussian Processes [17.166283428199634]
ほとんどの既存の多様体学習アルゴリズムは、元のデータを低次元座標で置き換える。
本稿では,これらの問題に対処するための新しい手法を提案する。
論文 参考訳(メタデータ) (2021-10-14T15:50:38Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - Hierarchical regularization networks for sparsification based learning
on noisy datasets [0.0]
階層は、連続的により微細なスケールで特定される近似空間から従う。
各スケールでのモデル一般化を促進するため,複数次元にわたる新規な射影型ペナルティ演算子も導入する。
その結果、合成データセットと実データセットの両方において、データ削減およびモデリング戦略としてのアプローチの性能が示された。
論文 参考訳(メタデータ) (2020-06-09T18:32:24Z) - Two-Dimensional Semi-Nonnegative Matrix Factorization for Clustering [50.43424130281065]
TS-NMFと呼ばれる2次元(2次元)データに対する新しい半負行列分解法を提案する。
前処理ステップで2次元データをベクトルに変換することで、データの空間情報に深刻なダメージを与える既存の手法の欠点を克服する。
論文 参考訳(メタデータ) (2020-05-19T05:54:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。