論文の概要: MPCC: Matching Priors and Conditionals for Clustering
- arxiv url: http://arxiv.org/abs/2008.09641v1
- Date: Fri, 21 Aug 2020 18:35:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 22:04:13.431445
- Title: MPCC: Matching Priors and Conditionals for Clustering
- Title(参考訳): MPCC: クラスタリングの優先順位と条件のマッチング
- Authors: Nicol\'as Astorga, Pablo Huijse, Pavlos Protopapas and Pablo Est\'evez
- Abstract要約: クラスタリングは教師なし学習における基本的なタスクであり、使用されるデータ表現に大きく依存する。
データから潜在変数やクラスタカテゴリを推論するエンコーダを備えたGANモデルであるMPCC(Matching Priors and Conditionals for Clustering)を提案する。
実験の結果,学習可能な事前追加とエンコーダ更新数の増加により,生成したサンプルの品質が向上することがわかった。
- 参考スコア(独自算出の注目度): 3.441021278275805
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering is a fundamental task in unsupervised learning that depends
heavily on the data representation that is used. Deep generative models have
appeared as a promising tool to learn informative low-dimensional data
representations. We propose Matching Priors and Conditionals for Clustering
(MPCC), a GAN-based model with an encoder to infer latent variables and cluster
categories from data, and a flexible decoder to generate samples from a
conditional latent space. With MPCC we demonstrate that a deep generative model
can be competitive/superior against discriminative methods in clustering tasks
surpassing the state of the art over a diverse set of benchmark datasets. Our
experiments show that adding a learnable prior and augmenting the number of
encoder updates improve the quality of the generated samples, obtaining an
inception score of 9.49 $\pm$ 0.15 and improving the Fr\'echet inception
distance over the state of the art by a 46.9% in CIFAR10.
- Abstract(参考訳): クラスタリングは、使用されるデータ表現に大きく依存する教師なし学習の基本的なタスクである。
深層生成モデルは情報的低次元データ表現を学習するための有望なツールとして現れてきた。
クラスタリング(mpcc)と,データから潜在変数やクラスタのカテゴリを推論するエンコーダを備えたganベースのモデル,条件付き潜在空間からサンプルを生成するフレキシブルデコーダを提案する。
MPCCでは,多種多様なベンチマークデータセットを超越したクラスタリングタスクにおいて,深層生成モデルと差別的手法との競争・優位性を実証する。
CIFAR10で46.9%の精度でFr'echet開始距離を向上し, 先行学習とエンコーダ更新数の増加により, 生成したサンプルの品質が向上し, 9.49$\pm$ 0.15のインセプションスコアが得られた。
関連論文リスト
- Hierarchical Clustering for Conditional Diffusion in Image Generation [12.618079575423868]
本稿では,階層クラスタ上で拡散モデルを用いて,高品質なクラスタ固有世代を得る,深層生成モデルであるTreeDiffusionを紹介する。
提案するパイプラインは,データの階層構造を学習するVAEベースのクラスタリングモデルと,クラスタ毎に現実的な画像を生成する条件拡散モデルである。
論文 参考訳(メタデータ) (2024-10-22T11:35:36Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - A Deep Dive into Deep Cluster [0.2578242050187029]
DeepClusterは、ビジュアル表現のシンプルでスケーラブルな教師なし事前トレーニングである。
本稿では,DeepClusterの収束と性能が,畳み込み層のランダムフィルタの品質と選択されたクラスタ数の相互作用に依存することを示す。
論文 参考訳(メタデータ) (2022-07-24T22:55:09Z) - ClusterQ: Semantic Feature Distribution Alignment for Data-Free
Quantization [111.12063632743013]
本稿では,ClusterQと呼ばれるデータフリーな量子化手法を提案する。
意味的特徴のクラス間分離性を高めるために,特徴分布統計をクラスタ化し,整列する。
また、クラス内分散を組み込んで、クラスワイドモードの崩壊を解決する。
論文 参考訳(メタデータ) (2022-04-30T06:58:56Z) - Augmented Data as an Auxiliary Plug-in Towards Categorization of
Crowdsourced Heritage Data [2.609784101826762]
本稿では,データ拡張を補助プラグインとして導入することで,非効率なクラスタリング性能の問題を緩和する戦略を提案する。
我々は、深層クラスタリングのための新しいモデルとして初期特徴空間を構築するために、拡張データを用いた畳み込みオートエンコーダ(CAE)の変種を訓練する。
論文 参考訳(メタデータ) (2021-07-08T14:09:39Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Variational Auto Encoder Gradient Clustering [0.0]
近年,ディープニューラルネットワークモデルを用いたクラスタリングが広く研究されている。
本稿では、より良いクラスタリングを実現するために確率関数勾配上昇を使用してデータを処理する方法を検討する。
DBSCANクラスタリングアルゴリズムに基づいて,データに適したクラスタ数を調べるための簡便かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2021-05-11T08:00:36Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - Contrastive Clustering [57.71729650297379]
本稿では,インスタンスレベルのコントラスト学習を明示的に行うContrastive Clustering (CC)を提案する。
特にCCは、CIFAR-10(CIFAR-100)データセット上で0.705(0.431)のNMIを達成しており、最高のベースラインと比較して最大19%(39%)のパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-09-21T08:54:40Z) - Autoencoder-based time series clustering with energy applications [0.0]
時系列クラスタリングは、データの特定の性質のため、難しい作業である。
本稿では,畳み込み型オートエンコーダとk-メノイドアルゴリズムの組み合わせによる時系列クラスタリングについて検討する。
論文 参考訳(メタデータ) (2020-02-10T10:04:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。