論文の概要: Deep Distribution-preserving Incomplete Clustering with Optimal
Transport
- arxiv url: http://arxiv.org/abs/2103.11424v1
- Date: Sun, 21 Mar 2021 15:43:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 13:11:59.962414
- Title: Deep Distribution-preserving Incomplete Clustering with Optimal
Transport
- Title(参考訳): 最適輸送を用いた深部分布保存不完全クラスタリング
- Authors: Mingjie Luo, Siwei Wang, Xinwang Liu, Wenxuan Tu, Yi Zhang, Xifeng
Guo, Sihang Zhou and En Zhu
- Abstract要約: DDIC-OT(Deep Distribution-preserving Incomplete Clustering with Optimal Transport)と呼ばれる新しい深層不完全クラスタリング手法を提案する。
提案ネットワークは, 既存の不完全クラスタリング手法に対して, 異なる欠落率で優れたクラスタリング性能を実現する。
- 参考スコア(独自算出の注目度): 43.0056459311929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering is a fundamental task in the computer vision and machine learning
community. Although various methods have been proposed, the performance of
existing approaches drops dramatically when handling incomplete
high-dimensional data (which is common in real world applications). To solve
the problem, we propose a novel deep incomplete clustering method, named Deep
Distribution-preserving Incomplete Clustering with Optimal Transport (DDIC-OT).
To avoid insufficient sample utilization in existing methods limited by few
fully-observed samples, we propose to measure distribution distance with the
optimal transport for reconstruction evaluation instead of traditional
pixel-wise loss function. Moreover, the clustering loss of the latent feature
is introduced to regularize the embedding with more discrimination capability.
As a consequence, the network becomes more robust against missing features and
the unified framework which combines clustering and sample imputation enables
the two procedures to negotiate to better serve for each other. Extensive
experiments demonstrate that the proposed network achieves superior and stable
clustering performance improvement against existing state-of-the-art incomplete
clustering methods over different missing ratios.
- Abstract(参考訳): クラスタリングはコンピュータビジョンと機械学習コミュニティにおける基本的なタスクである。
様々な手法が提案されているが、既存の手法の性能は不完全な高次元データを扱う際に劇的に低下する。
そこで本研究では,ddic-ot(ddic-ot)を用いた深層分布保存型不完全クラスタリング法を提案する。
完全観測サンプルが少ない既存手法では, 試料利用の不十分さを回避するため, 従来の画素単位の損失関数ではなく, 最適輸送量を用いて分布距離を計測することを提案する。
さらに,潜伏特徴のクラスタリング損失を導入し,より識別能力の高い組込みを規則化する。
その結果、不足している機能に対するネットワークの堅牢性が向上し、クラスタリングとサンプルインプテーションを組み合わせた統一フレームワークによって、2つの手続きが相互によりよいサービスを提供するために交渉できるようになる。
大規模実験により,提案ネットワークは,既存の不完全クラスタリング手法に対して,異なる欠落率で優れたクラスタリング性能を向上できることが実証された。
関連論文リスト
- Stable Cluster Discrimination for Deep Clustering [7.175082696240088]
ディープクラスタリングは、インスタンスの表現(つまり、表現学習)を最適化し、固有のデータ分散を探索することができる。
結合された目的は、すべてのインスタンスが一様機能に崩壊する、自明な解決策を意味する。
本研究では,1段階クラスタリングにおいて,教師あり学習における一般的な識別タスクが不安定であることを示す。
新規な安定クラスタ識別(SeCu)タスクを提案し、それに応じて新しいハードネス対応クラスタリング基準を得ることができる。
論文 参考訳(メタデータ) (2023-11-24T06:43:26Z) - Enhancing Clustering Representations with Positive Proximity and Cluster
Dispersion Learning [9.396177578282176]
PIPCDRと呼ばれる新しいエンドツーエンドのディープクラスタリング手法を提案する。
PIPCDRは正のインスタンス近接損失とクラスタ分散正規化器を組み込んでいる。
エンドツーエンドのMajorize-MinimizationフレームワークにおけるPIPCDRの有効性を広範囲に検証する。
論文 参考訳(メタデータ) (2023-11-01T06:12:02Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Neural Capacitated Clustering [6.155158115218501]
本稿では,クラスタセンターへのポイントの割り当て確率を予測するニューラルネットワークを学習する,容量クラスタリング問題(CCP)の新しい手法を提案する。
人工データと2つの実世界のデータセットに関する実験では、我々のアプローチは文学の最先端の数学的および解法よりも優れています。
論文 参考訳(メタデータ) (2023-02-10T09:33:44Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Task Agnostic and Post-hoc Unseen Distribution Detection [27.69612483621752]
本稿では,タスク非依存かつポストホックな未確認分布検出(TAPUDD)手法を提案する。
トレーニングデータセットの特徴をクラスタ化し、すべてのクラスタからテストサンプルの最小マハラノビス距離を決定するTAP-Mahalanobisで構成されている。
提案手法は,多様なタスクにまたがる未知のサンプルを効果的に検出し,既存のベースラインと同等あるいは同等に動作することを示す。
論文 参考訳(メタデータ) (2022-07-26T17:55:15Z) - Deep Multi-View Semi-Supervised Clustering with Sample Pairwise
Constraints [10.226754903113164]
本稿では,ネットワークファインタニングにおける3種類の損失を協調的に最適化するDMSC法を提案する。
提案手法は,最先端のマルチビューやシングルビューの競合よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-10T08:51:56Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Hybrid Dynamic Contrast and Probability Distillation for Unsupervised
Person Re-Id [109.1730454118532]
非監督的人物再識別(Re-Id)は、リードワールドビデオ監視システムにおける実践的応用により注目されている。
本稿では,ハイブリッド動的クラスタコントラストと確率蒸留アルゴリズムを提案する。
教師なしRe-Id問題を局所-言語的ダイナミックコントラスト学習と自己教師付き確率蒸留の枠組みに統合する。
論文 参考訳(メタデータ) (2021-09-29T02:56:45Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。