論文の概要: Transferable Deep Metric Learning for Clustering
- arxiv url: http://arxiv.org/abs/2302.06523v1
- Date: Mon, 13 Feb 2023 17:09:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 14:43:46.903793
- Title: Transferable Deep Metric Learning for Clustering
- Title(参考訳): クラスタリングのための転送可能なDeep Metric Learning
- Authors: Simo Alami.C, Rim Kaddah, Jesse Read
- Abstract要約: 高い空間におけるクラスタリングは難しい作業であり、通常の次元距離のメトリクスは次元性の呪いの下ではもはや適切ではないかもしれない。
ラベル付きデータセットでメトリクスを学習し、異なるデータセットにそれを適用できることを示します。
少数のラベル付きトレーニングデータセットと浅いネットワークを使用しながら、最先端技術と競合する結果を得る。
- 参考スコア(独自算出の注目度): 1.2762298148425795
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Clustering in high dimension spaces is a difficult task; the usual distance
metrics may no longer be appropriate under the curse of dimensionality. Indeed,
the choice of the metric is crucial, and it is highly dependent on the dataset
characteristics. However a single metric could be used to correctly perform
clustering on multiple datasets of different domains. We propose to do so,
providing a framework for learning a transferable metric. We show that we can
learn a metric on a labelled dataset, then apply it to cluster a different
dataset, using an embedding space that characterises a desired clustering in
the generic sense. We learn and test such metrics on several datasets of
variable complexity (synthetic, MNIST, SVHN, omniglot) and achieve results
competitive with the state-of-the-art while using only a small number of
labelled training datasets and shallow networks.
- Abstract(参考訳): 高次元空間におけるクラスタリングは難しい作業であり、通常の距離メトリクスは次元性の呪いの下ではもはや適切ではないかもしれない。
実際、メートル法の選択は極めて重要であり、データセットの特徴に大きく依存している。
しかし、単一のメトリックを使用して、異なるドメインの複数のデータセットでクラスタリングを正しく実行することができる。
転送可能なメトリックを学習するためのフレームワークを提供することを提案する。
ラベル付きデータセットでメトリクスを学習し、それを異なるデータセットをクラスタ化するために適用できることを、一般的な意味で望ましいクラスタ化を特徴付ける埋め込み空間を使って示します。
変動複雑性のいくつかのデータセット(合成、MNIST、SVHN、omniglot)でそのようなメトリクスを学び、少数のラベル付きトレーニングデータセットと浅いネットワークを使用して最先端技術と競合する結果を得る。
関連論文リスト
- MNIST-Nd: a set of naturalistic datasets to benchmark clustering across dimensions [46.67219141114834]
実世界のデータセットの重要な特性を共有する合成データセットの集合であるMNIST-Ndを提案する。
MNIST-NdはMNIST上で2から64の潜伏次元を持つ混合変分オートエンコーダによって得られる。
MNIST-Ndの予備的な共通クラスタリングアルゴリズムベンチマークは、ライデンが成長する次元に対して最も堅牢であることを示している。
論文 参考訳(メタデータ) (2024-10-21T15:51:30Z) - Can an unsupervised clustering algorithm reproduce a categorization system? [1.0485739694839669]
ラベル付きデータセットにおいて、教師なしクラスタリングが真理クラスを再現できるかどうかを検討する。
成功は特徴選択と選択した距離測定に依存することを示す。
論文 参考訳(メタデータ) (2024-08-19T18:27:14Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Mixed-type Distance Shrinkage and Selection for Clustering via Kernel Metric Learning [0.0]
我々は、混合カーネルを用いて異種性を測定するKDSUMと呼ばれる計量を提案する。
我々は、KDSUMが既存の混合型メトリクスから均一な異性度メトリクスへの縮小法であることを実証した。
論文 参考訳(メタデータ) (2023-06-02T19:51:48Z) - DMS: Differentiable Mean Shift for Dataset Agnostic Task Specific
Clustering Using Side Information [0.0]
我々は、サイド情報から直接データをクラスタリングすることを学ぶ新しいアプローチを提案する。
クラスタの数、その中心、あるいは類似性に関するあらゆる種類の距離メートル法を知る必要はありません。
本手法は,特定のタスクのニーズに応じて,同じデータポイントを様々な方法で分割することができる。
論文 参考訳(メタデータ) (2023-05-29T13:45:49Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - AutoGeoLabel: Automated Label Generation for Geospatial Machine Learning [69.47585818994959]
リモートセンシングデータのためのラベルの自動生成のためのビッグデータ処理パイプラインを評価する。
我々は,大規模データプラットフォームであるIBM PAIRSを用いて,密集都市部でそのようなラベルを動的に生成する。
論文 参考訳(メタデータ) (2022-01-31T20:02:22Z) - Dominant Set-based Active Learning for Text Classification and its
Application to Online Social Media [0.0]
本稿では,最小限のアノテーションコストで大規模未ラベルコーパスのトレーニングを行うための,プールベースのアクティブラーニング手法を提案する。
提案手法には調整すべきパラメータが一切ないため,データセットに依存しない。
本手法は,最先端のアクティブラーニング戦略と比較して高い性能を実現する。
論文 参考訳(メタデータ) (2022-01-28T19:19:03Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。