論文の概要: DMS: Differentiable Mean Shift for Dataset Agnostic Task Specific
Clustering Using Side Information
- arxiv url: http://arxiv.org/abs/2305.18492v1
- Date: Mon, 29 May 2023 13:45:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 20:14:52.086509
- Title: DMS: Differentiable Mean Shift for Dataset Agnostic Task Specific
Clustering Using Side Information
- Title(参考訳): DMS:サイド情報を用いたデータセット非依存タスク特定クラスタリングにおける平均値シフト
- Authors: Michael A. Hobley, Victor A. Prisacariu
- Abstract要約: 我々は、サイド情報から直接データをクラスタリングすることを学ぶ新しいアプローチを提案する。
クラスタの数、その中心、あるいは類似性に関するあらゆる種類の距離メートル法を知る必要はありません。
本手法は,特定のタスクのニーズに応じて,同じデータポイントを様々な方法で分割することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a novel approach, in which we learn to cluster data directly from
side information, in the form of a small set of pairwise examples. Unlike
previous methods, with or without side information, we do not need to know the
number of clusters, their centers or any kind of distance metric for
similarity. Our method is able to divide the same data points in various ways
dependant on the needs of a specific task, defined by the side information.
Contrastingly, other work generally finds only the intrinsic, most obvious,
clusters. Inspired by the mean shift algorithm, we implement our new clustering
approach using a custom iterative neural network to create Differentiable Mean
Shift (DMS), a state of the art, dataset agnostic, clustering method. We found
that it was possible to train a strong cluster definition without enforcing a
constraint that each cluster must be presented during training. DMS outperforms
current methods in both the intrinsic and non-intrinsic dataset tasks.
- Abstract(参考訳): 我々は,ペアワイズ例の小さな集合として,サイド情報から直接データをクラスタ化することを学ぶための新しいアプローチを提案する。
以前の方法とは異なり、サイド情報の有無に関わらず、クラスタの数やその中心、あるいは類似性のための距離メトリクスを知る必要はない。
サイド情報によって定義された特定のタスクのニーズに応じて,同じデータポイントを様々な方法で分割することが可能である。
対照的に、他の作品は一般的に、内在的で最も明白なクラスタのみを見つける。
平均シフトアルゴリズムにインスパイアされた我々は、カスタム反復ニューラルネットワークを使用して、新しいクラスタリングアプローチを実装し、芸術的、データセットに依存しない、クラスタリング手法である微分可能な平均シフト(DMS)を作成する。
トレーニング中に各クラスタを提示しなければならないという制約を課すことなく、強力なクラスタ定義をトレーニングできることが分かりました。
DMSは、本質的および非本質的なデータセットタスクにおいて、現在のメソッドよりも優れています。
関連論文リスト
- Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Interpretable Deep Clustering for Tabular Data [7.972599673048582]
クラスタリングは、データ分析で広く使われている基本的な学習タスクである。
本稿では,インスタンスとクラスタレベルでの解釈可能なクラスタ割り当てを予測する,新たなディープラーニングフレームワークを提案する。
提案手法は,生物,テキスト,画像,物理データセットのクラスタ割り当てを確実に予測できることを示す。
論文 参考訳(メタデータ) (2023-06-07T21:08:09Z) - ClusterNet: A Perception-Based Clustering Model for Scattered Data [16.326062082938215]
クラスタ分離は、一般的に広く使用されているクラスタリング技術によって取り組まれるタスクである。
本稿では,分散データを直接操作する学習戦略を提案する。
私たちは、ポイントベースのディープラーニングモデルであるClusterNetをトレーニングし、クラスタ分離性に対する人間の認識を反映するように訓練します。
論文 参考訳(メタデータ) (2023-04-27T13:41:12Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Inv-SENnet: Invariant Self Expression Network for clustering under
biased data [17.25929452126843]
本研究では,各サブ空間におけるデータポイントのクラスタ化を学習しながら,不要な属性(バイアス)を共同で除去する新しいフレームワークを提案する。
合成および実世界のデータセットに対する実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2022-11-13T01:19:06Z) - Leveraging Ensembles and Self-Supervised Learning for Fully-Unsupervised
Person Re-Identification and Text Authorship Attribution [77.85461690214551]
完全ラベル付きデータからの学習は、Person Re-IdentificationやText Authorship Attributionなどのマルチメディアフォレスト問題において困難である。
近年の自己教師型学習法は,基礎となるクラスに意味的差異が有る場合に,完全ラベル付きデータを扱う際に有効であることが示されている。
本研究では,異なるクラスからのサンプルが顕著に多様性を持っていない場合でも,ラベルのないデータから学習できるようにすることにより,個人再認識とテキストオーサシップの属性に対処する戦略を提案する。
論文 参考訳(メタデータ) (2022-02-07T13:08:11Z) - Clustering Plotted Data by Image Segmentation [12.443102864446223]
クラスタリングアルゴリズムは、ラベルなしデータのパターンを検出する主要な分析手法の1つである。
本稿では,人間のクラスタリングデータに着想を得た,2次元空間におけるクラスタリングポイントの全く異なる方法を提案する。
私たちのアプローチであるVisual Clusteringは、従来のクラスタリングアルゴリズムよりもいくつかのアドバンテージを持っています。
論文 参考訳(メタデータ) (2021-10-06T06:19:30Z) - Robust Trimmed k-means [70.88503833248159]
本稿では,外乱点とクラスタポイントを同時に識別するRobust Trimmed k-means (RTKM)を提案する。
RTKMは他の方法と競合することを示す。
論文 参考訳(メタデータ) (2021-08-16T15:49:40Z) - Deep Visual Attention-Based Transfer Clustering [2.248500763940652]
クラスタリングは、教師なしの最も重要な学習問題と見なすことができる。
イメージクラスタリングは、ドメイン機械学習とコンピュータビジョンにおいて不可欠だが難しい課題である。
本稿では,より少ない変量データ分散を実現するため,既存のディープトランスファークラスタリングの改良について述べる。
論文 参考訳(メタデータ) (2021-07-06T06:26:15Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。