論文の概要: Customized Multiple Clustering via Multi-Modal Subspace Proxy Learning
- arxiv url: http://arxiv.org/abs/2411.03978v1
- Date: Wed, 06 Nov 2024 15:14:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-07 19:22:55.603890
- Title: Customized Multiple Clustering via Multi-Modal Subspace Proxy Learning
- Title(参考訳): マルチモーダル部分空間プロキシ学習によるカスタマイズ多重クラスタリング
- Authors: Jiawei Yao, Qi Qian, Juhua Hu,
- Abstract要約: 我々は、マルチモーダルなサブスペースプロキシ学習フレームワークを組み込んだ、新しいエンドツーエンドのマルチクラスタリングアプローチであるMulti-Subを紹介する。
我々の手法は、視覚的多重クラスタリングタスクにおいて、幅広いデータセットの集合において、既存のベースラインを一貫して上回ります。
- 参考スコア(独自算出の注目度): 8.447067012487866
- License:
- Abstract: Multiple clustering aims to discover various latent structures of data from different aspects. Deep multiple clustering methods have achieved remarkable performance by exploiting complex patterns and relationships in data. However, existing works struggle to flexibly adapt to diverse user-specific needs in data grouping, which may require manual understanding of each clustering. To address these limitations, we introduce Multi-Sub, a novel end-to-end multiple clustering approach that incorporates a multi-modal subspace proxy learning framework in this work. Utilizing the synergistic capabilities of CLIP and GPT-4, Multi-Sub aligns textual prompts expressing user preferences with their corresponding visual representations. This is achieved by automatically generating proxy words from large language models that act as subspace bases, thus allowing for the customized representation of data in terms specific to the user's interests. Our method consistently outperforms existing baselines across a broad set of datasets in visual multiple clustering tasks. Our code is available at https://github.com/Alexander-Yao/Multi-Sub.
- Abstract(参考訳): 複数のクラスタリングは、さまざまな側面から様々な潜在的なデータ構造を発見することを目的としている。
深層クラスタリング手法は、複雑なパターンとデータ間の関係を利用して、優れたパフォーマンスを実現している。
しかしながら、既存の作業は、各クラスタリングを手動で理解する必要のある、さまざまなユーザ固有のデータグループ化のニーズに柔軟に対応するのに苦労しています。
これらの制約に対処するため、我々はMulti-Subという、マルチモーダルなサブスペースプロキシ学習フレームワークを組み込んだ、新しいエンドツーエンドのマルチクラスタリングアプローチを紹介した。
CLIPとGPT-4の相乗的機能を利用して、Multi-Subは、ユーザの好みを表すテキストプロンプトを、対応する視覚的表現と整合させる。
これは、サブスペースベースとして機能する大きな言語モデルからプロキシワードを自動的に生成することで実現される。
我々の手法は、視覚的多重クラスタリングタスクにおいて、幅広いデータセットの集合において、既存のベースラインを一貫して上回ります。
私たちのコードはhttps://github.com/Alexander-Yao/Multi-Sub.orgで公開されています。
関連論文リスト
- Multi-Modal Proxy Learning Towards Personalized Visual Multiple Clustering [8.447067012487866]
マルチMaPは,マルチモーダルなプロキシ学習プロセスを用いた新しい手法である。
キーワードを通じてユーザの関心をキャプチャすると同時に、関連するクラスタリングの特定を容易にする。
実験の結果,Multi-MaPは全ベンチマークのマルチクラスタ・ビジョンタスクにおいて常に最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2024-04-24T05:20:42Z) - Federated Deep Multi-View Clustering with Global Self-Supervision [51.639891178519136]
フェデレートされたマルチビュークラスタリングは、複数のデバイスに分散したデータからグローバルクラスタリングモデルを学習する可能性がある。
この設定では、ラベル情報は未知であり、データのプライバシを保持する必要がある。
本稿では,複数のクライアントから補完的なクラスタ構造をマイニングできる,新しい多視点クラスタリング手法を提案する。
論文 参考訳(メタデータ) (2023-09-24T17:07:01Z) - Preserving Modality Structure Improves Multi-Modal Learning [64.10085674834252]
大規模マルチモーダルデータセットによる自己教師付き学習は、人間のアノテーションに頼ることなく、意味的に意味のある埋め込みを学ぶことができる。
これらの手法は、モダリティ固有の埋め込みに存在する意味構造を無視して、ドメイン外のデータをうまく一般化するのに苦労することが多い。
共同埋め込み空間におけるモダリティ特異的な関係を保ち, 一般化性を向上させるためのセマンティック・構造保存整合性アプローチを提案する。
論文 参考訳(メタデータ) (2023-08-24T20:46:48Z) - Large Language Models Enable Few-Shot Clustering [88.06276828752553]
大規模言語モデルは、クエリ効率が良く、数発のセミ教師付きテキストクラスタリングを可能にするために、専門家のガイダンスを増幅できることを示す。
最初の2つのステージにLSMを組み込むことで、クラスタの品質が大幅に向上することがわかった。
論文 参考訳(メタデータ) (2023-07-02T09:17:11Z) - Hard Regularization to Prevent Deep Online Clustering Collapse without
Data Augmentation [65.268245109828]
オンラインディープクラスタリング(オンラインディープクラスタリング)とは、機能抽出ネットワークとクラスタリングモデルを組み合わせて、クラスタラベルを処理された各新しいデータポイントまたはバッチに割り当てることである。
オフラインメソッドよりも高速で汎用性が高いが、オンラインクラスタリングは、エンコーダがすべての入力を同じポイントにマッピングし、すべてを単一のクラスタに配置する、崩壊したソリューションに容易に到達することができる。
本稿では,データ拡張を必要としない手法を提案する。
論文 参考訳(メタデータ) (2023-03-29T08:23:26Z) - Multi-view Semantic Consistency based Information Bottleneck for
Clustering [13.589996737740208]
クラスタリングのための多視点セマンティック一貫性に基づく情報ボトルネック(MSCIB)について紹介する。
MSCIBは、異なる視点における情報ボトルネックの学習プロセスを改善するために、セマンティック一貫性を追求する。
セマンティック空間における複数のビューのアライメント操作を行い、多視点データの貴重な一貫した情報を共同で達成する。
論文 参考訳(メタデータ) (2023-02-28T02:01:58Z) - Fast Multi-view Clustering via Ensembles: Towards Scalability,
Superiority, and Simplicity [63.85428043085567]
本稿では,アンサンブル(FastMICE)アプローチによる高速なマルチビュークラスタリングを提案する。
ランダムなビュー群の概念は、多目的なビューワイズ関係を捉えるために提示される。
FastMICEは、ほぼ線形時間と空間の複雑さを持ち、データセット固有のチューニングは不要である。
論文 参考訳(メタデータ) (2022-03-22T09:51:24Z) - Smoothed Multi-View Subspace Clustering [14.77544837600836]
本研究では,スムーズなマルチビューサブスペースクラスタリング(SMVSC)という新しいマルチビュークラスタリング手法を提案する。
グラフフィルタリングという新しい手法を用いて、各ビューのスムーズな表現を得る。
ベンチマークデータセットの実験は、我々のアプローチの優位性を検証する。
論文 参考訳(メタデータ) (2021-06-18T02:24:19Z) - Deep Incomplete Multi-View Multiple Clusterings [41.43164409639238]
データビューと複数の共有表現を同時に補完する、深い不完全なマルチビュー多重クラスタリングフレームワークを導入する。
ベンチマークデータセットの実験では、DiMVMCは、多様性と品質の高い複数のクラスタリングの生成において、最先端の競合よりも優れていることが確認されている。
論文 参考訳(メタデータ) (2020-10-02T08:01:24Z) - Joint Featurewise Weighting and Lobal Structure Learning for Multi-view
Subspace Clustering [3.093890460224435]
マルチビュークラスタリングは複数の機能セットを統合し、データの異なる側面を明らかにし、相互に補完情報を提供する。
既存のマルチビュークラスタリング手法の多くは、各ビューの局所構造を無視しながら、すべてのビューの一貫性を探求することのみを目的としている。
本稿では、異なる特徴に対する重みを同時に割り当て、ビュー固有の自己表現特徴空間におけるデータの局所的情報を取得することで、新しいマルチビューサブスペースクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-07-25T01:57:57Z) - Multi-view Deep Subspace Clustering Networks [64.29227045376359]
マルチビューサブスペースクラスタリングは、相補的な情報の複数のビューを融合することによって、データ固有の構造を発見することを目的としている。
本稿では,MvDSCN(Multi-view Deep Subspace Clustering Networks)を提案する。
MvDSCNはクラスタリング性能を高めるために複数のバックボーンを統合する。
論文 参考訳(メタデータ) (2019-08-06T06:44:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。