論文の概要: Self-supervised Multi-view Clustering in Computer Vision: A Survey
- arxiv url: http://arxiv.org/abs/2309.09473v1
- Date: Mon, 18 Sep 2023 04:11:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 15:11:15.564180
- Title: Self-supervised Multi-view Clustering in Computer Vision: A Survey
- Title(参考訳): コンピュータビジョンにおける自己教師付きマルチビュークラスタリング:調査
- Authors: Jiatai Wang, Zhiwei Xu, Xuewen Yang, Hailong Li, Bo Li, Xuying Meng
- Abstract要約: マルチビュークラスタリング(MVC)は、クロスモーダルな表現学習とデータ駆動型意思決定に重大な影響を与えている。
本稿では、自己監督型MVCの出現の理由と利点について考察する。
- 参考スコア(独自算出の注目度): 14.432997752719473
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-view clustering (MVC) has had significant implications in cross-modal
representation learning and data-driven decision-making in recent years. It
accomplishes this by leveraging the consistency and complementary information
among multiple views to cluster samples into distinct groups. However, as
contrastive learning continues to evolve within the field of computer vision,
self-supervised learning has also made substantial research progress and is
progressively becoming dominant in MVC methods. It guides the clustering
process by designing proxy tasks to mine the representation of image and video
data itself as supervisory information. Despite the rapid development of
self-supervised MVC, there has yet to be a comprehensive survey to analyze and
summarize the current state of research progress. Therefore, this paper
explores the reasons and advantages of the emergence of self-supervised MVC and
discusses the internal connections and classifications of common datasets, data
issues, representation learning methods, and self-supervised learning methods.
This paper does not only introduce the mechanisms for each category of methods
but also gives a few examples of how these techniques are used. In the end,
some open problems are pointed out for further investigation and development.
- Abstract(参考訳): マルチビュークラスタリング (MVC) は近年, クロスモーダルな表現学習とデータ駆動型意思決定に重要な影響を与えている。
複数のビュー間の一貫性と相補的な情報を活用して、サンプルを個別のグループにクラスタ化する。
しかし、コンピュータビジョンの分野ではコントラスト学習が進化し続けており、自己教師型学習もかなりの研究進歩を遂げており、MVC手法では徐々に支配的になりつつある。
イメージとビデオデータの表現自体を監督情報としてマイニングするためにプロキシタスクを設計することで、クラスタリングプロセスをガイドする。
自己監督型MVCの急速な開発にもかかわらず、研究の進捗状況を分析し要約するための総合的な調査はまだ行われていない。
そこで本稿では,MVCの出現の理由とメリットを考察し,共通データセット,データ問題,表現学習手法,自己教師付き学習手法の内部接続と分類について考察する。
本稿では,メソッドのカテゴリごとのメカニズムを紹介するだけでなく,これらの手法の使い方を例に紹介する。
最終的に、さらなる調査と開発のためにいくつかのオープンな問題が指摘されている。
関連論文リスト
- SLRL: Structured Latent Representation Learning for Multi-view Clustering [24.333292079699554]
マルチビュークラスタリング(MVC)は、異なるビュー間の固有の一貫性と相補性を活用して、クラスタリングの結果を改善することを目的としている。
MVCでの広範な研究にもかかわらず、既存のほとんどのメソッドは、主にクラスタリングの有効性を高めるためにビューをまたいだ補完的な情報を活用することに重点を置いています。
本稿では,構造化潜在表現学習に基づくマルチビュークラスタリング手法を提案する。
論文 参考訳(メタデータ) (2024-07-11T09:43:57Z) - CDIMC-net: Cognitive Deep Incomplete Multi-view Clustering Network [53.72046586512026]
我々は,認知的深層不完全多視点クラスタリングネットワーク(CDIMC-net)という,新しい不完全多視点クラスタリングネットワークを提案する。
ビュー固有のディープエンコーダとグラフ埋め込み戦略をフレームワークに組み込むことで、各ビューの高レベルな特徴とローカル構造をキャプチャする。
人間の認知、すなわち、簡単からハードに学ぶことに基づいて、モデルトレーニングのための最も自信あるサンプルを選択するための自己評価戦略を導入する。
論文 参考訳(メタデータ) (2024-03-28T15:45:03Z) - Neural Clustering based Visual Representation Learning [61.72646814537163]
クラスタリングは、機械学習とデータ分析における最も古典的なアプローチの1つである。
本稿では,特徴抽出をデータから代表者を選択するプロセスとみなすクラスタリング(FEC)による特徴抽出を提案する。
FECは、個々のクラスタにピクセルをグループ化して抽象的な代表を配置し、現在の代表とピクセルの深い特徴を更新する。
論文 参考訳(メタデータ) (2024-03-26T06:04:50Z) - A Probabilistic Model Behind Self-Supervised Learning [53.64989127914936]
自己教師付き学習(SSL)では、アノテートラベルなしで補助的なタスクを通じて表現が学習される。
自己教師型学習のための生成潜在変数モデルを提案する。
対照的な方法を含む識別的SSLのいくつかのファミリーは、表現に匹敵する分布を誘導することを示した。
論文 参考訳(メタデータ) (2024-02-02T13:31:17Z) - Masked Modeling for Self-supervised Representation Learning on Vision
and Beyond [69.64364187449773]
仮面モデリングは、トレーニング中に比例的にマスキングされる元のデータの一部を予測する、独特なアプローチとして現れてきた。
マスクモデリングにおけるテクニックの詳細については,多様なマスキング戦略,ターゲット回復,ネットワークアーキテクチャなどについて詳述する。
我々は、現在の手法の限界について議論し、マスクモデリング研究を進めるためのいくつかの道のりを指摘した。
論文 参考訳(メタデータ) (2023-12-31T12:03:21Z) - Multi-View Class Incremental Learning [57.14644913531313]
マルチビュー学習(MVL)は、下流タスクのパフォーマンスを改善するためにデータセットの複数の視点から情報を統合することで大きな成功を収めている。
本稿では,複数視点クラスインクリメンタルラーニング(MVCIL)と呼ばれる新しいパラダイムについて考察する。
論文 参考訳(メタデータ) (2023-06-16T08:13:41Z) - Generative Partial Multi-View Clustering [133.36721417531734]
本稿では,不完全なマルチビュー問題に対処するため,GP-MVCと呼ばれる生成的部分的マルチビュークラスタリングモデルを提案する。
まず、マルチビューエンコーダネットワークをトレーニングして、一般的な低次元表現を学習し、次にクラスタリング層を使用して複数のビューをまたいだ一貫したクラスタ構造をキャプチャする。
第2に、他のビューが与える共有表現に基づいて、1つのビュー条件の欠落データを生成するために、ビュー固有の生成敵ネットワークを開発する。
論文 参考訳(メタデータ) (2020-03-29T17:48:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。