論文の概要: Image Clustering with Contrastive Learning and Multi-scale Graph
Convolutional Networks
- arxiv url: http://arxiv.org/abs/2207.07173v1
- Date: Thu, 14 Jul 2022 19:16:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-19 01:49:04.474530
- Title: Image Clustering with Contrastive Learning and Multi-scale Graph
Convolutional Networks
- Title(参考訳): コントラスト学習とマルチスケールグラフ畳み込みネットワークを用いた画像クラスタリング
- Authors: Yuanku Xu, Dong Huang, Chang-Dong Wang, Jian-Huang Lai
- Abstract要約: 本稿では、コントラスト学習とマルチスケールグラフ畳み込みネットワーク(IcicleGCN)を用いた画像クラスタリングという新しい深層クラスタリング手法を提案する。
複数の画像データセットの実験は、最先端のIcicleGCNよりも優れたクラスタリング性能を示している。
- 参考スコア(独自算出の注目度): 56.81492360414741
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep clustering has recently attracted significant attention. Despite the
remarkable progress, most of the previous deep clustering works still suffer
from two limitations. First, many of them focus on some distribution-based
clustering loss, lacking the ability to exploit sample-wise (or
augmentation-wise) relationships via contrastive learning. Second, they often
neglect the indirect sample-wise structure information, overlooking the rich
possibilities of multi-scale neighborhood structure learning. In view of this,
this paper presents a new deep clustering approach termed Image clustering with
contrastive learning and multi-scale Graph Convolutional Networks (IcicleGCN),
which bridges the gap between convolutional neural network (CNN) and graph
convolutional network (GCN) as well as the gap between contrastive learning and
multi-scale neighborhood structure learning for the image clustering task. The
proposed IcicleGCN framework consists of four main modules, namely, the
CNN-based backbone, the Instance Similarity Module (ISM), the Joint Cluster
Structure Learning and Instance reconstruction Module (JC-SLIM), and the
Multi-scale GCN module (M-GCN). Specifically, with two random augmentations
performed on each image, the backbone network with two weight-sharing views is
utilized to learn the representations for the augmented samples, which are then
fed to ISM and JC-SLIM for instance-level and cluster-level contrastive
learning, respectively. Further, to enforce multi-scale neighborhood structure
learning, two streams of GCNs and an auto-encoder are simultaneously trained
via (i) the layer-wise interaction with representation fusion and (ii) the
joint self-adaptive learning that ensures their last-layer output distributions
to be consistent. Experiments on multiple image datasets demonstrate the
superior clustering performance of IcicleGCN over the state-of-the-art.
- Abstract(参考訳): 近年,深層クラスタリングが注目されている。
顕著な進歩にもかかわらず、以前のディープクラスタリング作業の多くは、まだ2つの制限に悩まされている。
まず、多くは分散ベースのクラスタリングの損失に焦点を合わせ、対照的な学習を通じてサンプル単位(あるいは拡張単位)の関係性を利用する能力が欠如している。
第二に、彼らはしばしば間接的なサンプル単位の構造情報を無視し、マルチスケールな近隣構造学習の可能性を見越す。
そこで本研究では,コントラッシブニューラルネットワーク(CNN)とグラフ畳み込みネットワーク(GCN)のギャップと,画像クラスタリングタスクにおけるコントラスト学習とマルチスケール近傍構造学習のギャップを埋める,コントラスト学習とマルチスケールグラフ畳み込みネットワーク(IcicleGCN)という,新たな深層クラスタリング手法を提案する。
提案したIcicleGCNフレームワークは、CNNベースのバックボーン、インスタンス類似モジュール(ISM)、JC-SLIM(Joint Cluster Structure Learning and Instance reconstruction Module)、マルチスケールGCNモジュール(M-GCN)の4つの主要なモジュールで構成されている。
具体的には、各画像上で2つのランダムな拡張を行い、2つの重み付けビューを持つバックボーンネットワークを用いて、拡張サンプルの表現を学習し、それぞれインスタンスレベルとクラスタレベルのコントラスト学習のためにISMとJC-SLIMに供給する。
さらに、マルチスケールな近隣構造学習を実施するために、2つのGCNストリームとオートエンコーダを同時にトレーニングする。
一 表象融合及び表象融合との層間相互作用
(ii)最終層出力分布の一貫性を保証する共同自己適応学習。
複数の画像データセットの実験は、最先端のIcicleGCNよりも優れたクラスタリング性能を示している。
関連論文リスト
- Deep Dependency Networks for Multi-Label Classification [24.24496964886951]
マルコフ確率場とニューラルネットワークを組み合わせた従来の手法の性能は、わずかに改善できることを示す。
我々は、依存性ネットワークを拡張するディープ依存ネットワークと呼ばれる新しいモデリングフレームワークを提案する。
単純さにもかかわらず、この新しいアーキテクチャを共同学習することで、パフォーマンスが大幅に向上する。
論文 参考訳(メタデータ) (2023-02-01T17:52:40Z) - DeepCluE: Enhanced Image Clustering via Multi-layer Ensembles in Deep
Neural Networks [53.88811980967342]
本稿では,Ensembles (DeepCluE) を用いたDeep Clusteringを提案する。
ディープニューラルネットワークにおける複数のレイヤのパワーを活用することで、ディープクラスタリングとアンサンブルクラスタリングのギャップを埋める。
6つの画像データセットの実験結果から、最先端のディープクラスタリングアプローチに対するDeepCluEの利点が確認されている。
論文 参考訳(メタデータ) (2022-06-01T09:51:38Z) - Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。
我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。
我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文 参考訳(メタデータ) (2022-01-15T19:49:00Z) - Attention-driven Graph Clustering Network [49.040136530379094]
我々は、注意駆動グラフクラスタリングネットワーク(AGCN)という新しいディープクラスタリング手法を提案する。
AGCNは、ノード属性特徴とトポロジグラフ特徴を動的に融合するために、不均一な融合モジュールを利用する。
AGCNは、教師なしの方法で特徴学習とクラスタ割り当てを共同で行うことができる。
論文 参考訳(メタデータ) (2021-08-12T02:30:38Z) - Learning Hierarchical Graph Neural Networks for Image Clustering [81.5841862489509]
本稿では,画像の集合を未知の個数にクラスタリングする方法を学ぶ階層型グラフニューラルネットワーク(GNN)モデルを提案する。
我々の階層的なGNNは、階層の各レベルで予測される連結コンポーネントをマージして、次のレベルで新しいグラフを形成するために、新しいアプローチを用いています。
論文 参考訳(メタデータ) (2021-07-03T01:28:42Z) - Spatio-Temporal Inception Graph Convolutional Networks for
Skeleton-Based Action Recognition [126.51241919472356]
我々はスケルトンに基づく行動認識のためのシンプルで高度にモジュール化されたグラフ畳み込みネットワークアーキテクチャを設計する。
ネットワークは,空間的および時間的経路から多粒度情報を集約するビルディングブロックを繰り返すことで構築される。
論文 参考訳(メタデータ) (2020-11-26T14:43:04Z) - Sparse Coding Driven Deep Decision Tree Ensembles for Nuclear
Segmentation in Digital Pathology Images [15.236873250912062]
デジタル病理画像セグメンテーションタスクにおいて、ディープニューラルネットワークと高い競争力を持つ、容易に訓練されながら強力な表現学習手法を提案する。
ScD2TEと略すこの手法はスパースコーディング駆動の深層決定木アンサンブルと呼ばれ、表現学習の新しい視点を提供する。
論文 参考訳(メタデータ) (2020-08-13T02:59:31Z) - Structural Deep Clustering Network [45.370272344031285]
本研究では,構造情報を深層クラスタリングに統合する構造深層クラスタリングネットワーク(SDCN)を提案する。
具体的には、オートエンコーダが学習した表現を対応するGCN層に転送するデリバリ演算子を設計する。
このように、低次から高次までの複数のデータ構造は、オートエンコーダによって学習された複数の表現と自然に結合される。
論文 参考訳(メタデータ) (2020-02-05T04:33:40Z) - CSNNs: Unsupervised, Backpropagation-free Convolutional Neural Networks
for Representation Learning [0.0]
この作業は、畳み込みニューラルネットワーク(CNN)と、自己組織化マップ(SOM)とHebbian Learningによるクラスタリングを組み合わせて、畳み込み自己組織化ニューラルネットワーク(CSNN)の構築ブロックを提案する。
提案手法は,従来のCNNからの畳み込みレイヤの学習をSOMの競合的学習手順に置き換えるとともに,各レイヤ間の局所マスクをヘビアン様の学習規則で同時に学習することにより,クラスタリングによってフィルタが学習されるときの変動要因の解消を克服する。
論文 参考訳(メタデータ) (2020-01-28T14:57:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。