論文の概要: Unsupervised visualization of image datasets using contrastive learning
- arxiv url: http://arxiv.org/abs/2210.09879v1
- Date: Tue, 18 Oct 2022 14:13:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-19 15:34:02.444368
- Title: Unsupervised visualization of image datasets using contrastive learning
- Title(参考訳): コントラスト学習による画像データセットの教師なし可視化
- Authors: Jan Niklas B\"ohm and Philipp Berens and Dmitry Kobak
- Abstract要約: 画像データの教師なし可視化のためのt-SimCNEを提案する。
T-SimCNEは、対照的な学習と隣接する埋め込みのアイデアを組み合わせて、高次元のピクセル空間から2次元へのパラメトリックマッピングを訓練する。
得られた2次元埋め込みにより,最先端の高次元SimCLR表現に匹敵する分類精度が得られることを示す。
- 参考スコア(独自算出の注目度): 6.129463540742259
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visualization methods based on the nearest neighbor graph, such as t-SNE or
UMAP, are widely used for visualizing high-dimensional data. Yet, these
approaches only produce meaningful results if the nearest neighbors themselves
are meaningful. For images represented in pixel space this is not the case, as
distances in pixel space are often not capturing our sense of similarity and
therefore neighbors are not semantically close. This problem can be
circumvented by self-supervised approaches based on contrastive learning, such
as SimCLR, relying on data augmentation to generate implicit neighbors, but
these methods do not produce two-dimensional embeddings suitable for
visualization. Here, we present a new method, called t-SimCNE, for unsupervised
visualization of image data. T-SimCNE combines ideas from contrastive learning
and neighbor embeddings, and trains a parametric mapping from the
high-dimensional pixel space into two dimensions. We show that the resulting 2D
embeddings achieve classification accuracy comparable to the state-of-the-art
high-dimensional SimCLR representations, thus faithfully capturing semantic
relationships. Using t-SimCNE, we obtain informative visualizations of the
CIFAR-10 and CIFAR-100 datasets, showing rich cluster structure and
highlighting artifacts and outliers.
- Abstract(参考訳): t-SNE や UMAP などの近接グラフに基づく可視化手法は高次元データの可視化に広く用いられている。
しかし、これらのアプローチは、最も近い隣人が意味のあるものである場合にのみ有意義な結果をもたらす。
ピクセル空間で表現される画像はそうではない、なぜならピクセル空間における距離は、しばしば我々の類似感を捉えておらず、したがって隣人は意味的に近接しないからである。
この問題は、simclrのような対照的な学習に基づく自己教師付きアプローチによって回避できるが、これらの手法は可視化に適した二次元埋め込みを生成しない。
本稿では,画像データの教師なし可視化のための新しい手法t-SimCNEを提案する。
t-simcneは、コントラスト学習と隣接埋め込みのアイデアを結合し、高次元のピクセル空間から2次元へのパラメトリックマッピングを訓練する。
得られた2次元埋め込みは、最先端の高次元SimCLR表現に匹敵する分類精度を実現し、セマンティックな関係を忠実に捉えていることを示す。
t-SimCNEを用いて,CIFAR-10とCIFAR-100データセットの情報視覚化を行い,クラスタ構造を充実させ,アーティファクトやアウトリーの強調を行う。
関連論文リスト
- Dual Advancement of Representation Learning and Clustering for Sparse and Noisy Images [14.836487514037994]
SNI(Sparse and Noisy Image)は、効果的な表現学習とクラスタリングに重要な課題を提起する。
本稿では、マスク画像モデリングから得られた表現を強化するために、DARLC(Dual Advancement of Representation Learning and Clustering)を提案する。
我々のフレームワークは、局所的な認識性、特異性、関係意味論の理解を高めることによって、表現の学習を改善する包括的なアプローチを提供する。
論文 参考訳(メタデータ) (2024-09-03T10:52:27Z) - Occ$^2$Net: Robust Image Matching Based on 3D Occupancy Estimation for
Occluded Regions [14.217367037250296]
Occ$2$Netは、3D占有率を用いて閉塞関係をモデル化し、閉塞領域の一致点を推測する画像マッチング手法である。
本手法は実世界とシミュレーションデータセットの両方で評価し,いくつかの指標における最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2023-08-14T13:09:41Z) - Benchmarking Spatial Relationships in Text-to-Image Generation [102.62422723894232]
本研究では,オブジェクト間の空間的関係を正確に生成するテキスト・ツー・イメージモデルについて検討する。
画像中にテキストで記述された空間関係がどれだけ正確に生成されるかを測定する評価指標であるVISORを提案する。
我々の実験では、最先端のT2Iモデルは高画質であるが、複数のオブジェクトを生成できる能力や、それらの間の空間的関係が著しく制限されていることが判明した。
論文 参考訳(メタデータ) (2022-12-20T06:03:51Z) - Flattening-Net: Deep Regular 2D Representation for 3D Point Cloud
Analysis [66.49788145564004]
我々は、任意の幾何学と位相の不規則な3次元点雲を表現するために、Flattning-Netと呼ばれる教師なしのディープニューラルネットワークを提案する。
我々の手法は、現在の最先端の競合相手に対して好意的に機能する。
論文 参考訳(メタデータ) (2022-12-17T15:05:25Z) - RiCS: A 2D Self-Occlusion Map for Harmonizing Volumetric Objects [68.85305626324694]
カメラ空間における光マーチング (RiCS) は、3次元における前景物体の自己閉塞を2次元の自己閉塞マップに表現する新しい手法である。
表現マップは画像の質を高めるだけでなく,時間的コヒーレントな複雑な影効果をモデル化できることを示す。
論文 参考訳(メタデータ) (2022-05-14T05:35:35Z) - Self-Supervised Image Representation Learning with Geometric Set
Consistency [50.12720780102395]
本稿では,3次元幾何整合性に基づく自己教師付き画像表現学習法を提案する。
具体的には、画像ビュー内の特徴整合性を強化するために、コントラスト学習フレームワークに3次元幾何学的整合性を導入する。
論文 参考訳(メタデータ) (2022-03-29T08:57:33Z) - Incorporating Texture Information into Dimensionality Reduction for
High-Dimensional Images [65.74185962364211]
距離ベース次元削減手法に周辺情報を組み込む手法を提案する。
画像パッチを比較する異なる手法の分類に基づいて,様々なアプローチを探索する。
論文 参考訳(メタデータ) (2022-02-18T13:17:43Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - A Domain-Oblivious Approach for Learning Concise Representations of
Filtered Topological Spaces [7.717214217542406]
本稿では永続化図のバイナリコード表現を学習する永続化図ハッシュフレームワークを提案する。
このフレームワークは、学習過程を制御するための図距離損失関数を備えた生成逆ネットワーク(GAN)上に構築されている。
提案手法は,モデルの再学習を必要とせずに,様々なデータセットに直接適用することができる。
論文 参考訳(メタデータ) (2021-05-25T20:44:28Z) - Spatial-Spectral Clustering with Anchor Graph for Hyperspectral Image [88.60285937702304]
本稿では、HSIデータクラスタリングのための空間スペクトルクラスタリングとアンカーグラフ(SSCAG)という新しい非監視アプローチを提案する。
提案されたSSCAGは最先端のアプローチと競合する。
論文 参考訳(メタデータ) (2021-04-24T08:09:27Z) - G-SimCLR : Self-Supervised Contrastive Learning with Guided Projection
via Pseudo Labelling [0.8164433158925593]
コンピュータビジョンにおいて、ディープニューラルネットワークは大量のラベル付きデータを持つ教師付き設定において、より良い性能を発揮することが明らかである。
本研究では, 温度スケールクロスエントロピー(NT-Xent)損失関数の正規化により, 同じカテゴリの画像が同じバッチにない方が有益であることを示す。
我々は、ラベルのないデータセットで訓練された復号化オートエンコーダの潜在空間表現を使用し、それらをk平均でクラスタリングして擬似ラベルを得る。
論文 参考訳(メタデータ) (2020-09-25T02:25:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。