論文の概要: CrOC: Cross-View Online Clustering for Dense Visual Representation
Learning
- arxiv url: http://arxiv.org/abs/2303.13245v1
- Date: Thu, 23 Mar 2023 13:24:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-24 14:18:17.442190
- Title: CrOC: Cross-View Online Clustering for Dense Visual Representation
Learning
- Title(参考訳): croc: 密集した視覚的表現学習のためのクロスビューオンラインクラスタリング
- Authors: Thomas Stegm\"uller, Tim Lebailly, Behzad Bozorgtabar, Tinne
Tuytelaars, Jean-Philippe Thiran
- Abstract要約: 本稿では,オンラインクラスタリング機構(CrOC)を用いて,ビューのセマンティクスを発見し,セグメンテーションするクロスビュー整合性目標を提案する。
手作りの事前処理がなければ、結果の方法はより一般化可能であり、面倒な前処理ステップを必要としない。
各種データセット上での線形および教師なしセグメンテーション伝達タスクにおいて優れた性能を示す。
- 参考スコア(独自算出の注目度): 39.12950211289954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Learning dense visual representations without labels is an arduous task and
more so from scene-centric data. We propose to tackle this challenging problem
by proposing a Cross-view consistency objective with an Online Clustering
mechanism (CrOC) to discover and segment the semantics of the views. In the
absence of hand-crafted priors, the resulting method is more generalizable and
does not require a cumbersome pre-processing step. More importantly, the
clustering algorithm conjointly operates on the features of both views, thereby
elegantly bypassing the issue of content not represented in both views and the
ambiguous matching of objects from one crop to the other. We demonstrate
excellent performance on linear and unsupervised segmentation transfer tasks on
various datasets and similarly for video object segmentation. Our code and
pre-trained models are publicly available at https://github.com/stegmuel/CrOC.
- Abstract(参考訳): ラベルなしで密集した視覚表現を学ぶことは困難な作業であり、むしろシーン中心のデータからである。
本稿では,オンラインクラスタリング機構(CrOC)を用いて,ビューのセマンティクスを発見し,セグメンテーションするクロスビュー一貫性目標を提案する。
手作りの事前処理がなければ、結果の方法はより一般化でき、面倒な前処理ステップを必要としない。
より重要なことに、クラスタリングアルゴリズムは両ビューの特徴を結合して動作し、両ビューで表現されないコンテンツの問題と、一方のビューから他方へのオブジェクトのあいまいなマッチングをエレガントに回避する。
様々なデータセット上の線形および教師なしセグメンテーション転送タスクと、同様にビデオオブジェクトセグメンテーションに優れた性能を示す。
私たちのコードと事前訓練されたモデルはhttps://github.com/stegmuel/CrOC.comで公開されています。
関連論文リスト
- Deep Multi-View Subspace Clustering with Anchor Graph [11.291831842959926]
アンカーグラフ(DMCAG)を用いた深層多視点サブスペースクラスタリング手法を提案する。
DMCAGは各ビューの埋め込み機能を独立して学習し、サブスペース表現を得るために使用される。
本手法は他の最先端手法よりも優れたクラスタリング性能を実現する。
論文 参考訳(メタデータ) (2023-05-11T16:17:43Z) - Unified Mask Embedding and Correspondence Learning for Self-Supervised
Video Segmentation [76.40565872257709]
我々は、局所的な識別的特徴学習のためのフレーム間密度対応を同時にモデル化する統合フレームワークを開発する。
ラベルなしビデオから直接マスク誘導シーケンシャルセグメンテーションを実行することができる。
我々のアルゴリズムは、2つの標準ベンチマーク(DAVIS17とYouTube-VOS)に最先端をセットする。
論文 参考訳(メタデータ) (2023-03-17T16:23:36Z) - DeepCut: Unsupervised Segmentation using Graph Neural Networks
Clustering [6.447863458841379]
本研究では,従来のクラスタリング手法を置き換える軽量グラフニューラルネットワーク(GNN)を提案する。
既存の手法とは異なり、GNNはローカル画像特徴と生特徴とのペアワイズ親和性の両方を入力として取ります。
画像セグメンテーションGNNを訓練するための自己教師付き損失関数として,古典的クラスタリングの目的を定式化する方法を実証する。
論文 参考訳(メタデータ) (2022-12-12T12:31:46Z) - GOCA: Guided Online Cluster Assignment for Self-Supervised Video
Representation Learning [49.69279760597111]
クラスタリングは教師なし学習におけるユビキタスなツールです。
既存の自己教師型表現学習手法の多くは、視覚的に支配的な特徴に基づくクラスタサンプルが一般的である。
具体的には、各ビューの初期クラスタ割り当てを事前に使用して、他のビューの最終クラスタ割り当てをガイドする、新しいクラスタリング戦略を提案する。
論文 参考訳(メタデータ) (2022-07-20T19:26:55Z) - Unsupervised Visual Representation Learning by Online Constrained
K-Means [44.38989920488318]
クラスタ識別は、教師なし表現学習の効果的な前提課題である。
オンラインtextbfConstrained textbfK-mtextbfeans (textbfCoKe) を用いたクラスタリングに基づく新しいプリテキストタスクを提案する。
当社のオンライン割当て方式は,グローバルな最適化に近づくための理論的保証を持っている。
論文 参考訳(メタデータ) (2021-05-24T20:38:32Z) - Temporally-Weighted Hierarchical Clustering for Unsupervised Action
Segmentation [96.67525775629444]
アクションセグメンテーションとは、ビデオにおける意味的に一貫した視覚概念の境界を推測することを指す。
ビデオ中のセグメンテーション動作に対して,トレーニングを必要としない完全自動かつ教師なしのアプローチを提案する。
提案手法は,ビデオの意味的に一貫性のあるフレームをグループ化できる効果的な時間重み付き階層クラスタリングアルゴリズムである。
論文 参考訳(メタデータ) (2021-03-20T23:30:01Z) - Unsupervised Semantic Segmentation by Contrasting Object Mask Proposals [78.12377360145078]
画素埋め込みを学習するために、コントラスト最適化の目的として、予め決められた事前を取り入れた新しい2段階フレームワークを導入する。
これは、プロキシタスクやエンドツーエンドのクラスタリングに依存する既存の作業から大きく逸脱している。
特に、PASCALでラベル付き例の1%だけを用いて学習した表現を微調整すると、7.1% mIoUで教師付き ImageNet の事前トレーニングを上回ります。
論文 参考訳(メタデータ) (2021-02-11T18:54:47Z) - Learning to Cluster Faces via Confidence and Connectivity Estimation [136.5291151775236]
重複する部分グラフを多数必要とせず,完全に学習可能なクラスタリングフレームワークを提案する。
提案手法はクラスタリングの精度を大幅に向上させ,その上で訓練した認識モデルの性能を向上させるが,既存の教師付き手法に比べて桁違いに効率的である。
論文 参考訳(メタデータ) (2020-04-01T13:39:37Z) - GATCluster: Self-Supervised Gaussian-Attention Network for Image
Clustering [9.722607434532883]
画像クラスタリングのための自己教師型クラスタリングネットワーク(GATCluster)を提案する。
まず中間機能を抽出し、次に従来のクラスタリングを実行する代わりに、GATClusterセマンティッククラスタラベルを後処理なしで実行します。
大規模画像のクラスタリングにメモリ効率のよい2段階学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-02-27T00:57:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。