論文の概要: PiCIE: Unsupervised Semantic Segmentation using Invariance and
Equivariance in Clustering
- arxiv url: http://arxiv.org/abs/2103.17070v1
- Date: Tue, 30 Mar 2021 00:12:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 09:46:12.166827
- Title: PiCIE: Unsupervised Semantic Segmentation using Invariance and
Equivariance in Clustering
- Title(参考訳): picie: クラスタリングにおける不変性と等価性を用いた教師なし意味セグメンテーション
- Authors: Jang Hyun Cho, Utkarsh Mall, Kavita Bala, Bharath Hariharan
- Abstract要約: クラスタリングによるアノテーションのないセマンティックセグメンテーションのための新しいフレームワークを提案する。
画像からピクセルへのクラスタリングを拡張し、各画像内の異なるインスタンスに別々のクラスタメンバシップを割り当てる。
新たな学習目標によって,フレームワークは高度な意味概念を学習することができる。
- 参考スコア(独自算出の注目度): 41.39557700996688
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a new framework for semantic segmentation without annotations via
clustering. Off-the-shelf clustering methods are limited to curated,
single-label, and object-centric images yet real-world data are dominantly
uncurated, multi-label, and scene-centric. We extend clustering from images to
pixels and assign separate cluster membership to different instances within
each image. However, solely relying on pixel-wise feature similarity fails to
learn high-level semantic concepts and overfits to low-level visual cues. We
propose a method to incorporate geometric consistency as an inductive bias to
learn invariance and equivariance for photometric and geometric variations.
With our novel learning objective, our framework can learn high-level semantic
concepts. Our method, PiCIE (Pixel-level feature Clustering using Invariance
and Equivariance), is the first method capable of segmenting both things and
stuff categories without any hyperparameter tuning or task-specific
pre-processing. Our method largely outperforms existing baselines on COCO and
Cityscapes with +17.5 Acc. and +4.5 mIoU. We show that PiCIE gives a better
initialization for standard supervised training. The code is available at
https://github.com/janghyuncho/PiCIE.
- Abstract(参考訳): クラスタリングによるアノテーションのないセマンティックセグメンテーションのための新しいフレームワークを提案する。
オフザシェルフクラスタリング手法は、キュレート、シングルラベル、オブジェクト中心の画像に限られるが、実際のデータは、主に未修正、複数ラベル、シーン中心である。
画像からピクセルへのクラスタリングを拡張し、各画像内の異なるインスタンスに別々のクラスタメンバシップを割り当てる。
しかし、ピクセル単位での類似性のみに依存するため、高レベルな意味概念や低レベルの視覚的手がかりへの過剰な適合を学ばない。
本稿では,インダクティブバイアスとして幾何学的一貫性を組み込む手法を提案する。
新たな学習目標によって,フレームワークは高度な意味概念を学習することができる。
我々の手法であるPiCIE (Pixel-level feature Clustering using Invariance and Equivariance) は,ハイパーパラメータチューニングやタスク固有の前処理を使わずに,物と物の両方を分割できる最初の方法である。
提案手法はCOCOおよび都市景観における既存のベースラインを+17.5Accで上回る。
4.5mIoU。
また,PiCIEが標準教師付きトレーニングのより優れた初期化を提供することを示す。
コードはhttps://github.com/janghyuncho/picieで入手できる。
関連論文リスト
- A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - SePiCo: Semantic-Guided Pixel Contrast for Domain Adaptive Semantic
Segmentation [52.62441404064957]
ドメイン適応セマンティックセグメンテーションは、ラベル付きソースドメインでトレーニングされたモデルを利用することで、ラベル付きターゲットドメイン上で満足のいく密度の予測を試みる。
多くの手法は、ノイズの多い擬似ラベルを緩和する傾向があるが、類似のセマンティックな概念を持つクロスドメインピクセル間の固有の接続を無視する。
本稿では,個々の画素のセマンティックな概念を強調する一段階適応フレームワークSePiCoを提案する。
論文 参考訳(メタデータ) (2022-04-19T11:16:29Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Exploring Cross-Image Pixel Contrast for Semantic Segmentation [130.22216825377618]
完全教師付きセッティングにおけるセマンティックセグメンテーションのための画素単位のコントラストフレームワークを提案する。
中心となる考え方は、同じセマンティッククラスに属するピクセルの埋め込みを、異なるクラスの埋め込みよりもよく似ているように強制することである。
テスト中に余分なオーバーヘッドを伴わずに既存のセグメンテーションフレームワークに懸命に組み込むことができる。
論文 参考訳(メタデータ) (2021-01-28T11:35:32Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - SCAN: Learning to Classify Images without Labels [73.69513783788622]
機能学習とクラスタリングを分離する2段階のアプローチを提唱する。
表現学習からの自己教師型タスクを用いて意味論的意味のある特徴を得る。
我々は、ImageNet上で有望な結果を得、低データ体制下では、いくつかの半教師付き学習方法より優れています。
論文 参考訳(メタデータ) (2020-05-25T18:12:33Z) - Variational Clustering: Leveraging Variational Autoencoders for Image
Clustering [8.465172258675763]
変分オートエンコーダ(VAE)は、潜在空間におけるデータ分布の学習に自然に役立ちます。
画像のクラスタリングに先立ってガウス混合を用いるVAEに基づく手法を提案する。
提案手法は,画像の潜伏分布と後部を捉える前処理を同時に学習し,データポイント間の識別に役立てる。
論文 参考訳(メタデータ) (2020-05-10T09:34:48Z) - GATCluster: Self-Supervised Gaussian-Attention Network for Image
Clustering [9.722607434532883]
画像クラスタリングのための自己教師型クラスタリングネットワーク(GATCluster)を提案する。
まず中間機能を抽出し、次に従来のクラスタリングを実行する代わりに、GATClusterセマンティッククラスタラベルを後処理なしで実行します。
大規模画像のクラスタリングにメモリ効率のよい2段階学習アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-02-27T00:57:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。