論文の概要: Semi-Supervised Semantic Segmentation with Pixel-Level Contrastive
Learning from a Class-wise Memory Bank
- arxiv url: http://arxiv.org/abs/2104.13415v1
- Date: Tue, 27 Apr 2021 18:19:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-29 21:57:14.967384
- Title: Semi-Supervised Semantic Segmentation with Pixel-Level Contrastive
Learning from a Class-wise Memory Bank
- Title(参考訳): 階層的メモリバンクからのピクセルレベルコントラスト学習による半教師付き意味セグメンテーション
- Authors: Inigo Alonso, Alberto Sabater, David Ferstl, Luis Montesano, Ana C.
Murillo
- Abstract要約: 本稿では,コントラスト学習に基づく新しい表現学習モジュールを提案する。
このモジュールはセグメンテーションネットワークを強制し、同じクラスのサンプルに対して同様のピクセルレベルの特徴表現を生成する。
エンドツーエンドのトレーニングでは、ラベル付きデータとラベルなしデータの両方の機能は、メモリバンクの同じクラスのサンプルに最適化される。
- 参考スコア(独自算出の注目度): 5.967279020820772
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This work presents a novel approach for semi-supervised semantic
segmentation, i.e., per-pixel classification problem assuming that only a small
set of the available data is labeled. We propose a novel representation
learning module based on contrastive learning. This module enforces the
segmentation network to yield similar pixel-level feature representations for
same-class samples across the whole dataset. To achieve this, we maintain a
memory bank continuously updated with feature vectors from labeled data. These
features are selected based on their quality and relevance for the contrastive
learning. In an end-to-end training, the features from both labeled and
unlabeled data are optimized to be similar to same-class samples from the
memory bank. Our approach outperforms the current state-of-the-art for
semi-supervised semantic segmentation and semi-supervised domain adaptation on
well-known public benchmarks, with larger improvements on the most challenging
scenarios, i.e., less available labeled data.
- Abstract(参考訳): 本研究は,半教師付き意味セグメンテーション,すなわち,利用可能なデータのごく一部しかラベル付けされていないと仮定した画素単位の分類問題に対する新しいアプローチを提案する。
本稿では,コントラスト学習に基づく新しい表現学習モジュールを提案する。
このモジュールはセグメンテーションネットワークを強制し、データセット全体にわたって同じクラスのサンプルに対して同様のピクセルレベルの特徴表現を生成する。
これを実現するために,ラベル付きデータから特徴ベクトルを連続的に更新したメモリバンクを維持する。
これらの特徴は、コントラスト学習の質と妥当性に基づいて選択される。
エンドツーエンドのトレーニングでは、ラベル付きデータとラベルなしデータの両方の機能は、メモリバンクの同じクラスのサンプルに最適化される。
我々のアプローチは、よく知られた公開ベンチマークにおいて、半教師付きセマンティックセマンティックセマンティクスと半教師付きドメイン適応のための現在の最先端技術よりも優れており、最も困難なシナリオであるラベル付きデータに大きな改善がある。
関連論文リスト
- Relevant Intrinsic Feature Enhancement Network for Few-Shot Semantic
Segmentation [34.257289290796315]
本稿では,フォアグラウンドインスタンスのセマンティック一貫性を改善するために,RiFeNet(Relevant Intrinsic Feature Enhancement Network)を提案する。
RiFeNetはPASCAL-5iとCOCOベンチマークの最先端メソッドを上回っている。
論文 参考訳(メタデータ) (2023-12-11T16:02:57Z) - A Lightweight Clustering Framework for Unsupervised Semantic
Segmentation [28.907274978550493]
教師なしセマンティックセグメンテーションは、注釈付きデータを用いることなく、画像の各ピクセルを対応するクラスに分類することを目的としている。
教師なしセマンティックセグメンテーションのための軽量クラスタリングフレームワークを提案する。
本フレームワークは,PASCAL VOCおよびMS COCOデータセットの最先端結果を実現する。
論文 参考訳(メタデータ) (2023-11-30T15:33:42Z) - Generalized Category Discovery with Clustering Assignment Consistency [56.92546133591019]
一般化圏発見(GCD)は、最近提案されたオープンワールドタスクである。
クラスタリングの一貫性を促進するための協調学習ベースのフレームワークを提案する。
提案手法は,3つの総合的なベンチマークと3つのきめ細かい視覚認識データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-30T00:32:47Z) - Dense FixMatch: a simple semi-supervised learning method for pixel-wise
prediction tasks [68.36996813591425]
Dense FixMatchは,高密度かつ構造化された予測タスクのオンライン半教師付き学習のための簡易な手法である。
我々は、擬似ラベルにマッチング操作を追加することにより、画像分類を超えた半教師付き学習問題にFixMatchの適用を可能にする。
Dense FixMatchは、ラベル付きデータのみを使用して教師付き学習と比較すると、結果を著しく改善し、ラベル付きサンプルの1/4でそのパフォーマンスに近づいた。
論文 参考訳(メタデータ) (2022-10-18T15:02:51Z) - Open-world Semantic Segmentation via Contrasting and Clustering
Vision-Language Embedding [95.78002228538841]
本研究では,様々なオープンワールドカテゴリのセマンティックオブジェクトを高密度アノテーションを使わずにセマンティックオブジェクトのセマンティックオブジェクトのセマンティック化を学習するための,新しいオープンワールドセマンティックセマンティックセマンティックセマンティクスパイプラインを提案する。
提案手法は任意のカテゴリのオブジェクトを直接分割し、3つのベンチマークデータセット上でデータラベリングを必要とするゼロショットセグメンテーション法より優れている。
論文 参考訳(メタデータ) (2022-07-18T09:20:04Z) - Scaling up Multi-domain Semantic Segmentation with Sentence Embeddings [81.09026586111811]
ゼロショット設定に適用した場合、最先端の教師付き性能を実現するセマンティックセマンティックセマンティクスへのアプローチを提案する。
これは各クラスラベルを、クラスを記述する短い段落のベクトル値の埋め込みに置き換えることによって達成される。
結果として得られた200万以上の画像の統合セマンティックセグメンテーションデータセットは、7つのベンチマークデータセット上の最先端の教師付きメソッドと同等のパフォーマンスを達成するモデルをトレーニングすることができる。
論文 参考訳(メタデータ) (2022-02-04T07:19:09Z) - A Pixel-Level Meta-Learner for Weakly Supervised Few-Shot Semantic
Segmentation [40.27705176115985]
Few-shotのセマンティックセマンティックセグメンテーションは、興味のある新しいクラスのために、地上の真実のピクセルレベルのラベルを持つ少数の画像しか利用できない学習タスクに対処する。
限られたデータとその意味ラベルから擬似画素レベルのセグメンテーションマスクを予測するメタラーニングフレームワークを提案する。
提案する学習モデルは,画素レベルのメタラーナーとみなすことができる。
論文 参考訳(メタデータ) (2021-11-02T08:28:11Z) - Remote Sensing Images Semantic Segmentation with General Remote Sensing
Vision Model via a Self-Supervised Contrastive Learning Method [13.479068312825781]
リモートセマンティックセグメンテーションのためのGlobal style and Local matching Contrastive Learning Network (GLCNet)を提案する。
具体的には、画像レベルの表現をより良く学習するために、グローバルスタイルのコントラストモジュールが使用される。
コントラストモジュールにマッチするローカル特徴は、セマンティックセグメンテーションに有用なローカル領域の表現を学習するために設計されている。
論文 参考訳(メタデータ) (2021-06-20T03:03:40Z) - Multi-dataset Pretraining: A Unified Model for Semantic Segmentation [97.61605021985062]
我々は、異なるデータセットの断片化アノテーションを最大限に活用するために、マルチデータセット事前訓練と呼ばれる統合フレームワークを提案する。
これは、複数のデータセットに対して提案されたピクセルからプロトタイプへのコントラスト損失を通じてネットワークを事前トレーニングすることで実現される。
異なるデータセットからの画像とクラス間の関係をより良くモデル化するために、クロスデータセットの混合によりピクセルレベルの埋め込みを拡張する。
論文 参考訳(メタデータ) (2021-06-08T06:13:11Z) - UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation [52.487469544343305]
オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
論文 参考訳(メタデータ) (2020-06-12T22:45:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。