論文の概要: MuSCLe: A Multi-Strategy Contrastive Learning Framework for Weakly
Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2201.07021v1
- Date: Tue, 18 Jan 2022 14:38:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-19 16:50:13.848730
- Title: MuSCLe: A Multi-Strategy Contrastive Learning Framework for Weakly
Supervised Semantic Segmentation
- Title(参考訳): MuSCLe: 弱教師付きセマンティックセグメンテーションのためのマルチストラテジーコントラスト学習フレームワーク
- Authors: Kunhao Yuan, Gerald Schaefer, Yu-Kun Lai, Yifan Wang, Xiyao Liu, Lin
Guan, Hui Fang
- Abstract要約: 弱教師付きセマンティックセグメンテーション(WSSS)は、教師付きセマンティックセグメンテーション(SSS)メソッドで必要とされるピクセルレベルのアノテーションではなく、画像レベルのアノテーションのような弱いラベルに依存している。
本稿では,改良された特徴表現とWSSS性能を向上させるために,新しいマルチストラテジー・コントラスト学習(MuSCLe)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 39.858844102571176
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly supervised semantic segmentation (WSSS) has gained significant
popularity since it relies only on weak labels such as image level annotations
rather than pixel level annotations required by supervised semantic
segmentation (SSS) methods. Despite drastically reduced annotation costs,
typical feature representations learned from WSSS are only representative of
some salient parts of objects and less reliable compared to SSS due to the weak
guidance during training. In this paper, we propose a novel Multi-Strategy
Contrastive Learning (MuSCLe) framework to obtain enhanced feature
representations and improve WSSS performance by exploiting similarity and
dissimilarity of contrastive sample pairs at image, region, pixel and object
boundary levels. Extensive experiments demonstrate the effectiveness of our
method and show that MuSCLe outperforms the current state-of-the-art on the
widely used PASCAL VOC 2012 dataset.
- Abstract(参考訳): 教師付きセマンティックセグメンテーション(WSSS)は、教師付きセマンティックセグメンテーション(SSS)メソッドで必要とされるピクセルレベルのアノテーションではなく、画像レベルのアノテーションのような弱いラベルにのみ依存するため、非常に人気がある。
アノテーションのコストが大幅に削減されたにもかかわらず、WSSSから学んだ典型的な特徴表現は、オブジェクトの健全な部分を表すだけであり、トレーニング中のガイダンスの弱いため、SSSに比べて信頼性が低い。
本稿では,画像,領域,画素,オブジェクト境界レベルでのコントラストペアの類似性と類似性を生かして,機能表現の強化とwsss性能の向上を図るための,新しいマルチストラテジーコントラスト学習(muscle)フレームワークを提案する。
本手法の有効性を実証し, 広く使用されているPASCAL VOC 2012データセットにおいて, MuSCLe が現状よりも優れていることを示す。
関連論文リスト
- Weakly-supervised Semantic Segmentation via Dual-stream Contrastive Learning of Cross-image Contextual Information [10.77139542242678]
弱教師付きセマンティックセグメンテーション(WSSS)は、画像レベルのタグのみを用いてセマンティックセグメンテーションモデルを学習することを目的としている。
現在のWSSS手法のほとんどは、価値ある画像間情報(セマンティックワイド)を無視しながら、限られた単一画像(ピクセルワイド)情報に焦点を当てている。
論文 参考訳(メタデータ) (2024-05-08T09:35:26Z) - SMC-NCA: Semantic-guided Multi-level Contrast for Semi-supervised Temporal Action Segmentation [53.010417880335424]
半教師付き時間的アクションセグメンテーション(SS-TA)は、長編ビデオにおいてフレームワイズ分類を行うことを目的としている。
近年の研究では、教師なし表現学習におけるコントラスト学習の可能性が示されている。
本稿では,SMC-NCA(Neighbourhood-Consistency-Aware Unit)を用いたセマンティック誘導型マルチレベルコントラスト方式を提案する。
論文 参考訳(メタデータ) (2023-12-19T17:26:44Z) - Learning Self-Supervised Low-Rank Network for Single-Stage Weakly and
Semi-Supervised Semantic Segmentation [119.009033745244]
本稿では,単一段階弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)と半教師付きセマンティクスセマンティクスセマンティクス(SSSS)のための自己教師付き低ランクネットワーク(SLRNet)を提案する。
SLRNetは、画像の異なるビューから複数の注意深いLR表現を同時に予測し、正確な擬似ラベルを学習する。
Pascal VOC 2012、COCO、L2IDデータセットの実験では、SLRNetは最先端のWSSSメソッドとSSSSメソッドの両方で、さまざまな設定で優れています。
論文 参考訳(メタデータ) (2022-03-19T09:19:55Z) - Novel Class Discovery in Semantic Segmentation [104.30729847367104]
セマンティックにおける新しいクラス発見(NCDSS)について紹介する。
ラベル付き非結合クラスの集合から事前の知識を与えられた新しいクラスを含むラベル付きイメージのセグメンテーションを目的としている。
NCDSSでは、オブジェクトと背景を区別し、画像内の複数のクラスの存在を処理する必要があります。
本稿では,エントロピーに基づく不確実性モデリングと自己学習(EUMS)フレームワークを提案し,ノイズの多い擬似ラベルを克服する。
論文 参考訳(メタデータ) (2021-12-03T13:31:59Z) - Dense Contrastive Visual-Linguistic Pretraining [53.61233531733243]
画像とテキストを共同で表現するマルチモーダル表現学習手法が提案されている。
これらの手法は,大規模マルチモーダル事前学習から高レベルな意味情報を取得することにより,優れた性能を実現する。
そこで本稿では,非バイアスのDense Contrastive Visual-Linguistic Pretrainingを提案する。
論文 参考訳(メタデータ) (2021-09-24T07:20:13Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - Towards Single Stage Weakly Supervised Semantic Segmentation [2.28438857884398]
弱教師付きセマンティックセグメンテーションへのシングルステージアプローチを提案する。
ポイントアノテーションを使用して、オンザフライで信頼性の高い擬似マスクを生成します。
我々は、最近の実世界のデータセットにおいて、他のSOTA WSSS手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-06-18T18:34:50Z) - Few-Shot Semantic Segmentation Augmented with Image-Level Weak
Annotations [23.02986307143718]
ショットセマンティックセグメンテーションの最近の進歩は、わずか数ピクセルレベルの注釈付き例によってこの問題に対処している。
私たちのキーとなるアイデアは、イメージレベルのラベル付きデータから知識を融合させることで、クラスのより優れたプロトタイプ表現を学ぶことです。
画像レベルのアノテーションを統合することで,距離空間におけるクラスプロトタイプ表現を学習するための新しいフレームワークPAIAを提案する。
論文 参考訳(メタデータ) (2020-07-03T04:58:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。