論文の概要: Weakly Supervised Semantic Segmentation by Pixel-to-Prototype Contrast
- arxiv url: http://arxiv.org/abs/2110.07110v1
- Date: Thu, 14 Oct 2021 01:44:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-15 14:50:05.527119
- Title: Weakly Supervised Semantic Segmentation by Pixel-to-Prototype Contrast
- Title(参考訳): ピクセル対プロトタイプコントラストによる弱教師付き意味セグメンテーション
- Authors: Ye Du, Zehua Fu, Qingjie Liu, Yunhong Wang
- Abstract要約: クロスビュー特徴のセマンティック一貫性とイントラ(インター)クラスのコンパクト性(分散)について検討した。
本稿では,2つの新しい画素対プロトタイプのコントラスト正規化用語を提案する。
我々の手法は、ベースネットワークを変更することなく、既存のWSSSモデルにシームレスに組み込むことができる。
- 参考スコア(独自算出の注目度): 43.40192909920495
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Though image-level weakly supervised semantic segmentation (WSSS) has
achieved great progress with Class Activation Map (CAM) as the cornerstone, the
large supervision gap between classification and segmentation still hampers the
model to generate more complete and precise pseudo masks for segmentation.
In this study, we explore two implicit but intuitive constraints, i.e.,
cross-view feature semantic consistency and intra(inter)-class
compactness(dispersion), to narrow the supervision gap.
To this end, we propose two novel pixel-to-prototype contrast regularization
terms that are conducted cross different views and within per single view of an
image, respectively. Besides, we adopt two sample mining strategies, named
semi-hard prototype mining and hard pixel sampling, to better leverage hard
examples while reducing incorrect contrasts caused due to the absence of
precise pixel-wise labels.
Our method can be seamlessly incorporated into existing WSSS models without
any changes to the base network and does not incur any extra inference burden.
Experiments on standard benchmark show that our method consistently improves
two strong baselines by large margins, demonstrating the effectiveness of our
method. Specifically, built on top of SEAM, we improve the initial seed mIoU on
PASCAL VOC 2012 from 55.4% to 61.5%. Moreover, armed with our method, we
increase the segmentation mIoU of EPS from 70.8% to 73.6%, achieving new
state-of-the-art.
- Abstract(参考訳): 画像レベルの弱い教師付きセマンティックセグメンテーション(WSSS)は、クラスアクティベーションマップ(CAM)を基盤として大きな進歩を遂げてきたが、分類とセグメンテーションの間の大きな監視ギャップは、セグメンテーションのためのより完全で正確な擬似マスクを生成するためにモデルを妨げている。
本研究では,2つの暗黙的かつ直感的な制約,すなわち,横断的特徴のセマンティック一貫性と,(インター)クラス内コンパクト性(分散)を探索し,監督ギャップを狭める。
そこで本研究では,画像の異なるビューと1つのビューでそれぞれ異なるビューで実施する2つの新しいピクセル対プロトタイプコントラスト正規化項を提案する。
さらに, 半ハードプロトタイプマイニングとハードピクセルサンプリングという2つのサンプルマイニング戦略を採用し, 正確な画素ラベルの欠如によるコントラストの誤りを低減しつつ, ハードサンプルの活用を改善した。
提案手法は, ベースネットワークの変更なしに既存のWSSSモデルにシームレスに組み込むことができ, 余分な推論負担を生じさせない。
標準ベンチマーク実験により,提案手法は高いマージンで2つの強いベースラインを一貫して改善し,本手法の有効性を示す。
具体的には、SEAM上に構築されたPASCAL VOC 2012の初期シードmIoUを55.4%から61.5%に改善する。
さらに,EPSのセグメンテーションmIoUを70.8%から73.6%に増やし,新たな最先端技術を実現した。
関連論文リスト
- Fine-grained Background Representation for Weakly Supervised Semantic Segmentation [35.346567242839065]
本稿では,多様なBGセマンティクスを発見し,表現するために,FBR法を提案する。
そこで本研究では,FG陰性線を抽出し,地中コントラスト学習を効果的に行うためのアクティブサンプリング戦略を提案する。
本手法は,Pascal Voc および MS COCO テストセットにおいて,73.2 mIoU と 45.6 mIoU のセグメンテーション結果を得る。
論文 参考訳(メタデータ) (2024-06-22T06:45:25Z) - RCPS: Rectified Contrastive Pseudo Supervision for Semi-Supervised
Medical Image Segmentation [26.933651788004475]
我々は、RCPS(Rectified Contrastive Pseudo Supervision)という、新しい半教師付きセグメンテーション手法を提案する。
RCPSは、修正された疑似監督とボクセルレベルのコントラスト学習を組み合わせて、半教師付きセグメンテーションの有効性を向上させる。
実験結果から, 半教師付き医用画像分割における最先端手法と比較して, 高いセグメンテーション性能が得られた。
論文 参考訳(メタデータ) (2023-01-13T12:03:58Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Exploring Feature Representation Learning for Semi-supervised Medical
Image Segmentation [30.608293915653558]
半教師型医用画像分割のための2段階フレームワークを提案する。
重要な洞察は、ラベル付きおよびラベルなし(擬似ラベル付き)画像による特徴表現学習を探索することである。
段階適応型コントラスト学習法を提案し, 境界対応型コントラスト学習法を提案する。
本稿では,高品質な擬似ラベルを生成するためのアレータリック不確実性認識手法,すなわちAUAを提案する。
論文 参考訳(メタデータ) (2021-11-22T05:06:12Z) - Pixel Contrastive-Consistent Semi-Supervised Semantic Segmentation [22.920856071095915]
セグメンテーションモデル正規性の2つのデシラタを共同で達成する半教師付きセグメンテーション手法を提案する。
画素レベルL2損失と画素コントラスト損失をそれぞれ2つの目的に活用する。
論文 参考訳(メタデータ) (2021-08-20T07:04:33Z) - Semi-supervised Semantic Segmentation with Directional Context-aware
Consistency [66.49995436833667]
我々は、ラベル付きデータの小さなセットに、全くラベル付けされていない画像のより大きなコレクションを提供する半教師付きセグメンテーション問題に焦点をあてる。
好ましいハイレベル表現は、自己認識を失わずにコンテキスト情報をキャプチャするべきである。
我々は,DCロス(Directional Contrastive Loss)を画素対ピクセルの整合性を達成するために提示する。
論文 参考訳(メタデータ) (2021-06-27T03:42:40Z) - BoundarySqueeze: Image Segmentation as Boundary Squeezing [104.43159799559464]
本研究では,オブジェクトとシーンの微細な高画質画像分割のための新しい手法を提案する。
形態素画像処理技術による拡張と浸食に着想を得て,画素レベルのセグメンテーション問題をスクイーズ対象境界として扱う。
提案手法は,COCO,Cityscapesのインスタンス・セグメンテーション・セグメンテーション・セグメンテーションにおいて大きく向上し,同一条件下での精度・速度ともに従来のPointRendよりも優れていた。
論文 参考訳(メタデータ) (2021-05-25T04:58:51Z) - Railroad is not a Train: Saliency as Pseudo-pixel Supervision for Weakly
Supervised Semantic Segmentation [16.560870740946275]
EPS (Explicit Pseudo-Pixel Supervision) は2つの弱い監督と組み合わせることでピクセルレベルのフィードバックから学習する。
両情報間の補完関係を完全に活用するための共同学習戦略を考案する。
提案手法は, 正確なオブジェクト境界を求め, 共起画素を破棄することにより, 擬似マスクの品質を大幅に向上させることができる。
論文 参考訳(メタデータ) (2021-05-19T07:31:11Z) - Dense Contrastive Learning for Self-Supervised Visual Pre-Training [102.15325936477362]
入力画像の2つのビュー間の画素レベルでの差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分差分)を最適化することにより自己教師学習を実現する。
ベースライン法であるMoCo-v2と比較すると,計算オーバーヘッドは1%遅かった。
論文 参考訳(メタデータ) (2020-11-18T08:42:32Z) - Causal Intervention for Weakly-Supervised Semantic Segmentation [122.1846968696862]
画像レベルのラベルのみを用いて、より優れたピクセルレベルの擬似マスクを生成することを目指している。
画像,コンテキスト,およびクラスラベル間の因果関係を分析するための構造因果モデルを提案する。
そこで本研究では,画像レベルの分類において,矛盾するバイアスを取り除くためのコンテキスト調整(CONTA)手法を提案する。
論文 参考訳(メタデータ) (2020-09-26T09:26:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。