論文の概要: Spatial Structure Constraints for Weakly Supervised Semantic
Segmentation
- arxiv url: http://arxiv.org/abs/2401.11122v1
- Date: Sat, 20 Jan 2024 05:25:25 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-23 17:57:59.522563
- Title: Spatial Structure Constraints for Weakly Supervised Semantic
Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのための空間構造制約
- Authors: Tao Chen, Yazhou Yao, Xingguo Huang, Zechao Li, Liqiang Nie and Jinhui
Tang
- Abstract要約: クラスアクティベーションマップ(CAM)は、オブジェクトの最も識別性の高い部分のみを見つけることができる。
注意伸縮の余剰なオブジェクトの過剰な活性化を軽減するために,弱い教師付きセマンティックセマンティックセグメンテーションのための空間構造制約(SSC)を提案する。
提案手法は,PASCAL VOC 2012とCOCOデータセットでそれぞれ72.7%,47.0%mIoUを達成した。
- 参考スコア(独自算出の注目度): 100.0316479167605
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The image-level label has prevailed in weakly supervised semantic
segmentation tasks due to its easy availability. Since image-level labels can
only indicate the existence or absence of specific categories of objects,
visualization-based techniques have been widely adopted to provide object
location clues. Considering class activation maps (CAMs) can only locate the
most discriminative part of objects, recent approaches usually adopt an
expansion strategy to enlarge the activation area for more integral object
localization. However, without proper constraints, the expanded activation will
easily intrude into the background region. In this paper, we propose spatial
structure constraints (SSC) for weakly supervised semantic segmentation to
alleviate the unwanted object over-activation of attention expansion.
Specifically, we propose a CAM-driven reconstruction module to directly
reconstruct the input image from deep CAM features, which constrains the
diffusion of last-layer object attention by preserving the coarse spatial
structure of the image content. Moreover, we propose an activation
self-modulation module to refine CAMs with finer spatial structure details by
enhancing regional consistency. Without external saliency models to provide
background clues, our approach achieves 72.7\% and 47.0\% mIoU on the PASCAL
VOC 2012 and COCO datasets, respectively, demonstrating the superiority of our
proposed approach.
- Abstract(参考訳): イメージレベルのラベルは、容易に利用できるため、弱い教師付きセマンティックセマンティックセマンティクスタスクで普及している。
画像レベルのラベルは対象の特定のカテゴリの有無のみを示すことができるため、オブジェクトの位置の手がかりを提供するために可視化ベースの技術が広く採用されている。
クラスアクティベーションマップ(cams)は、オブジェクトの最も識別的な部分のみを見つけることができるため、近年のアプローチでは、より統合的なオブジェクトローカライゼーションのためにアクティベーション領域を拡大するために拡張戦略を採用している。
しかし、適切な制約がなければ、拡張されたアクティベーションはバックグラウンド領域に容易に侵入する。
本稿では,不必要な物体の注意拡大の過剰な活性化を軽減するために,弱教師付きセマンティックセマンティックセグメンテーションのための空間構造制約(SSC)を提案する。
具体的には,画像内容の粗い空間構造を保ち,最終層物体の注意の拡散を制約する深層カム特徴から入力画像を直接再構成するcam駆動再構成モジュールを提案する。
さらに,地域整合性を高めることにより,CAMをより微細な空間構造で洗練する活性化自己変調モジュールを提案する。
背景手がかりを提供する外部サリエンシモデルがなければ,PASCAL VOC 2012とCOCOデータセットの72.7\%と47.0\% mIoUをそれぞれ達成し,提案手法の優位性を実証する。
関連論文リスト
- Knowledge Transfer with Simulated Inter-Image Erasing for Weakly Supervised Semantic Segmentation [28.233690786378393]
弱教師付きセマンティックセグメンテーションのためのtextbfKnowledge textbfTransfer with textbfSimulated Inter-Image textbfErasing (KTSE) アプローチを提案する。
論文 参考訳(メタデータ) (2024-07-03T02:54:33Z) - Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Progressively Dual Prior Guided Few-shot Semantic Segmentation [57.37506990980975]
Few-shotのセマンティックセマンティックセマンティクスタスクは、いくつかのアノテーション付きサポートサンプルを使用して、クエリイメージのセマンティクスを実行することを目的としている。
本稿では,先進的に2重にガイドされた数発のセマンティックセマンティックセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-20T16:19:47Z) - Saliency Guided Inter- and Intra-Class Relation Constraints for Weakly
Supervised Semantic Segmentation [66.87777732230884]
本稿では,活性化対象領域の拡大を支援するために,Salliency Guided Inter-およびIntra-Class Relation Constrained (I$2$CRC) フレームワークを提案する。
また,オブジェクトガイド付きラベルリファインメントモジュールを導入し,セグメンテーション予測と初期ラベルをフル活用し,優れた擬似ラベルを得る。
論文 参考訳(メタデータ) (2022-06-20T03:40:56Z) - Anti-Adversarially Manipulated Attributions for Weakly Supervised
Semantic Segmentation and Object Localization [31.69344455448125]
本稿では,最終ソフトマックス層やシグモイド層の前に分類器が生成する分類スコアを増やすために操作した画像の属性マップを提案する。
この操作は対逆的な方法で実現され、元の画像は対逆攻撃で使用されるものと反対方向に画素勾配に沿って摂動される。
さらに,対象物に関係のない領域の不正な帰属と,対象物の小さな領域への過剰な帰属の集中を抑制する新たな正規化手法を導入する。
論文 参考訳(メタデータ) (2022-04-11T06:18:02Z) - Cross Language Image Matching for Weakly Supervised Semantic
Segmentation [26.04918485403939]
本稿では,CLIP(Contrastive Language- Image Pre-training)モデルに基づく,CLIMS(Cross Language Image Matching)フレームワークを提案する。
我々のフレームワークの中核となる考え方は、より完全なオブジェクト領域を活性化し、密接に関連するオープンバックグラウンド領域を抑えるために自然言語の監督を導入することである。
さらに、モデルが密接に関連する背景領域を活性化しないように、共起した背景抑圧損失を設計する。
論文 参考訳(メタデータ) (2022-03-05T06:39:48Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Self-supervised Segmentation via Background Inpainting [96.10971980098196]
移動可能なカメラで撮影された単一の画像で、自己教師付き検出とセグメンテーションのアプローチを導入する。
我々は、提案に基づくセグメンテーションネットワークのトレーニングに利用する自己教師付き損失関数を利用する。
本手法は,標準ベンチマークから視覚的に切り離された画像の人間の検出とセグメント化に応用し,既存の自己監督手法より優れていることを示す。
論文 参考訳(メタデータ) (2020-11-11T08:34:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。