論文の概要: Complementary Patch for Weakly Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2108.03852v1
- Date: Mon, 9 Aug 2021 07:50:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-10 15:20:05.431798
- Title: Complementary Patch for Weakly Supervised Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのための補足パッチ
- Authors: Fei Zhang, Chaochen Gu, Chenyue Zhang, Yuchao Dai
- Abstract要約: 情報量の増加として,クラス活性化マップ(CAM)における対象領域の拡大を定式化する。
本稿では,新しい補足パッチ(CP)表現を提案するとともに,CPペアという補足的隠れ部分を持つ一対の入力画像によるCAMの和の情報が,ベースラインCAMの情報よりも大きいか等しいことを証明した。
CAMの品質をさらに向上するために,文脈情報を強化するために,Pixel-Region correlation Module (PRCM)を提案する。
- 参考スコア(独自算出の注目度): 25.990386258122726
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Semantic Segmentation (WSSS) based on image-level labels
has been greatly advanced by exploiting the outputs of Class Activation Map
(CAM) to generate the pseudo labels for semantic segmentation. However, CAM
merely discovers seeds from a small number of regions, which may be
insufficient to serve as pseudo masks for semantic segmentation. In this paper,
we formulate the expansion of object regions in CAM as an increase in
information. From the perspective of information theory, we propose a novel
Complementary Patch (CP) Representation and prove that the information of the
sum of the CAMs by a pair of input images with complementary hidden (patched)
parts, namely CP Pair, is greater than or equal to the information of the
baseline CAM. Therefore, a CAM with more information related to object seeds
can be obtained by narrowing down the gap between the sum of CAMs generated by
the CP Pair and the original CAM. We propose a CP Network (CPN) implemented by
a triplet network and three regularization functions. To further improve the
quality of the CAMs, we propose a Pixel-Region Correlation Module (PRCM) to
augment the contextual information by using object-region relations between the
feature maps and the CAMs. Experimental results on the PASCAL VOC 2012 datasets
show that our proposed method achieves a new state-of-the-art in WSSS,
validating the effectiveness of our CP Representation and CPN.
- Abstract(参考訳): 画像レベルラベルに基づく弱い教師付きセマンティックセグメンテーション(wsss)は,クラスアクティベーションマップ(cam)の出力を利用して意味セグメンテーションのための擬似ラベルを生成することにより,大きく進歩している。
しかし、CAMは単に少数の領域から種を発見するだけで、セマンティックセグメンテーションの仮面として機能するには不十分である。
本稿では,情報量の増加としてCAMにおける対象領域の拡大を定式化する。
情報理論の観点からは,新たな補足的パッチ(CP)表現を提案し,補足的(パッチ付き)部分を持つ一対の入力画像によるCAMの和の情報,すなわちCPペアがベースラインCAMの情報よりも大きいか等しいことを証明した。
したがって、CPペアによって生成されたCAMの和と元のCAMとのギャップを狭めることにより、対象種子に関するより多くの情報を有するCAMを得ることができる。
本稿では,三重項ネットワークと3つの正規化関数によって実装されたCPネットワークを提案する。
CAMの品質をさらに向上するために,特徴マップとCAM間のオブジェクト領域関係を利用してコンテキスト情報を拡張するためのPixel-Region correlation Module (PRCM)を提案する。
PASCAL VOC 2012データセットの実験結果から,提案手法はWSSSにおける新しい最先端技術を実現し,CP表現とCPNの有効性を検証した。
関連論文リスト
- Beyond Discriminative Regions: Saliency Maps as Alternatives to CAMs for
Weakly Supervised Semantic Segmentation [7.518769185369959]
本稿では,Wakly Supervised Semantic (WS3) におけるサリエンシと CAM の総合比較について述べる。
我々は,ベンチマークデータセットに関する実証研究を通じて,CAMの限界に対処する上でのサリエンシの有効性を実証する。
論文 参考訳(メタデータ) (2023-08-21T21:30:48Z) - Exploit CAM by itself: Complementary Learning System for Weakly
Supervised Semantic Segmentation [59.24824050194334]
本稿では,CLS(Complementary Learning System)というエージェント学習における興味深い作業機構について述べる。
このシンプルだが効果的な学習パターンを動機として,汎用学習機構(GSLM)を提案する。
汎用学習モジュール(GLM)と特定学習モジュール(SLM)を開発するGSLM
論文 参考訳(メタデータ) (2023-03-04T16:16:47Z) - Attention-based Class Activation Diffusion for Weakly-Supervised
Semantic Segmentation [98.306533433627]
クラスアクティベーションマップの抽出(CAM)は、弱教師付きセマンティックセグメンテーション(WSSS)の重要なステップである
本稿では,CAMとアテンション行列を確率的拡散法で結合する新しい手法を提案し,それをAD-CAMとダブする。
擬似ラベルとしてのAD-CAMは、最先端のCAMよりも強力なWSSSモデルが得られることを示す実験である。
論文 参考訳(メタデータ) (2022-11-20T10:06:32Z) - Saliency Guided Inter- and Intra-Class Relation Constraints for Weakly
Supervised Semantic Segmentation [66.87777732230884]
本稿では,活性化対象領域の拡大を支援するために,Salliency Guided Inter-およびIntra-Class Relation Constrained (I$2$CRC) フレームワークを提案する。
また,オブジェクトガイド付きラベルリファインメントモジュールを導入し,セグメンテーション予測と初期ラベルをフル活用し,優れた擬似ラベルを得る。
論文 参考訳(メタデータ) (2022-06-20T03:40:56Z) - Importance Sampling CAMs for Weakly-Supervised Segmentation [16.86352815414646]
クラスアクティベーションマップ(CAM)は、クラスアクティベーションマップ(CAM)を用いて、画像内のオブジェクトのローカライズとセグメント化に使用できる。
本研究では,CAM学習の改善に2つの貢献によって両問題にアプローチする。
PASCAL VOC 2012ベンチマークデータセットを用いて,これらの修正によって輪郭精度が著しく向上することを示す。
論文 参考訳(メタデータ) (2022-03-23T14:54:29Z) - TransCAM: Transformer Attention-based CAM Refinement for Weakly
Supervised Semantic Segmentation [19.333543299407832]
弱教師付きセマンティックセグメンテーションのための Conformer ベースのソリューション TransCAM を提案する。
PASCAL VOC 2012の検証とテストセットにおいて,TransCAMは69.3%,69.6%の新たな最先端性能を実現している。
論文 参考訳(メタデータ) (2022-03-14T16:17:18Z) - Self-supervised Image-specific Prototype Exploration for Weakly
Supervised Semantic Segmentation [72.33139350241044]
画像レベルのラベルをベースとしたWSSS(Weakly Supervised Semantic COCO)は,アノテーションコストの低さから注目されている。
本稿では,画像特異的なプロトタイプ探索 (IPE) と汎用一貫性 (GSC) の喪失からなる画像固有プロトタイプ探索 (SIPE) を提案する。
SIPEは,画像レベルラベルのみを用いて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-06T09:01:03Z) - PCAM: Product of Cross-Attention Matrices for Rigid Registration of
Point Clouds [79.99653758293277]
PCAMは、キー要素がクロスアテンション行列のポイントワイズ積であるニューラルネットワークである。
そこで本研究では,PCAMがステップ(a)とステップ(b)をディープネットを介して共同で解決する手法によって,最先端の成果が得られることを示す。
論文 参考訳(メタデータ) (2021-10-04T09:23:27Z) - Boosting Few-shot Semantic Segmentation with Transformers [81.43459055197435]
TRansformer-based Few-shot Semantic segmentation Method (TRFS)
我々のモデルは,グローバル・エンハンスメント・モジュール(GEM)とローカル・エンハンスメント・モジュール(LEM)の2つのモジュールから構成される。
論文 参考訳(メタデータ) (2021-08-04T20:09:21Z) - Puzzle-CAM: Improved localization via matching partial and full features [0.5482532589225552]
弱教師付きセマンティックセマンティックセマンティクス(WSSS)を導入し、セマンティクス性能のギャップを画素レベルの監視から画像レベルの監視へと狭める。
ほとんどの高度なアプローチは、セグメンテーションネットワークをトレーニングするために擬似ラベルを生成するクラスアクティベーションマップ(CAM)に基づいている。
本稿では,個々のパッチと画像全体の違いを最小限に抑えるプロセスであるPuzzle-CAMを提案する。
実験では、Puzzle-CAMはPASCAL VOC 2012データセットの監視のために同じラベルを使用した従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-01-27T08:19:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。