論文の概要: Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2203.00962v1
- Date: Wed, 2 Mar 2022 09:14:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-04 01:48:07.308789
- Title: Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation
- Title(参考訳): 弱教師付きセマンティックセグメンテーションのためのクラス再活性化マップ
- Authors: Zhaozheng Chen, Tan Wang, Xiongwei Wu, Xian-Sheng Hua, Hanwang Zhang,
Qianru Sun
- Abstract要約: クラスアクティベーションマップ(CAM)は、セマンティックセグメンテーションのための疑似マスクを生成する最も標準的なステップである。
しかし、不満足な擬似マスクのくちばしは、CAMで広く使われているバイナリクロスエントロピー損失(BCE)である。
ソフトマックスクロスエントロピー損失(SCE)を用いて収束CAMをBCEで再活性化する。
PASCAL VOC と MSCOCO の評価は、ReCAM が高品質なマスクを生成するだけでなく、オーバーヘッドの少ない任意の CAM 版でプラグイン・アンド・プレイをサポートすることを示している。
- 参考スコア(独自算出の注目度): 88.55040177178442
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting class activation maps (CAM) is arguably the most standard step of
generating pseudo masks for weakly-supervised semantic segmentation (WSSS).
Yet, we find that the crux of the unsatisfactory pseudo masks is the binary
cross-entropy loss (BCE) widely used in CAM. Specifically, due to the
sum-over-class pooling nature of BCE, each pixel in CAM may be responsive to
multiple classes co-occurring in the same receptive field. As a result, given a
class, its hot CAM pixels may wrongly invade the area belonging to other
classes, or the non-hot ones may be actually a part of the class. To this end,
we introduce an embarrassingly simple yet surprisingly effective method:
Reactivating the converged CAM with BCE by using softmax cross-entropy loss
(SCE), dubbed \textbf{ReCAM}. Given an image, we use CAM to extract the feature
pixels of each single class, and use them with the class label to learn another
fully-connected layer (after the backbone) with SCE. Once converged, we extract
ReCAM in the same way as in CAM. Thanks to the contrastive nature of SCE, the
pixel response is disentangled into different classes and hence less mask
ambiguity is expected. The evaluation on both PASCAL VOC and MS~COCO shows that
ReCAM not only generates high-quality masks, but also supports plug-and-play in
any CAM variant with little overhead.
- Abstract(参考訳): クラスアクティベーションマップ(CAM)の抽出は、弱い教師付きセマンティックセグメンテーション(WSSS)のための疑似マスクを生成する最も標準的なステップである。
しかし、不満足な擬似マスクのくちばしは、CAMで広く使われているバイナリクロスエントロピー損失(BCE)であることがわかった。
具体的には、BCEの総和クラスプーリングの性質により、CAMの各ピクセルは、同じ受容場にある複数のクラスに応答する可能性がある。
その結果、クラスが与えられた場合、そのホットなCAMピクセルは他のクラスに属する領域に誤って侵入するか、非ホットなピクセルは実際にはクラスの一部である可能性がある。
そこで本研究では, ソフトマックスクロスエントロピー損失(SCE)を用いて, 収束CAMをBCEに再活性化する手法を提案する。
画像が与えられた場合、CAMを使って各クラスの特徴画素を抽出し、それらをクラスラベルと共に使用して、SCEで(バックボーンの後)別の完全に接続されたレイヤを学習します。
収束すると,CAMと同様の方法でReCAMを抽出する。
SCEの対照的な性質により、画素応答は異なるクラスに切り離されるため、マスクの曖昧さは期待できない。
PASCAL VOCとMS~COCOの評価は、ReCAMが高品質なマスクを生成するだけでなく、オーバーヘッドの少ないCAM版でもプラグアンドプレイをサポートすることを示している。
関連論文リスト
- BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications [69.22739434619531]
そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-09-07T06:45:43Z) - Class-Incremental Exemplar Compression for Class-Incremental Learning [90.93462714376078]
CIM(class-incremental masking)と呼ばれる適応マスク生成モデルを提案する。
我々は,Food-101, ImageNet-100, ImageNet-1000などの高分解能CILベンチマーク実験を行った。
CIMによる圧縮例を用いることで,10Phase ImageNet-1000のFOSTERよりも4.8ポイント高いCIL精度が得られることを示す。
論文 参考訳(メタデータ) (2023-03-24T14:51:20Z) - Extracting Class Activation Maps from Non-Discriminative Features as
well [23.968856513180032]
分類モデルからのクラスアクティベーションマップ(CAM)は、しばしば前景オブジェクトのカバレッジが低くなる。
本稿では,識別不能な特徴を明示的にキャプチャするCAMの新しい計算手法を提案する。
結果のKクラスタセンターは、ローカルプロトタイプと呼ばれ、"head"、"leg"、"body"の"sheep"といったローカルセマンティクスを表しています。
論文 参考訳(メタデータ) (2023-03-18T04:47:42Z) - Exploit CAM by itself: Complementary Learning System for Weakly
Supervised Semantic Segmentation [59.24824050194334]
本稿では,CLS(Complementary Learning System)というエージェント学習における興味深い作業機構について述べる。
このシンプルだが効果的な学習パターンを動機として,汎用学習機構(GSLM)を提案する。
汎用学習モジュール(GLM)と特定学習モジュール(SLM)を開発するGSLM
論文 参考訳(メタデータ) (2023-03-04T16:16:47Z) - Attention-based Class Activation Diffusion for Weakly-Supervised
Semantic Segmentation [98.306533433627]
クラスアクティベーションマップの抽出(CAM)は、弱教師付きセマンティックセグメンテーション(WSSS)の重要なステップである
本稿では,CAMとアテンション行列を確率的拡散法で結合する新しい手法を提案し,それをAD-CAMとダブする。
擬似ラベルとしてのAD-CAMは、最先端のCAMよりも強力なWSSSモデルが得られることを示す実験である。
論文 参考訳(メタデータ) (2022-11-20T10:06:32Z) - Self-supervised Image-specific Prototype Exploration for Weakly
Supervised Semantic Segmentation [72.33139350241044]
画像レベルのラベルをベースとしたWSSS(Weakly Supervised Semantic COCO)は,アノテーションコストの低さから注目されている。
本稿では,画像特異的なプロトタイプ探索 (IPE) と汎用一貫性 (GSC) の喪失からなる画像固有プロトタイプ探索 (SIPE) を提案する。
SIPEは,画像レベルラベルのみを用いて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-06T09:01:03Z) - F-CAM: Full Resolution CAM via Guided Parametric Upscaling [20.609010268320013]
クラスアクティベーションマッピング(CAM)メソッドは、最近、弱い教師付きオブジェクトローカライゼーション(WSOL)タスクに多くの注目を集めている。
CAMメソッドは通常、ResNet50のような既製のCNNバックボーンに統合される。
完全分解能CAMを高精度に構築できるCAMのパラメトリックアップスケーリング法を提案する。
論文 参考訳(メタデータ) (2021-09-15T04:45:20Z) - Towards Learning Spatially Discriminative Feature Representations [26.554140976236052]
組込み特徴写像をクラスアクティベーションマップ(CAM)に制約する新しい損失関数(CAM-loss)を提案する。
CAM-lossはバックボーンを駆動し、ターゲットカテゴリの特徴を表現し、ターゲット以外のカテゴリやバックグラウンドの特徴を抑圧する。
実験の結果, CAM-lossは様々なネットワーク構造に適用可能であり, 画像分類の性能向上のために, 主流の正規化手法と組み合わせることができることがわかった。
論文 参考訳(メタデータ) (2021-09-03T08:04:17Z) - Complementary Patch for Weakly Supervised Semantic Segmentation [25.990386258122726]
情報量の増加として,クラス活性化マップ(CAM)における対象領域の拡大を定式化する。
本稿では,新しい補足パッチ(CP)表現を提案するとともに,CPペアという補足的隠れ部分を持つ一対の入力画像によるCAMの和の情報が,ベースラインCAMの情報よりも大きいか等しいことを証明した。
CAMの品質をさらに向上するために,文脈情報を強化するために,Pixel-Region correlation Module (PRCM)を提案する。
論文 参考訳(メタデータ) (2021-08-09T07:50:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。