論文の概要: Extracting Class Activation Maps from Non-Discriminative Features as
well
- arxiv url: http://arxiv.org/abs/2303.10334v1
- Date: Sat, 18 Mar 2023 04:47:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 20:05:27.527185
- Title: Extracting Class Activation Maps from Non-Discriminative Features as
well
- Title(参考訳): 非識別的特徴からクラス活性化マップを抽出する
- Authors: Zhaozheng Chen and Qianru Sun
- Abstract要約: 分類モデルからのクラスアクティベーションマップ(CAM)は、しばしば前景オブジェクトのカバレッジが低くなる。
本稿では,識別不能な特徴を明示的にキャプチャするCAMの新しい計算手法を提案する。
結果のKクラスタセンターは、ローカルプロトタイプと呼ばれ、"head"、"leg"、"body"の"sheep"といったローカルセマンティクスを表しています。
- 参考スコア(独自算出の注目度): 23.968856513180032
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting class activation maps (CAM) from a classification model often
results in poor coverage on foreground objects, i.e., only the discriminative
region (e.g., the "head" of "sheep") is recognized and the rest (e.g., the
"leg" of "sheep") mistakenly as background. The crux behind is that the weight
of the classifier (used to compute CAM) captures only the discriminative
features of objects. We tackle this by introducing a new computation method for
CAM that explicitly captures non-discriminative features as well, thereby
expanding CAM to cover whole objects. Specifically, we omit the last pooling
layer of the classification model, and perform clustering on all local features
of an object class, where "local" means "at a spatial pixel position". We call
the resultant K cluster centers local prototypes - represent local semantics
like the "head", "leg", and "body" of "sheep". Given a new image of the class,
we compare its unpooled features to every prototype, derive K similarity
matrices, and then aggregate them into a heatmap (i.e., our CAM). Our CAM thus
captures all local features of the class without discrimination. We evaluate it
in the challenging tasks of weakly-supervised semantic segmentation (WSSS), and
plug it in multiple state-of-the-art WSSS methods, such as MCTformer and AMN,
by simply replacing their original CAM with ours. Our extensive experiments on
standard WSSS benchmarks (PASCAL VOC and MS COCO) show the superiority of our
method: consistent improvements with little computational overhead.
- Abstract(参考訳): 分類モデルからクラスアクティベーションマップ(CAM)を抽出すると、前景のオブジェクト、すなわち差別的領域(例えば、"sheep"の"head")のみが認識され、残りの領域(例えば、"leg"の"sheep")が誤って背景として認識される。
CAMの計算に使用される分類器の重みは、オブジェクトの識別的特徴のみをキャプチャする。
我々はCAMの新しい計算手法を導入し、非識別的特徴を明示的にキャプチャし、CAMをオブジェクト全体をカバーするように拡張する。
具体的には、分類モデルの最後のプーリング層を省略し、「局所」は「空間画素位置」を意味するオブジェクトクラスの全ての局所的特徴をクラスタリングする。
結果のKクラスタは、ローカルプロトタイプと呼ばれ、"head"、"leg"、"body"の"sheep"といったローカルセマンティクスを表しています。
クラスの新しいイメージが与えられたとき、その非プールな特徴を全てのプロトタイプと比較し、K類似度行列を導出し、それらをヒートマップ(つまり我々のCAM)に集約する。
したがって、CAMはクラスの全ローカル特徴を識別せずにキャプチャする。
弱教師付きセマンティックセマンティックセグメンテーション(WSSS)の課題として評価し,MCTformer や AMN のような複数の最先端 WSSS メソッドにプラグインすることで,元の CAM を我々のものに置き換える。
標準WSSSベンチマーク(PASCAL VOCとMS COCO)の広範な実験により,計算オーバーヘッドの少ない一貫した改善が得られた。
関連論文リスト
- High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Exploit CAM by itself: Complementary Learning System for Weakly
Supervised Semantic Segmentation [59.24824050194334]
本稿では,CLS(Complementary Learning System)というエージェント学習における興味深い作業機構について述べる。
このシンプルだが効果的な学習パターンを動機として,汎用学習機構(GSLM)を提案する。
汎用学習モジュール(GLM)と特定学習モジュール(SLM)を開発するGSLM
論文 参考訳(メタデータ) (2023-03-04T16:16:47Z) - Attention-based Class Activation Diffusion for Weakly-Supervised
Semantic Segmentation [98.306533433627]
クラスアクティベーションマップの抽出(CAM)は、弱教師付きセマンティックセグメンテーション(WSSS)の重要なステップである
本稿では,CAMとアテンション行列を確率的拡散法で結合する新しい手法を提案し,それをAD-CAMとダブする。
擬似ラベルとしてのAD-CAMは、最先端のCAMよりも強力なWSSSモデルが得られることを示す実験である。
論文 参考訳(メタデータ) (2022-11-20T10:06:32Z) - Saliency Guided Inter- and Intra-Class Relation Constraints for Weakly
Supervised Semantic Segmentation [66.87777732230884]
本稿では,活性化対象領域の拡大を支援するために,Salliency Guided Inter-およびIntra-Class Relation Constrained (I$2$CRC) フレームワークを提案する。
また,オブジェクトガイド付きラベルリファインメントモジュールを導入し,セグメンテーション予測と初期ラベルをフル活用し,優れた擬似ラベルを得る。
論文 参考訳(メタデータ) (2022-06-20T03:40:56Z) - Bridging the Gap between Classification and Localization for Weakly
Supervised Object Localization [39.63778214094173]
弱教師付きオブジェクトローカライゼーションは、画像レベルラベルのような弱い監督しか持たない対象領域を所定の画像内に見つけることを目的としている。
入力特徴とクラス固有の重みの方向のずれから,分類と局所化のギャップを見いだす。
本稿では,特徴方向をクラス固有の重みに整合させてギャップを埋める手法を提案する。
論文 参考訳(メタデータ) (2022-04-01T05:49:22Z) - Contrastive learning of Class-agnostic Activation Map for Weakly
Supervised Object Localization and Semantic Segmentation [32.76127086403596]
ラベルなし画像データを用いたクラス非依存型活性化マップ(C$2$AM)生成のためのコントラスト学習を提案する。
我々は上記の関係に基づいて正対と負の対を形成し、ネットワークを前景と背景を乱すように強制する。
ネットワークは画像前景を識別するために誘導されるため,本手法で学習したクラス非依存のアクティベーションマップは,より完全なオブジェクト領域を生成する。
論文 参考訳(メタデータ) (2022-03-25T08:46:24Z) - Importance Sampling CAMs for Weakly-Supervised Segmentation [16.86352815414646]
クラスアクティベーションマップ(CAM)は、クラスアクティベーションマップ(CAM)を用いて、画像内のオブジェクトのローカライズとセグメント化に使用できる。
本研究では,CAM学習の改善に2つの貢献によって両問題にアプローチする。
PASCAL VOC 2012ベンチマークデータセットを用いて,これらの修正によって輪郭精度が著しく向上することを示す。
論文 参考訳(メタデータ) (2022-03-23T14:54:29Z) - Self-supervised Image-specific Prototype Exploration for Weakly
Supervised Semantic Segmentation [72.33139350241044]
画像レベルのラベルをベースとしたWSSS(Weakly Supervised Semantic COCO)は,アノテーションコストの低さから注目されている。
本稿では,画像特異的なプロトタイプ探索 (IPE) と汎用一貫性 (GSC) の喪失からなる画像固有プロトタイプ探索 (SIPE) を提案する。
SIPEは,画像レベルラベルのみを用いて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-06T09:01:03Z) - Class Re-Activation Maps for Weakly-Supervised Semantic Segmentation [88.55040177178442]
クラスアクティベーションマップ(CAM)は、セマンティックセグメンテーションのための疑似マスクを生成する最も標準的なステップである。
しかし、不満足な擬似マスクのくちばしは、CAMで広く使われているバイナリクロスエントロピー損失(BCE)である。
ソフトマックスクロスエントロピー損失(SCE)を用いて収束CAMをBCEで再活性化する。
PASCAL VOC と MSCOCO の評価は、ReCAM が高品質なマスクを生成するだけでなく、オーバーヘッドの少ない任意の CAM 版でプラグイン・アンド・プレイをサポートすることを示している。
論文 参考訳(メタデータ) (2022-03-02T09:14:58Z) - Towards Learning Spatially Discriminative Feature Representations [26.554140976236052]
組込み特徴写像をクラスアクティベーションマップ(CAM)に制約する新しい損失関数(CAM-loss)を提案する。
CAM-lossはバックボーンを駆動し、ターゲットカテゴリの特徴を表現し、ターゲット以外のカテゴリやバックグラウンドの特徴を抑圧する。
実験の結果, CAM-lossは様々なネットワーク構造に適用可能であり, 画像分類の性能向上のために, 主流の正規化手法と組み合わせることができることがわかった。
論文 参考訳(メタデータ) (2021-09-03T08:04:17Z) - Conditional Variational Capsule Network for Open Set Recognition [64.18600886936557]
オープンセット認識では、分類器はトレーニング時に未知の未知のクラスを検出する必要がある。
最近提案されたカプセルネットワークは、特に画像認識において、多くの分野で代替案を上回ることが示されている。
本提案では,訓練中,同じ既知のクラスのカプセルの特徴を,事前に定義されたガウス型に適合させることを推奨する。
論文 参考訳(メタデータ) (2021-04-19T09:39:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。