論文の概要: BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications
- arxiv url: http://arxiv.org/abs/2309.03509v1
- Date: Thu, 7 Sep 2023 06:45:43 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-08 14:10:45.193120
- Title: BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications
- Title(参考訳): BroadCAM:小規模弱監視アプリケーションのための出力非依存クラス活性化マッピング
- Authors: Jiatai Lin, Guoqiang Han, Xuemiao Xu, Changhong Liang, Tien-Tsin Wong,
C. L. Philip Chen, Zaiyi Liu, Chu Han
- Abstract要約: そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
- 参考スコア(独自算出の注目度): 69.22739434619531
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Class activation mapping~(CAM), a visualization technique for interpreting
deep learning models, is now commonly used for weakly supervised semantic
segmentation~(WSSS) and object localization~(WSOL). It is the weighted
aggregation of the feature maps by activating the high class-relevance ones.
Current CAM methods achieve it relying on the training outcomes, such as
predicted scores~(forward information), gradients~(backward information), etc.
However, when with small-scale data, unstable training may lead to less
effective model outcomes and generate unreliable weights, finally resulting in
incorrect activation and noisy CAM seeds. In this paper, we propose an
outcome-agnostic CAM approach, called BroadCAM, for small-scale weakly
supervised applications. Since broad learning system (BLS) is independent to
the model learning, BroadCAM can avoid the weights being affected by the
unreliable model outcomes when with small-scale data. By evaluating BroadCAM on
VOC2012 (natural images) and BCSS-WSSS (medical images) for WSSS and
OpenImages30k for WSOL, BroadCAM demonstrates superior performance than
existing CAM methods with small-scale data (less than 5\%) in different CNN
architectures. It also achieves SOTA performance with large-scale training
data. Extensive qualitative comparisons are conducted to demonstrate how
BroadCAM activates the high class-relevance feature maps and generates reliable
CAMs when with small-scale training data.
- Abstract(参考訳): 深層学習モデルの可視化技術であるクラスアクティベーションマッピング~(CAM)は、弱教師付きセマンティックセグメンテーション〜(WSSS)とオブジェクトローカライゼーション〜(WSOL)に一般的に用いられている。
これは高階関係写像を活性化することにより特徴写像の重み付け集合である。
現在のCAM手法は、予測スコア~(前方情報)、勾配〜(後方情報)などのトレーニング結果に依存する。
しかし、小規模なデータの場合、不安定なトレーニングはより効果的でないモデル結果をもたらし、信頼性の低い重みを発生させ、最終的には誤った活性化とノイズの多いCAM種子をもたらす。
本稿では,小規模の弱教師付きアプリケーションに対して,結果非依存のcam手法であるbroadcamを提案する。
広範学習システム(BLS)はモデル学習とは独立しているため、BroadCAMは小規模データによる信頼性の低いモデル結果の影響を避けることができる。
VOC2012のBroadCAM(自然画像)とWSSSのBCSS-WSSS(医用画像)をWSOLのOpenImages30kで評価することにより、BroadCAMはCNNアーキテクチャの小さなデータ(5倍未満)を持つ既存のCAMメソッドよりも優れた性能を示す。
また、大規模トレーニングデータによるsoma性能も実現している。
大規模学習データを用いて,BroadCAMが高クラス関連特徴マップをどのように活性化し,信頼性の高いCAMを生成するかを示す。
関連論文リスト
- KPCA-CAM: Visual Explainability of Deep Computer Vision Models using Kernel PCA [1.5550533143704957]
本研究では,畳み込みニューラルネットワーク(CNN)の解釈可能性を高める技術であるKPCA-CAMを紹介する。
KPCA-CAMは、CNNアクティベーション内の非線形関係をより効率的に捉えるために、主成分分析(PCA)とカーネルトリックを利用する。
異なるCNNモデルにわたるILSVRCデータセットに関する実証的な評価は、KPCA-CAMがより正確なアクティベーションマップを生成することを示す。
論文 参考訳(メタデータ) (2024-09-30T22:36:37Z) - Generalizing GradCAM for Embedding Networks [0.0]
本稿では,組込みネットワークのためのGrad-CAMを一般化した EmbeddingCAM を提案する。
提案手法の有効性をCUB-200-2011データセットに示すとともに,そのデータセットに対する定量的,定性的な分析結果を示す。
論文 参考訳(メタデータ) (2024-02-01T04:58:06Z) - MoBYv2AL: Self-supervised Active Learning for Image Classification [57.4372176671293]
画像分類のための自己教師型アクティブラーニングフレームワークであるMoBYv2ALを提案する。
私たちの貢献は、最も成功した自己教師付き学習アルゴリズムであるMoBYをALパイプラインに持ち上げることです。
近年のAL法と比較すると,最先端の結果が得られている。
論文 参考訳(メタデータ) (2023-01-04T10:52:02Z) - Zero-Shot Temporal Action Detection via Vision-Language Prompting [134.26292288193298]
視覚言語プロンプト(STALE)を用いた新しいゼロショット時間行動検出モデルを提案する。
我々のモデルは最先端の代替品を著しく上回っている。
我々のモデルは、近年の強力な競合相手よりも監督的TADにおいて優れた結果をもたらす。
論文 参考訳(メタデータ) (2022-07-17T13:59:46Z) - Terrain Classification using Transfer Learning on Hyperspectral Images:
A Comparative study [0.13999481573773068]
畳み込みニューラルネットワーク(CNN)とMulti-Layer Perceptron(MLP)は画像分類の有効な方法であることが証明されている。
しかし、彼らは長いトレーニング時間と大量のラベル付きデータの要求の問題に悩まされている。
本稿では,移動学習法を用いてトレーニング時間を短縮し,大規模ラベル付きデータセットへの依存を減らすことを提案する。
論文 参考訳(メタデータ) (2022-06-19T14:36:33Z) - F-CAM: Full Resolution CAM via Guided Parametric Upscaling [20.609010268320013]
クラスアクティベーションマッピング(CAM)メソッドは、最近、弱い教師付きオブジェクトローカライゼーション(WSOL)タスクに多くの注目を集めている。
CAMメソッドは通常、ResNet50のような既製のCNNバックボーンに統合される。
完全分解能CAMを高精度に構築できるCAMのパラメトリックアップスケーリング法を提案する。
論文 参考訳(メタデータ) (2021-09-15T04:45:20Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Use HiResCAM instead of Grad-CAM for faithful explanations of
convolutional neural networks [89.56292219019163]
説明法は意味のある概念を学習し、素早い相関を悪用しないモデルの開発を容易にする。
一般的なニューラルネットワーク説明法であるGrad-CAMの、未認識の制限について説明する。
本稿では,モデルが各予測に使用する場所のみをハイライトするクラス固有の説明手法であるHiResCAMを提案する。
論文 参考訳(メタデータ) (2020-11-17T19:26:14Z) - Eigen-CAM: Class Activation Map using Principal Components [1.2691047660244335]
この論文は、解釈可能で堅牢で透明なモデルに対する需要の増加に対応するために、従来の考え方に基づいている。
提案したEigen-CAMは、畳み込み層から学習した特徴/表現の基本的なコンポーネントを計算し、視覚化する。
論文 参考訳(メタデータ) (2020-08-01T17:14:13Z) - Improving Few-shot Learning by Spatially-aware Matching and
CrossTransformer [116.46533207849619]
数ショット学習シナリオにおけるスケールと位置ミスマッチの影響について検討する。
本稿では,複数のスケールや場所のマッチングを効果的に行うための,空間認識型マッチング手法を提案する。
論文 参考訳(メタデータ) (2020-01-06T14:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。