論文の概要: Cluster-CAM: Cluster-Weighted Visual Interpretation of CNNs' Decision in
Image Classification
- arxiv url: http://arxiv.org/abs/2302.01642v1
- Date: Fri, 3 Feb 2023 10:38:20 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-06 16:46:13.821646
- Title: Cluster-CAM: Cluster-Weighted Visual Interpretation of CNNs' Decision in
Image Classification
- Title(参考訳): Cluster-CAM:画像分類におけるCNNの判断のクラスタ重み付き視覚解釈
- Authors: Zhenpeng Feng, Hongbing Ji, Milos Dakovic, Xiyang Cui, Mingzhe Zhu,
Ljubisa Stankovic
- Abstract要約: Cluster-CAMは、効率的な勾配のないCNN解釈アルゴリズムである。
本稿では,クラスタ化された特徴写像から認識ベースマップと認識-シザーを鍛えるための巧妙な戦略を提案する。
- 参考スコア(独自算出の注目度): 12.971559051829658
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the tremendous success of convolutional neural networks (CNNs) in
computer vision, the mechanism of CNNs still lacks clear interpretation.
Currently, class activation mapping (CAM), a famous visualization technique to
interpret CNN's decision, has drawn increasing attention. Gradient-based CAMs
are efficient while the performance is heavily affected by gradient vanishing
and exploding. In contrast, gradient-free CAMs can avoid computing gradients to
produce more understandable results. However, existing gradient-free CAMs are
quite time-consuming because hundreds of forward interference per image are
required. In this paper, we proposed Cluster-CAM, an effective and efficient
gradient-free CNN interpretation algorithm. Cluster-CAM can significantly
reduce the times of forward propagation by splitting the feature maps into
clusters in an unsupervised manner. Furthermore, we propose an artful strategy
to forge a cognition-base map and cognition-scissors from clustered feature
maps. The final salience heatmap will be computed by merging the above
cognition maps. Qualitative results conspicuously show that Cluster-CAM can
produce heatmaps where the highlighted regions match the human's cognition more
precisely than existing CAMs. The quantitative evaluation further demonstrates
the superiority of Cluster-CAM in both effectiveness and efficiency.
- Abstract(参考訳): コンピュータビジョンにおける畳み込みニューラルネットワーク(CNN)の驚異的な成功にもかかわらず、CNNのメカニズムには明確な解釈がない。
現在、CNNの決定を解釈する有名な可視化技術であるクラスアクティベーションマッピング(CAM)が注目されている。
勾配に基づくCAMは効率が良く、性能は勾配の消滅と爆発の影響が大きい。
対照的に、勾配のないCAMは計算勾配を避けてより理解しやすい結果が得られる。
しかし、画像ごとに数百の前方干渉が必要なため、既存の勾配のないCAMは非常に時間がかかる。
本稿では,効率的な勾配のないCNN解釈アルゴリズムであるCluster-CAMを提案する。
クラスタCAMは、フィーチャーマップを教師なしの方法でクラスタに分割することで、前方伝播の時間を著しく短縮することができる。
さらに,クラスタ化特徴マップから認知ベースマップと認知シグナをフォージする巧妙な戦略を提案する。
最後のサラエンスヒートマップは、上記の認知マップをマージすることで計算される。
定性的な結果は、Cluster-CAMが既存のCAMよりも正確に人間の認識にマッチするヒートマップを作成できることを示している。
定量的評価により,クラスタCAMの有効性と効率性がさらに向上した。
関連論文リスト
- CAPE: CAM as a Probabilistic Ensemble for Enhanced DNN Interpretation [35.021331140484804]
クラスアクティベーションマップ(CAM)と最近の変種は、ディープニューラルネットワーク(DNN)決定過程を視覚的に説明する方法を提供する。
本稿では,画像領域のコントリビューションを統一的かつ確率的に有意義に評価できるCAPEを提案する。
論文 参考訳(メタデータ) (2024-04-03T01:13:05Z) - BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications [69.22739434619531]
そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-09-07T06:45:43Z) - Attention-based Class Activation Diffusion for Weakly-Supervised
Semantic Segmentation [98.306533433627]
クラスアクティベーションマップの抽出(CAM)は、弱教師付きセマンティックセグメンテーション(WSSS)の重要なステップである
本稿では,CAMとアテンション行列を確率的拡散法で結合する新しい手法を提案し,それをAD-CAMとダブする。
擬似ラベルとしてのAD-CAMは、最先端のCAMよりも強力なWSSSモデルが得られることを示す実験である。
論文 参考訳(メタデータ) (2022-11-20T10:06:32Z) - Recipro-CAM: Gradient-free reciprocal class activation map [0.0]
本稿では,アクティベーションマップとネットワーク出力の相関性を利用するために,軽量なアーキテクチャと勾配のないReciprocal CAM(Recipro-CAM)を提案する。
提案手法により,Score-CAMと比較してResNetファミリーの1:78~3:72%のゲインを得た。
さらに、Recipro-CAMはGrad-CAMと似たサリエンシマップ生成率を示し、Score-CAMの約148倍高速である。
論文 参考訳(メタデータ) (2022-09-28T13:15:03Z) - VS-CAM: Vertex Semantic Class Activation Mapping to Interpret Vision
Graph Neural Network [10.365366151667017]
グラフ畳み込みニューラルネットワーク(GCN)は注目度を高め、様々なコンピュータビジョンタスクで優れたパフォーマンスを達成した。
標準畳み込みニューラルネットワーク(CNN)では、クラスアクティベーションマッピング(CAM)法が、ヒートマップを生成することで、CNNの決定と画像領域の間の接続を可視化するために一般的に使用される。
本稿では,特にGCN, Vertex Semantic Class Activation Mapping (VS-CAM)に適用可能な新しい可視化手法を提案する。
論文 参考訳(メタデータ) (2022-09-15T09:45:59Z) - Shap-CAM: Visual Explanations for Convolutional Neural Networks based on
Shapley Value [86.69600830581912]
クラスアクティベーションマッピングに基づくShap-CAMと呼ばれる新しい視覚的説明法を開発した。
我々は,Shap-CAMが意思決定プロセスの解釈において,より良い視覚的性能と公平性を実現することを実証した。
論文 参考訳(メタデータ) (2022-08-07T00:59:23Z) - FD-CAM: Improving Faithfulness and Discriminability of Visual
Explanation for CNNs [7.956110316017118]
畳み込みニューラルネットワークの内部動作機構を視覚的に説明するために,クラスアクティベーションマップ(CAM)が広く研究されている。
本稿では,CNNの視覚的説明の忠実度と差別性を両立させるため,FD-CAMと呼ばれる新しいCAM重み付け手法を提案する。
論文 参考訳(メタデータ) (2022-06-17T14:08:39Z) - Weakly-supervised fire segmentation by visualizing intermediate CNN
layers [82.75113406937194]
画像やビデオにおける火の局所化は、火災事故に対処するための自律システムにとって重要なステップである。
我々は,ネットワークのトレーニングに画像ラベルのみを使用する,画像中の火の弱い制御セグメント化について検討する。
CNNの中間層における特徴量の平均値は,2値セグメンテーション問題である火災セグメンテーションの場合,従来のクラスアクティベーションマッピング(CAM)法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-16T11:56:28Z) - Towards Learning Spatially Discriminative Feature Representations [26.554140976236052]
組込み特徴写像をクラスアクティベーションマップ(CAM)に制約する新しい損失関数(CAM-loss)を提案する。
CAM-lossはバックボーンを駆動し、ターゲットカテゴリの特徴を表現し、ターゲット以外のカテゴリやバックグラウンドの特徴を抑圧する。
実験の結果, CAM-lossは様々なネットワーク構造に適用可能であり, 画像分類の性能向上のために, 主流の正規化手法と組み合わせることができることがわかった。
論文 参考訳(メタデータ) (2021-09-03T08:04:17Z) - TS-CAM: Token Semantic Coupled Attention Map for Weakly Supervised
Object Localization [112.46381729542658]
弱監督オブジェクトローカリゼーション(WSOL)は、画像カテゴリラベルを与えられたときに難しい問題です。
長距離依存抽出のための視覚変換器における自己注意機構をフル活用するために,トークン意味結合注意マップ(TS-CAM)を導入する。
論文 参考訳(メタデータ) (2021-03-27T09:43:16Z) - What Deep CNNs Benefit from Global Covariance Pooling: An Optimization
Perspective [102.37204254403038]
我々は最適化の観点から、GCPの深いCNNのメリットを理解する試みを行っている。
GCPは最適化のランドスケープをよりスムーズにし、勾配をより予測できることを示す。
多様なタスクに対して様々な深部CNNモデルを用いて広範な実験を行い,その結果を強く支持する。
論文 参考訳(メタデータ) (2020-03-25T07:00:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。