論文の概要: Opti-CAM: Optimizing saliency maps for interpretability
- arxiv url: http://arxiv.org/abs/2301.07002v3
- Date: Fri, 5 Apr 2024 16:50:13 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-08 20:59:44.962688
- Title: Opti-CAM: Optimizing saliency maps for interpretability
- Title(参考訳): Opti-CAM: 解釈可能性のためのサリエンシマップの最適化
- Authors: Hanwei Zhang, Felipe Torres, Ronan Sicre, Yannis Avrithis, Stephane Ayache,
- Abstract要約: CAMに基づくアイデアとマスキングに基づくアプローチを組み合わせたOpti-CAMを紹介する。
われわれのサリエンシマップは特徴マップを線形に組み合わせたもので、画像ごとに重みが最適化されている。
いくつかのデータセットでは、Opti-CAMは最も関連する分類基準に従って、他のCAMベースのアプローチよりもはるかに優れています。
- 参考スコア(独自算出の注目度): 10.122899813335694
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Methods based on class activation maps (CAM) provide a simple mechanism to interpret predictions of convolutional neural networks by using linear combinations of feature maps as saliency maps. By contrast, masking-based methods optimize a saliency map directly in the image space or learn it by training another network on additional data. In this work we introduce Opti-CAM, combining ideas from CAM-based and masking-based approaches. Our saliency map is a linear combination of feature maps, where weights are optimized per image such that the logit of the masked image for a given class is maximized. We also fix a fundamental flaw in two of the most common evaluation metrics of attribution methods. On several datasets, Opti-CAM largely outperforms other CAM-based approaches according to the most relevant classification metrics. We provide empirical evidence supporting that localization and classifier interpretability are not necessarily aligned.
- Abstract(参考訳): クラスアクティベーションマップ(CAM)に基づく手法は、特徴写像の線形結合をサリエンシマップとして利用することにより、畳み込みニューラルネットワークの予測を簡易に解釈するメカニズムを提供する。
対照的に、マスクベースの手法は、画像空間内で直接唾液マップを最適化するか、別のネットワークをトレーニングして学習する。
本稿では、CAMベースのアイデアとマスキングベースのアプローチを組み合わせたOpti-CAMを紹介する。
我々のサリエンシマップは特徴写像の線形結合であり、画像毎の重み付けを最適化し、与えられたクラスに対するマスキング画像のロジットを最大化する。
また、属性メソッドの最も一般的な評価指標の2つに、根本的な欠陥を修正します。
いくつかのデータセットでは、Opti-CAMは最も関連性の高い分類基準に従って、他のCAMベースのアプローチよりも優れている。
局所化と分類器解釈性が必ずしも一致していないことを示す実証的証拠を提供する。
関連論文リスト
- DecomCAM: Advancing Beyond Saliency Maps through Decomposition and Integration [25.299607743268993]
クラスアクティベーションマップ(CAM)手法は、モデルの意思決定基準を明らかにする領域を強調するが、明確なサリエンシマップと詳細な解釈性は欠如している。
チャネル活性化マップから共有パターンを抽出する新しい分解分解分解法であるDecomCAMを提案する。
実験の結果,DecomCAMは精度を向上するだけでなく,解釈可能性と計算効率のバランスを最適化できることがわかった。
論文 参考訳(メタデータ) (2024-05-29T08:40:11Z) - BroadCAM: Outcome-agnostic Class Activation Mapping for Small-scale
Weakly Supervised Applications [69.22739434619531]
そこで我々はBroadCAMと呼ばれる結果に依存しないCAMアプローチを提案する。
VOC2012でBroadCAM、WSSSでBCSS-WSSS、WSOLでOpenImages30kを評価することで、BroadCAMは優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-09-07T06:45:43Z) - Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。
本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。
本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文 参考訳(メタデータ) (2023-09-01T11:15:50Z) - Feature Activation Map: Visual Explanation of Deep Learning Models for
Image Classification [17.373054348176932]
本研究では,機能活性化マップ (FAM) と呼ばれるポストホック解釈ツールを提案する。
FAMは、FC層を分類器として使用せずにディープラーニングモデルを解釈できる。
提案したFAMアルゴリズムの有効性を実証するために,10種類の深層学習モデルを用いて,少数ショット画像分類,コントラスト学習画像分類,画像検索タスクを行った。
論文 参考訳(メタデータ) (2023-07-11T05:33:46Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - VS-CAM: Vertex Semantic Class Activation Mapping to Interpret Vision
Graph Neural Network [10.365366151667017]
グラフ畳み込みニューラルネットワーク(GCN)は注目度を高め、様々なコンピュータビジョンタスクで優れたパフォーマンスを達成した。
標準畳み込みニューラルネットワーク(CNN)では、クラスアクティベーションマッピング(CAM)法が、ヒートマップを生成することで、CNNの決定と画像領域の間の接続を可視化するために一般的に使用される。
本稿では,特にGCN, Vertex Semantic Class Activation Mapping (VS-CAM)に適用可能な新しい可視化手法を提案する。
論文 参考訳(メタデータ) (2022-09-15T09:45:59Z) - Shap-CAM: Visual Explanations for Convolutional Neural Networks based on
Shapley Value [86.69600830581912]
クラスアクティベーションマッピングに基づくShap-CAMと呼ばれる新しい視覚的説明法を開発した。
我々は,Shap-CAMが意思決定プロセスの解釈において,より良い視覚的性能と公平性を実現することを実証した。
論文 参考訳(メタデータ) (2022-08-07T00:59:23Z) - Revisiting The Evaluation of Class Activation Mapping for
Explainability: A Novel Metric and Experimental Analysis [54.94682858474711]
クラスアクティベーションマッピング(cam)アプローチは、アクティベーションマップの平均を重み付けすることで、効果的な可視化を提供する。
説明マップを定量化するための新しいメトリクスセットを提案し、より効果的な方法を示し、アプローチ間の比較を簡素化します。
論文 参考訳(メタデータ) (2021-04-20T21:34:24Z) - LIFT-CAM: Towards Better Explanations for Class Activation Mapping [0.0]
クラスアクティベーションマッピング(CAM)に基づく手法は,CNNからのアクティベーションマップの線形結合による視覚的説明マップを生成する。
LIFT-CAMと呼ばれる効率的な近似法を提案する。
定性的かつ定量的な面において、他のCAMベースの方法よりも優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2021-02-10T02:43:50Z) - Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty
Regularization [73.03956876752868]
我々は、ネットワークがオブジェクトの他の部分に注意を払うことを可能にする、原則的でエンドツーエンドのトレーニング可能なフレームワークを提案する。
具体的には、ミックスアップデータ拡張方式を分類ネットワークに導入し、2つの不確実な正規化項を設計し、ミックスアップ戦略をよりよく扱う。
論文 参考訳(メタデータ) (2020-08-03T21:19:08Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。